用R语言对城管事件数据分析_光环大数据培训机构

光环大数据--大数据培训&人工智能培训

http://www.360docs.net/doc/info-d07a503be418964bcf84b9d528ea81c759f52e5f.html

用R语言对城管事件数据分析_光环大数据培训机构参加“AI智客计划”,送2000元助学金+免费参加阿里云认证考试!

这次使用主成分分析主要目的并不是降维,而是分析城管数据中的事件类别之间是否存在关系,当然,城管事件类型有好几百,这里就只选取从去年九月到目前发生量前十的事件类别;如下图,排名前十的事件类别依次为,车辆乱停放,乱堆物料堆,非法张贴小广告,店铺出店经营,自备容器外放,违规标语宣传品,机动车乱停放,暴露垃圾,地面不洁,道路不洁。

确定好这十个类别后就是数据的提取了,这时候我们要注意一下数据结构,和数据样本量,为什么呢?因为在主成分分析的时候事件类别只能是属性,也就是说事件类别是一列;这时候看看一下城管数据里面存在的数据结构,数据记录数必须是属性的6~10倍,这时候观察城管数据结构,明显不是我们想要的。

于是写个SQL转换一下数据结构,起的别名没有按照规则来,这是个失误;

这时候就要使用R语言去做分析了,首先是让我们能从数据库里拿数据,所以创建一个数据库链接,安装包RODBC

R语言代码

install.packages("RODBC")library(RODBC)jixiao_connect<- odbcConnect("jixiao",uid="jixiao",pwd = "*****",believeNRows=FALSE)

光环大数据http://www.360docs.net/doc/info-d07a503be418964bcf84b9d528ea81c759f52e5f.html

相关推荐
相关主题
热门推荐