R语言与数据挖掘最佳实践和经典案例

R语言与数据挖掘最佳实践和经典案例

(澳) 赵彦昌, 著

出版社:机械工业出版社

年代:2014

定价:39.0

书籍简介:

本书为研究人员、高校学生、数据分析人员介绍了使用R语言进行数据挖掘应用的实用方法和技术。读者会从本书中发现使用R语言完成数据挖掘任务(如分类和预测、聚类、孤立点检测、关联规则、序列分析、文本挖掘、社会网络分析、情感分析等)的非常有价值的指导。数据挖掘技术在广泛领域都发展迅速。本书重点关注数据挖掘过程的建模阶段,以及数据探查和模型评估问题。本书讲述简洁实用,配有现实应用案例和代码示例以及数据,在线资源及时丰富,是一本数据分析的实战技术图书。

书籍目录:

R and Data Mining:Examples and Case Studies出版者的话译者序缩写词表第1章 简介11.1 数据挖掘11.2 R11.3 数据集21.3.1 iris数据集21.3.2 bodyfat数据集3第2章 数据的导入与导出42.1 R数据的保存与加载42.2 .CSV文件的导入与导出42.3 从SAS中导入数据52.4 通过ODBC导入与导出数据62.4.1 从数据库中读取数据72.4.2 从Excel文件中导入与导出数据7第3章 数据探索83.1 查看数据83.2 探索单个变量103.3 探索多个变量123.4 更多探索153.5 将图表保存到文件中19第4章 决策树与随机森林214.1 使用party包构建决策树214.2 使用rpart包构建决策树244.3 随机森林29第5章 回归分析335.1 线性回归335.2 逻辑回归385.3 广义线性回归385.4 非线性回归40第6章 聚类416.1 k-means聚类416.2 k-medoids聚类436.3 层次聚类456.4 基于密度的聚类46第7章 离群点检测507.1 单变量的离群点检测507.2 局部离群点因子检测537.3 用聚类方法进行离群点检测567.4 时间序列数据的离群点检测587.5 讨论59第8章 时间序列分析与挖掘608.1 R中的时间序列数据608.2 时间序列分解608.3 时间序列预测628.4 时间序列聚类638.4.1 动态时间规整638.4.2 合成控制图的时间序列数据648.4.3 基于欧氏距离的层次聚类658.4.4 基于DTW距离的层次聚类668.5 时间序列分类678.5.1 基于原始数据的分类678.5.2 基于特征提取的分类688.5.3 k-NN分类698.6 讨论708.7 延伸阅读70第9章 关联规则719.1 关联规则的基本概念719.2 Titanic数据集719.3 关联规则挖掘739.4 消除冗余789.5 解释规则799.6 关联规则的可视化809.7 讨论与延伸阅读82第10章 文本挖掘8410.1 Twitter的文本检索8410.2 转换文本8510.3 提取词干8610.4 建立词项-文档矩阵8810.5 频繁词项与关联9010.6 词云9110.7 词项聚类9210.8 推文聚类9410.8.1 基于k-means算法的推文聚类9410.8.2 基于k-medoids算法的推文聚类9610.9 程序包、延伸阅读与讨论98第11章 社交网络分析9911.1词项网络9911.2推文网络10211.3双模式网络10711.4讨论与延伸阅读110第12章 案例Ⅰ:房价指数的分析与预测11112.1HPI数据导入11112.2HPI数据探索11212.3HPI趋势与季节性成分11812.4HPI预测12012.5房地产估价12212.6讨论122第13章 案例Ⅱ:客户回复预测与效益最大化12313.1简介12313.2KDD Cup 1998的数据12313.3数据探索13113.4训练决策树13713.5模型评估14013.6选择最优决策树14313.7评分14513.8讨论与总结148第14章 案例Ⅲ:内存受限的大数据预测模型15014.1简介15014.2研究方法15014.3数据与变量15114.4随机森林15214.5内存问题15314.6样本数据的训练模型15414.7使用已选变量建立模型15614.8评分16214.9输出规则16814.9.1以文本格式输出规则16814.9.2输出SAS规则的得分17214.10总结与讨论177第15章 在线资源17815.1R参考文档17815.2R17815.3数据挖掘17915.4R的数据挖掘18015.5R的分类与预测18115.6R的时间序列分析18115.7R的关联规则挖掘18115.8R的空间数据分析18115.9R的文本挖掘18215.10R的社交网络分析18215.11R的数据清洗与转换18215.12R的大数据与并行计算182R语言数据挖掘参考文档184参考资料197通用索引201包索引203函数索引204

内容摘要:

本书为研究人员、高校学生、数据分析人员介绍了使用R语言进行数据挖掘应用的实用方法和技术。读者会从本书中发现使用R语言完成数据挖掘任务(如分类和预测、聚类、孤立点检测、关联规则、序列分析、文本挖掘、社会网络分析、情感分析等)的非常有价值的指导。数据挖掘技术在广泛领域都发展迅速。本书重点关注数据挖掘过程的建模阶段,以及数据探查和模型评估问题。本书讲述简洁实用,配有现实应用案例和代码示例以及数据,在线资源及时丰富,是一本数据分析的实战技术图书。【作者简介】Yanchang Zhao从2009年起担任澳大利亚政府部门的高级数据挖掘分析师。在加入澳大利亚政府部门之前,他是悉尼科技大学工程和信息技术学院博士后研究员。他的研究兴趣包括聚类分析、关联规则、时间序列、孤立点检测、数据挖掘应用等,当前关注在数据挖掘应用中使用R语言。他是IEEE高级会员和澳大利亚分析专业人员协会成员。他发表了50多篇数据挖掘研究和应用方面的论文,并独立或与他人合作编写了3本著作。

书籍规格:

书籍详细信息
书名R语言与数据挖掘最佳实践和经典案例站内查询相似图书
丛书名计算机科学丛书
9787111475415
如需购买下载《R语言与数据挖掘最佳实践和经典案例》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位机械工业出版社
版次1版印次1
定价(元)39.0语种简体中文
尺寸19 × 26装帧平装
页数 234 印数 4000

书籍信息归属:

R语言与数据挖掘最佳实践和经典案例是机械工业出版社于2014.8出版的中图分类号为 TP312 ,TP274 的主题关于 程序语言-程序设计 ,数据采集 的书籍。