出版社:机械工业出版社
年代:2016
定价:69.0
本书共17章。第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识。这一部分内容涉及互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等),并讲解用于查询网络文档和数据集的基本技术(XPath和正则表达式)。第9~11章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工作流程、真实环境数据中的陷阱以及规避它们的方法等问题提供一些实用的见解。
书籍详细信息 | |||
书名 | 基于R语言的自动数据收集站内查询相似图书 | ||
丛书名 | 数据分析与决策技术丛书 | ||
9787111527503 如需购买下载《基于R语言的自动数据收集》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 机械工业出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 69.0 | 语种 | 简体中文 |
尺寸 | 19 × 24 | 装帧 | 平装 |
页数 | 452 | 印数 | 4000 |
(日) 山本义郎, (日) 藤野友和, (日) 久保田贵文, 著
徐雪琪, 著
高慧, 著
薛薇等 , 编著
木林, 著
(哈) 贝特·麦克哈贝尔 (Bater Makhabel) , 著
(印) 普拉迪帕塔·米什拉 (Pradeepta Mishra) , 著
徐萍, 著
任志波, 著