出版社:机械工业出版社
年代:2018
定价:49.0
全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;最后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。
书籍详细信息 | |||
书名 | 文本挖掘站内查询相似图书 | ||
丛书名 | O’Reilly精品图书系列 | ||
9787111588559 如需购买下载《文本挖掘》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 机械工业出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 49.0 | 语种 | 简体中文 |
尺寸 | 18 × 24 | 装帧 | 平装 |
页数 | 178 | 印数 | 3000 |
谢佳标, 著
经管之家, 主编
韦鹏程, 邹杨, 冉维, 著
潘有能, 著
(哈) 贝特·麦克哈贝尔 (Bater Makhabel) , 著
(印) 普拉迪帕塔·米什拉 (Pradeepta Mishra) , 著
易正俊, 赵品勇, 辛巧, 主编
(葡) 路易斯·托尔戈, 著
(美) 托尔戈 (Torgo,L.) , 著