文本挖掘

文本挖掘

(美) 茱莉亚·斯拉格 (Julia Silge) , (美) 戴维·罗宾逊 (David Robinson) , 著

出版社:机械工业出版社

年代:2018

定价:49.0

书籍简介:

全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;最后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。

书籍规格:

书籍详细信息
书名文本挖掘站内查询相似图书
丛书名O’Reilly精品图书系列
9787111588559
如需购买下载《文本挖掘》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位机械工业出版社
版次1版印次1
定价(元)49.0语种简体中文
尺寸18 × 24装帧平装
页数 178 印数 3000

书籍信息归属:

文本挖掘是机械工业出版社于2018.1出版的中图分类号为 TP312 的主题关于 程序语言-程序设计 的书籍。