书籍简介:

本著作将在对比分析并发现现有文本挖掘技术存在不足的基础上，提出改进文本预处理精度的算法。文中涉及的主要技术包括文本收集、文本预处理、处理后的文本的中文分词、预抽取训练样本及使用KNN方法进行文本训练和文本分类等。通过对系统功能的分析，本研究把系统分成了文本预处理、中文分词、文本特征向量的提取、文本特征向量的训练和分类等四部分。本课题实现了文本收集、文本预处理和中文分词等文本挖掘的关键技术，并在研究的基础上提出了一套特征抽取及文本挖掘的方案，为后续的研究奠定了基础。

书籍规格:

书籍详细信息
书名	文本挖掘预处理相关基础技术分析与应用研究站内查询相似图书
	9787509214206 如需购买下载《文本挖掘预处理相关基础技术分析与应用研究》pdf扫描版电子书或查询更多相关信息，请直接复制isbn,搜索即可全网搜索该ISBN
出版地	北京	出版单位	中国市场出版社
版次	1版	印次	1
定价(元)	39.0	语种	简体中文
尺寸	21 × 15	装帧	平装
页数	250	印数	1000

全网搜索试读资源

书籍信息归属:

文本挖掘预处理相关基础技术分析与应用研究是中国市场出版社于2015.11出版的中图分类号为 TP274 的主题关于数据处理－研究 ,数据采集－研究的书籍。