文本分类中的几个关键问题研究

文本分类中的几个关键问题研究

裴志利, 著

出版社:中国水利水电出版社

年代:2015

定价:25.0

书籍简介:

本书基于数据挖掘的相关技术做了如下几个方面的工作:①针对标准互信息和tf.idf特征权重公式的缺点提出了改进方法,改进的方法明显提高了宏观准确率、宏观召回率和宏观F1值;②针对标准tf.idf方法估算特征权重的盲目性,提出了基于实数域粗糙集理论的特征频率重要度加权方法,该方法改善了样本空间的分布状态,明显提高了文本分类的效果;③提出了一种基于互信息和信息熵对的特征选择方法,利用该方法进行特征选择的分类效果接近代表分类水平的支持向量机;④提出了基于粗糙集的多知识粒度的启发式属性约简方法。

书籍规格:

书籍详细信息
书名文本分类中的几个关键问题研究站内查询相似图书
9787517031154
如需购买下载《文本分类中的几个关键问题研究》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位中国水利水电出版社
版次1版印次1
定价(元)25.0语种简体中文
尺寸24 × 17装帧平装
页数印数 45

书籍信息归属:

文本分类中的几个关键问题研究是中国水利水电出版社于2015.5出版的中图分类号为 TP274 的主题关于 数据采集-研究 的书籍。