出版社:中国物资出版社
年代:2011
定价:25.0
本书主要研究内容包括:基于模糊粒度计算的文本聚类、基于粒网生成规则的文本分类、基于信息粒度的不完备系统遗漏值补齐三大项内容。
1 绪论
1.1 课题背景和意义
1.2 课题研究内容
1.3 主要创新点
1.4 本书的逻辑结构
2 文献综述
2.1 数据挖掘概述
2.2 粒度计算在数据挖掘中的应用
2.3 粒度计算数据挖掘研究中需要进一步解决的问题
2.4 本书的研究内容及特点
2.5 小结
3 基于模糊粒度计算的聚类
3.1 引言
3.2 模糊聚类分析
3.3 模糊粒度聚类基础
3.4 基于模糊粒度计算的文本聚类
3.5 基于模糊粒度计算的农业经济划分
3.6 基于模糊粒度计算的K-means优化算法
3.7 小结
4 基于粒网络生成规则的文本分类
4.1 引言
4.2 基于集合论的粒度分类基础
4.3 基于规则的机器学习
4.4 基于粒度计算的分类
4.5 基于粒网络生成规则的分类模型
4.6 基于粒网络生成规则的文本情感分类
4.7 小结
5 基于信息粒度的不完备系统遗漏值补齐
5.1 引言
5.2 粗糙集理论基本概念
5.3 知识发现中的不完备信息问题
5.4 不完备信息系统
5.5 不完备信息系统粒度模型构建
5.6 基于信息粒度的遗漏值补齐
5.7 决策规则的不确定性表示与度量
5.8 实验结果和分析
5.9 小结
6 结论
参考文献
附录
后记
《粒度计算在数据挖掘中的应用研究》是对模糊粒度计算在文本软聚类中的应用进行了深入研究,提出了一种基于模糊粒度计算的聚类方法,并且利用该聚类方法对K-means算法进行了优化。基于模糊粒度计算的聚类是通过归一化的距离函数将聚类问题映射到距离空间,调节粒度产生对文本集合D的动态聚类划分。
动态聚类既可以作为一个单独的聚类结果,也可以作为其他算法的一个预处理步骤。K-means算法是一种经典的聚类算法,速度快、消耗资源小,但是算法对初始聚类中心点敏感,容易陷入局部最小值。《粒度计算在数据挖掘中的应用研究》将基于模糊粒度计算的聚类方法作为K-means算法的预处理步骤,实验结果证明,这种预处理有效地消除了K-means算法的初始值敏感问题,优化了K-means算法。
《粒度计算在数据挖掘中的应用研究》是信息处理的一种新的概念和计算范式,覆盖了所有和粒度相关的理论、方法、技术和工具的信息,主要用于描述和处理不确定的、模糊的、不完整的和海量的信息以及提供一种基于粒和粒间关系的问题求解方法。作为一个新兴领域的研究,国内外相关研究人员提供了一些粒度计算的理论基础,并且为检验知识发现过程的有效性、解决实际问题提供了一条可行途径。