出版社:清华大学出版社
年代:2015
定价:50.0
本书在深入研究模糊集和粗糙集等不确定理论、多目标规划和决策以及数据挖掘分类问题等理论和方法的基础上,尤其是在客观地分析了这些方法之间存在的互补性的前提下,提出了建立一系列不确定情形下的多目标规划的模型和算法,并将它们用于解决数据挖掘中的分类问题,以提高分类的准确性、分类模型的求解效率和它们在新数据上的泛化能力。
第1章引言1
1.1研究背景与意义1
1.2本书的主要内容与组织结构3
1.3研究方法与技术路线6第2章相关理论基础7
2.1数据挖掘7
2.1.1基本理论、模型和算法8
2.1.2针对异构数据的方法及应用11
2.1.3性能评价方法12
2.1.4实际应用12
2.1.5其他方面14
2.2最优化理论16
2.2.1经典优化理论、方法和应用16
2.2.2启发式优化方法18
2.2.3全局优化及国内的优化研究19
2.3分类问题20
2.3.1分类器方法20
2.3.2分类性能的提升23
2.3.3分类结果评价23
2.4最优化分类方法24
2.4.1支持向量机分类方法24
2.4.2数学规划分类方法26
2.5数据的不确定性27
2.5.1数据的不确定性概述27
2.5.2不确定性的研究现状29
2.6不确定理论30
2.6.1不确定理论综述30
2.6.2模糊集与模糊规划32
2.6.3粗糙集与粗规划33
2.7数据挖掘方法的近似性和多目标性34
2.8小结35第3章多目标优化分类模型36
3.1分类问题的表示与评价36
3.1.1分类问题的表示36
3.1.2分类性能评价37
3.2支持向量机分类模型40
3.2.1支持向量机分类模型概述40
3.2.2最小二乘支持向量机分类模型44
3.3多目标优化分类模型概述46
3.3.1多目标决策概述47
3.3.2多目标优化分类模型49
3.3.3多目标线性规划分类模型55
3.3.4多目标二次规划分类模型59
3.4MCO和SVM分类模型的关系分析64
3.5小结66第4章模糊多目标规划分类模型和算法67
4.1模糊集基本理论67
4.2模糊多目标线性规划分类模型和算法70
4.2.1模糊决策和模糊线性规划70
4.2.2模糊多目标线性规划分类模型72
4.2.3模糊多目标线性规划分类算法79
4.2.4与多阶段模糊线性规划分类方法的对比分析82
4.3模糊多目标二次规划分类模型85
4.3.1模糊二次规划85
4.3.2模糊多目标二次规划分类模型86
4.4小结90第5章基于粗糙集的特征选择与多目标规划分类模型和算法91
5.1特征选择和约简方法91
5.1.1特征选择和属性约简基本理论91
5.1.2基于统计属性贡献度的约简方法93
5.2基于粗糙集的约简方法96
5.2.1基于等价关系的粗集约简方法97
5.2.2基于不可分辨关系的粗集整数规划约简模型100
5.3基于粗糙集的多目标规划分类模型和算法103
5.3.1基于粗糙集的多目标规划分类模型104
5.3.2基于粗糙集的多目标规划分类算法106
5.4粗糙集近似理论107
5.5粗近似多目标规划分类模型109
5.5.1粗近似多目标线性规划分类模型112
5.5.2粗近似多目标二次规划分类模型113
5.6小结115第6章基于核、模糊化和惩罚因子的多目标优化分类模型117
6.1不确定现象概述117
6.2模糊支持向量机分类模型122
6.3基于核、模糊化和惩罚因子的多目标优化分类模型125
6.3.1基于核与惩罚因子的模糊多目标优化分类模型125
6.3.2基于模糊化和惩罚因子的核多目标优化分类模型130
6.4小结133第7章不确定性多目标优化分类模型的应用135
7.1信用评分135
7.1.1信用评分及相关方法概述135
7.1.2信用评分流程139
7.1.3信用评分数据集141
7.1.4信用评分实例分析142
7.2Web客户忠诚度分析157
7.2.1Web挖掘概述157
7.2.2Web客户忠诚度分析数据集158
7.2.3性能分析160
7.2.4Web客户忠诚度分析161
7.3蛋白质交互的热点区域的预测165
7.3.1概述165
7.3.2蛋白质交互的热点区域预测数据集166
7.3.3蛋白质交互的热点区域分析166
7.4重大疾病的医疗诊断和预测170
7.4.1数据概述170
7.4.2重大疾病的医疗诊断和预测分析171
7.5小结175第8章总结与展望176
8.1研究总结176
8.2主要贡献177
8.3对后续研究工作的展望178参考文献180
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。
本书可供从事数据挖掘、机器学习与知识工程领域的科学工作者、相关专业的本科生和研究生,以及从事数据分析和处理的工程技术人员参考。