出版社:中国人民大学出版社
年代:2012
定价:50.0
数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。本书基于Clementine讲述了数据挖掘的主要原理及应用。
第1章 数据挖掘和clementine使用概述
1.1数据挖掘的产生背景
1.2什么是数据挖掘
1.3clementine软件概述
第2章 clementine的数据读入和数据集成
2.1变量类型
2.2读人数据
2.3生成实验方案
2.4数据集成
第3章 clementine的数据理解
3.1变量说明
3.2数据质量的评估和调整
3.3数据的排序
3.4数据的分类汇总
3.5用户报表
第1章 数据挖掘和clementine使用概述
1.1数据挖掘的产生背景
1.2什么是数据挖掘
1.3clementine软件概述
第2章 clementine的数据读入和数据集成
2.1变量类型
2.2读人数据
2.3生成实验方案
2.4数据集成
第3章 clementine的数据理解
3.1变量说明
3.2数据质量的评估和调整
3.3数据的排序
3.4数据的分类汇总
3.5用户报表
第4章 clementine的数据准备
4.1变量变换
4.2变量派生
4.3数据精简
4.4数据筛选
4.5数据准备的其他工作
第5章 clementine的基本分析
5.1数值型变量的基本分析
5.2两分类型变量相关性的研究
5.3两总体的均值比较
5.4rfm分析
第6章 clementine的数据精简
6.1变量值的离散化处理
6.2特征选择
6.3因子分析
第7章 分类预测:clementine的决策树
7.1决策树算法概述
7.2clementine的c5.0算法及应用
7.3clementine的分类回归树及应用
7.4clementine的chaid算法及应用
7.5clementine的quest算法及应用
7.6模型的对比分析
第8章 分类预测:clementine的人工神经网络
8.1人工神经网络算法概述
8.2clementine的b-p反向传播网络
8.3clementine的b-p反向传播网络的应用
8.4clementine的径向基函数网络及应用
第9章 分类预测:clementine的支持向量机
9.1支持向量分类的基本思路
9.2支持向量分类的基本原理
9.3支持向量回归
9.4支持向量机的应用
第10章 分类预测:clementine的logistic回归分析
10.1logistic回归分析概述
10.2二项logistic回归分析
10.3二项logistic回归分析的应用
10.4多项logistic回归分析及应用
第11章 分类预测:clementine的判别分析
11.1距离判别法
11.2fisher判别法
11.3贝叶斯判别法
11.4判别分析的应用
第12章 分类预测:clementine的贝叶斯网络
12.1贝叶斯方法基础
12.2贝叶斯网络概述
12.3tan贝叶斯网络
12.4马尔科夫毯网络
12.5贝叶斯网络的应用
第13章 探索内部结构:clementine的聚类分析
13.1聚类分析的一般问题
13.2clementine的k-means聚类及应用
13.3clementine的两步聚类及应用
13.4clementine的kohonen网络聚类及应用
13.5基于聚类分析的离群点探索
第14章 探索内部结构:clementine的关联分析
14.1简单关联规则及其有效性
14.2clementine的apriori算法及应用
14.3clementine的gri算法及应用
14.4clementine的序列关联及应用
参考文献
数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。
作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:
·以数据挖掘过程为线索介绍clementine软件。本书以数据挖掘的实践过程为主线,从clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握clementine的基本功能和一般方法,并可迅速运用到实际工作中。
·数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。
·数据挖掘方法讲解全面,语言通俗。本书对clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。
数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。
作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:
·以数据挖掘过程为线索介绍clementine软件。本书以数据挖掘的实践过程为主线,从clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握clementine的基本功能和一般方法,并可迅速运用到实际工作中。
·数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。
·数据挖掘方法讲解全面,语言通俗。本书对clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。