出版社:清华大学出版社
年代:2014
定价:30.0
本书介绍数据仓库和数据挖掘的理论、方法、技术及其应用。此外,用较多篇幅阐述数据仓库和数据挖掘在多个领域的应用实例。全书分为三篇。第一篇介绍数据仓库的起源和演变。第二篇介绍数据挖掘的起源和发展。第三篇介绍知识表示和管理的主要方法。
第一篇 数据仓库
第1章 数据仓库基础
1.1 概述
1.1.1 演变
1.1.2 定义
1.2 体系结构
1.2.1 两层的体系结构
1.2.2 三层的体系结构
1.3 组成
1.3.1 加载管理器
1.3.2 仓库管理器
1.3.3 查询管理器
1.4 元数据
1.4.1 定义和分类
1.4.2 标准化
1.4.3 CWM
1.4.4 UML、MOF和XMI与CWM的关系
1.5 数据粒度
1.6 数据模型
1.7 ETL过程
1.7.1 主要流程
1.7.2 数据抽取
1.7.3 数据转换
1.7.4 数据加载
1.8 数据质量
1.8.1 主要问题
1.8.2 评价标准
1.8.3 管理目标
1.8.4 管理体系
1.8.5 数据规划
1.8.6 技术方案
第2章 数据仓库设计和实现
2.1 数据仓库设计
2.1.1 设计方法
2.1.2 体系结构设计
2.1.3 数据模型设计
2.1.4 ETL设计
2.2 数据仓库实现
第3章 数据仓库实例
3.1 实例一
3.1.1 选择主题
3.1.2 逻辑模型
3.1.3 物理模型
3.1.4 ETL
3.2 实例二
3.2.1 总体结构
3.2.2 概念模型
3.2.3 逻辑模型
3.2.4 物理模型
3.2.5 数据清洗
3.2.6 ETL
第4章 数据仓库应用——OLAP和OLAM
4.1 OLAP
4.2 OLAM
4.2.1 体系结构
4.2.2 特点
4.2.3 基于Web的OLAM
第二篇 数据挖掘
第5章 数据挖掘基础
5.1 概述
5.1.1 定义
5.1.2 功能
5.1.3 模型
5.1.4 展望
5.2 实现
5.3 工具
5.3.1 概述
5.3.2 比较
第6章 聚类分析
6.1 硬聚类
6.1.1 概述
6.1.2 相似度计算
6.1.3 实现方法
6.1.4 主要算法
6.2 模糊聚类
6.2.1 概述
6.2.2 主要算法
6.3 评价
第7章 分类和预测
7.1 神经网络
7.2 决策树
7.3 实现过程
第8章 关联分析
8.1 概述
8.2 Apriori
8.3 FP-Growth
第9章 Web挖掘
9.1 概述
9.1.1 定义和分类
9.1.2 主要技术
9.1.3 实现过程
9.2 Web资源获取
9.3 Web预处理
9.3.1 Web过滤
9.3.2 Web去重
9.4 Web抽取和表示
9.4.1 Web抽取
9.4.2 Web表示
9.5 Web特征提取
9.6 Web聚类
9.7 Web分类
9.7.1 朴素贝叶斯 24#
9.7.2 支持向量机
9.7.3 评价
第10章 数据挖掘实例
10.1 客户细分
10.1.1 定义
10.1.2 数据准备
10.1.3 建模过程
10.1.4 结果
10.2 重入网识别
10.2.1 定义
10.2.2 数据准备
10.2.3 建模过程
10.2.4 结果
10.3 虚开欺诈识别
10.3.1 定义
10.3.2 数据准备
10.3.3 建模过程
10.3.4 结果
10.4 数据业务收入预测
10.4.1 定义
10.4.2 数据准备
10.4.3 建模过程
10.4.4 结果
10.5 移动客户流失预测
10.5.1 定义
10.5.2 数据准备
10.5.3 特征变量选取
10.5.4 建模过程
10.5.5 结果
10.5.6 应用
10.6 WAP日志挖掘
10.6.1 定义
10.6.2 数据准备
10.6.3 建模过程
10.6.4 结果
第三篇 语义网和本体
第11章 知识基础
11.1 概述
11.2 知识分类
11.3 知识表示
11.3.1 知识表示观
11.3.2 知识表示方法
11.4 知识可视化
11.4.1 主要技术
11.4.2 工具
11.5 知识管
11.5.1 概述
11.5.2 模型和技术
11.5.3 知识管理系统
11.5.4 方法和步骤
第12章 语义网和本体
12.1 语义网
12.1.1 概述
12.1.2 层次结构
12.1.3 元数据
12.1.4 核心技术
12.1.5 开发工具——Jena
12.1.6 Web 3.
12.2 本体
12.2.1 哲学本源
12.2.2 定义
12.2.3 建模
12.2.4 分类
12.2.5 构建方法
12.2.6 描述语言
12.2.7 实例
参考文献
本书全面地介绍数据仓库和数据挖掘的原理及其应用, 系统地阐述数据仓库和数据挖掘的主要概念和算法等基础知识,并结合当前各领域的具体应用实例进一步帮助广大读者加深理解,力求学以致用。全书分为3篇。第1篇介绍数据仓库的发展和演变,主要阐述数据仓库的定义、体系结构、组成、数据模型和ETL过程等,描述数据仓库的设计方法和实现过程,结合实例说明如何构建数据仓库,扼要地介绍数据仓库的应用,如OLAP和OLAM。第2篇介绍数据挖掘的起源和发展,主要阐述数据挖掘和Web挖掘的主要算法,包括聚类、分类、预测和关联分析等,描述如何运用数据挖掘解决实际问题,如客户细分、虚开欺诈识别和WAP日志挖掘等。第3篇阐述数据、信息和知识之间的关系,介绍当前研究热点——语义网和本体的核心技术及其主要应用。本书可作为计算机及相关专业的研究生和高年级本科生教材,也可以作为计算机研究和开发人员以及相关专业人士的参考资料。