出版社:清华大学出版社
年代:2006
定价:23.0
本书系统介绍数据仓库原理、联机分析处理、数据仓库设计与开发、数据挖掘原理、遗传算法等内容。
第1章数据仓库与数据挖掘概述
1.1数据仓库的兴起
1.1.1从数据库到数据仓库
1.1.2从OLTP到OLAP
1.1.3数据字典与元数据
1.1.4数据仓库的定义与特点
1.2数据挖掘的兴起
1.2.1从机器学习到数据挖掘
1.2.2数据挖掘的含义
1.2.3数据挖掘与OLAP的比较
1.2.4数据挖掘与统计学
1.3数据仓库和数据挖掘的结合
1.3.1数据仓库和数据挖掘的区别与联系
1.3.2基于数据仓库的决策支持系统
1.3.3数据仓库与商业智能
习题
第2章数据仓库原理
2.1数据仓库结构体系
2.1.1数据仓库结构
2.1.2数据集市及其结构
2.1.3数据仓库系统结构
2.1.4数据仓库的运行结构
2.2数据仓库的数据模型
2.2.1星型模型
2.2.2雪花模型
2.2.3星网模型
2.2.4第三范式
2.3数据抽取、转换和装载
2.3.1数据抽取
2.3.2数据转换
2.3.3数据装载
2.3.4ETL工具
2.4元数据
2.4.1元数据的重要性
2.4.2关于数据源的元数据
2.4.3关于数据模型的元数据
2.4.4关于数据仓库映射的元数据
2.4.5关于数据仓库使用的元数据
习题
第3章联机分析处理
3.1OLAP概念
3.1.1OLAP的定义
3.1.2OLAP准则
3.1.3OLAP的基本概念
3.2OLAP的数据模型
3.2.1MO数据模型
3.2.2ROLAP数据模型
3.2.3MOLAP与ROLAP的比较
3.2.4HOLAP数据模型
3.3多维数据的显示3.3.1多维数据的显示方法
3.3.2多维类型结构
3.3.3多维数据的分析视图
3.4OLAP的多维数据分析
3.4.1多维数据分析的基本操作
3.4.2广义OLAP功能
3.4.3多维数据分析实例
3.5OLAP结构与分析工具
3.5.1OLAP结构
3.5.20IAP的Web结构
3.5.3OLAP工具及评价
习题
第4章数据仓库设计与开发
4.1数据仓库分析与设计
4.1.1需求分析
4.1.2概念模型设计
4.1.3逻辑模型设计
4.1.4物理模型设计
4.1.5数据仓库的索引技术
4.2数据仓库开发
4.2.1数据仓库开发过程
4.2.2数据质量与数据清洗
4.2.3数据粒度与维度建模
4.3数据仓库技术与开发的困难
4.3.1数据仓库技术
4.3.2数据仓库开发的困难
习题
第5章数据仓库管理和应用
5.1数据仓库管理
5.1.1用户使用数据仓库的管理
5.1.2数据管理
5.2数据仓库的决策支持与决策支持系统
5.2.1查询与报表
5.2.2多维分析与原因分析
5.2.3预测未来
5.2.4实时决策
5.2.5自动决策
5.2.6决策支持系统
5.3数据仓库应用实例
5.3.1航空公司数据仓库决策支持系统简例
5.3.2统计业数据仓库系统
5.3.3沃尔玛数据仓库系统
习题
第6章数据挖掘原理
6.1知识发现过程
6.1.1知识发现过程定义
6.1.2数据挖掘对象
6.1.3数据挖掘任务
6.1.4数据挖掘分类
6.1.5不完全数据处理6.1.6数据库的数据浓缩
6.2数据挖掘方法和技术
6.2.1归纳学习的信息论方法
6.2.2归纳学习的集合论方法
6.2.3仿生物技术的神经网络方法
6.2.4仿生物技术的遗传算法
6.2.5数值数据的公式发现
6.2.6可视化技术
6.3数据挖掘的知识表示
6.3.1规则知识
6.3.2决策树知识
6.3.3知识基
6.3.4神经网络的权值
6.3.5公式知识
6.3.6案例
习题
第7章信息论方法
7.1信息论原理
7.1.1信道模型和学习信道模型
7.1.2信息熵和条件熵
7.1.3互信息与信息增益
7.1.4信道容量与译码准则
7.2决策树方法
7.2.1决策树概念
7.2.2ID3方法基本思想
7.2.3ID3算法
7.2.4实例与讨论
7.2.5C4.5方法
7.3决策规则树方法
7.3.1IBLE方法的基本思想
7.3.2IBLE算法
7.3.3IBLE方法实例
习题
第8章集合论方法
8.1粗糙集方法
8.1.1粗糙集概念
8.1.2属性约简的粗糙集理论
8.1.3属性约简的粗糙集方法
8.1.4粗糙集方法的规则获取
8.1.5粗糙集方法的应用实例
8.2关联规则挖掘
8.2.1关联规则的挖掘原理
8.2.2Apriori算法的基本思想
8.2.3Apriori算法程序
8.2.4基于FP一树的关联规则挖掘算法
习题
第9章公式发现
9.1公式发现概述
9.1.1曲线拟合与公式发现
9.1.2启发式与数据驱动启发式9.2科学定律重新发现系统
9.2.1BAC0N系统基本原理
9.2.2BAC0N系统实例
9.2.3BAC0N系统的进展
9.3经验公式发现系统
9.3.1FDD系统基本原理
9.3.2FDD.1系统结构
9.3.3FDD.1系统实例
9.3.4FDD.2系统
9.3.5FDD.3系统
习题
第10章神经网络与遗传算法
10.1神经网络概念及几何意义
10.1.1神经网络原理
10.1.2神经网络的几何意义
10.1.3超曲面神经网络概念
10.2感知机
10.2.1.感知机模型
10.2.2感知机实例
10.2.3感知机讨论
10.3反向传播模型
10.3.1BP网络结构
10.3.2BP网络学习公式推导
10.3.3实例分析
10.4遗传算法
10.4.1遗传算法基本原理
10.4.2遗传算子
10.4.3遗传算法简例
10.4.4遗传算法的特点
10.5基于遗传算法的分类学习系统
10.5.1概述
10.5.2遗传分类学习系统GCLs的基本原理
10.5.3遗传分类学习系统GCLS的应用
习题
第11章文本挖掘与Web挖掘
11.1文本挖掘概述
11.1.1文本挖掘的基本概念
11.1.2文本特征的表示
11.1.3文本特征的提取
11.2文本挖掘
11.2.1文本挖掘功能层次
11.2.2关联分析
11.2.3文本聚类
11.2.4文本分类
11.3Web挖掘
11.3.1Web挖掘概述
11.3.2Web内容挖掘
11.3.3Web结构挖掘
11.3.4web应用挖掘
习题第12章数据仓库与数据挖掘的发展
12.1综合决策支持系统-
12.1.1从管理科学到决策支持系统
12.1.2基于数据仓库的决策支持系统与传统决策支持系统的结合
12.1.3综合决策支持系统发展趋势
12.2可拓数据挖掘
12.2.1丁拓学基本原理
12.2.2从数据挖掘到可拓数据挖掘
12.2.3可拓数据挖掘理论
12.2.4可拓数据挖掘实例
习题
参考文献
书籍详细信息 | |||
书名 | 数据仓库与数据挖掘技术站内查询相似图书 | ||
丛书名 | 高等院校信息管理与信息系统专业系列教材 | ||
7302131546 如需购买下载《数据仓库与数据挖掘技术》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 清华大学出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 23.0 | 语种 | 简体中文 |
尺寸 | 26 | 装帧 | 平装 |
页数 | 279 | 印数 |
数据仓库与数据挖掘技术是清华大学出版社于2006.出版的中图分类号为 TP311.13 ,TP274 的主题关于 数据库系统-高等学校-教材 ,数据采集-高等学校-教材 的书籍。