数据仓库与数据挖掘技术

数据仓库与数据挖掘技术

夏火松, 主编

出版社:科学出版社

年代:2004

定价:

书籍简介:

本书全面地分析了数据仓库与数据挖掘技术的发展和应用的重要性,介绍数据仓库的基本概念和数据仓库的基本描述方法,分析数据仓库的基本内容,开发数据仓库的基本方法。在建立数据仓库的基础上,介绍数据挖掘技术的研究现状和基本概念,分析数据挖掘的基本规则,介绍有代表性的数据挖掘算法和数据挖掘工具,给出具体应用的规则,特别是对离群数据挖掘模型进行介绍,最后展望数据挖掘的相应研究的前景。

书籍目录:

第二版前言

第一版前言

第1章数据仓库与数据挖掘概述

1.1数据仓库引论

1.1.1为什么要建立数据仓库

1.1.2什么是数据仓库

1.1.3数据仓库的特点

1.1.4数据进入数据仓库的基本过程与建立数据仓库的步骤

1.1.5分析数据仓库的内容

1.2数据挖掘引论

1.2.1为什么要进行数据挖掘

1.2.2什么是数据挖掘

l.2.3数据挖掘的特点

1.2.4数据挖掘的基本过程与步骤

1.2.5分析数据挖掘的内容

1.3数据挖掘与数据仓库的关系

1.4数据仓库与数据挖掘的应用

1.4.1数据挖掘在零售业的应用

1.4.2数据挖掘在商业银行中的应用

1.4.3数据挖掘在电信部门的应用

1.4.4数据挖掘在贝斯出口公司的应用

1.4.5数据挖掘如何预测信用卡欺诈

1.4.6数据挖掘在证券行业的应用

思考练习题

第2章数据仓库的分析

2.1数据仓库的需求分析模型

2.2影响数据仓库成功的因素

2.3数据仓库的生命周期

2.3.1数据仓库计划与准备阶段

2.3.2数据仓库的其他阶段

2.4数据仓库的基本体系结构

2.5数据仓库的逻辑结构

2.5.1数据仓库中的粒度

2.5.2数据仓库中的数据分割

2.5.3数据仓库中的数据组织

2.5.4数据仓库中的快照

2.5.5数据仓库中的元数据

思考练习题

第3章数据仓库的设计与实施

3.1设计科学与数据仓库的设计

3.2从数据库到数据仓库

3.3面向主题的数据仓库设计

3.3.1数据建模

3.3.2星型连接

3.3.3数据仓库的数据模型设计

3.4开发数据仓库的物理设计

3.4.1数据仓库设计工具的选择

3.4.2物理数据模型设计

3.4.3数据仓库中数据表的数量与规范化

3.5数据仓库的实施

3.5.1数据仓库的实施应注意的问题

3.5.2在实施数据仓库过程中应避免的错误

3.5.3数据仓库项目实施成功的要诀

思考练习题

第4章信息分析的基本技术

4.1自动信息分析的基本技术

4.1.1智能代理

4.1.2群体智能

4.1.3小波分析

4.1.4分形技术分析

4.2联机分析

4.2.1联机分析OLAP的基本术语

4.2.2OLAP体系结构和处理的特性

4.2.3OLAP多维数据结构与OLAP的分类

4.2.4OLAP的多维数据分析方法

4.2.5OLAP评价准则

4.2.6OLAP的发展与流行的OLAP工具选择

4.3Rough的信息分析技术

4.3.1粗糙集理论的基本概念和理论基础

4.3.2粗糙集在信息分析中的特征表示

思考练习题

第5章数据挖掘过程

5.1数据挖掘的方法与基本流程

5.1.1SEMMA方法

5.1.2数据挖掘的基本流程

5.2确定主题和定义数据挖掘任务

5.2.1确定主题

5.2.2定义数据挖掘任务

5.3数据预处理

5.3.1数据的收集和准备

5.3.2数据清理

5.3.3数据集成

5.3.4数据变换

5.3.5数据归约

5.3.6微软数据转换服务

5.4数据挖掘的模型建立与理解

5.4.1关于模型的准确性

5.4.2关于模型的可理解性

5.4.3关于模型的性能

5.4.4描述和可视化

5.4.5验证与评估

5.5数据挖掘中常见的一些问题

5.5.1商业用户提出的问题

5.5.2技术问题

5.5.3数据挖掘应用问题

5.5.4实施数据挖掘项目考虑的问题

5.5.5数据挖掘对社会的影响有关隐私问题

5.6事先无法预测的有价值知识

思考练习题

第6章数据挖掘基本算法

6.1分类规则挖掘

6.1.1分类与估值

6.1.2决策树

6.1.3贝叶斯分类

6.2预测分析与趋势分析规则

6.2.1预言的基本方法

6.2.2定量分析预测

6.2.3预测的结果分析

6.2.4趋势分析挖掘

6.3数据挖掘的关联算法

6.3.1关联规则的概念及分类

6.3.2简单形式的关联规则算法(单维、单层和布尔关联规则)

6.3.3多层和多维关联规则的挖掘

6.3.4货篮子分析存在的问题

6.3.5关联分析的其他算法

6.3.6挖掘序列模式

6.4数据挖掘的聚类算法

6.4.1聚类分析的概念与分类

6.4.2聚类分析中两个对象之间的相异度计算方法

6.4.3划分方法

6.4.4层次方法

6.4.5基于密度的方法

6.4.6基于网格的方法

6.4.7基于模型的聚类方法

6.4.8模糊聚类算法

6.5数据挖掘的统计分析算法

6.5.1辨别分析

6.5.2回归建模

6.5.3优点和缺点

6.6数据挖掘的品种优化算法

6.6.1品种优化

6.6.2品种优化的算法

6.7数据挖掘的进化算法

6.7.1遗传算法

6.7.2数据挖掘的神经网络算法

思考练习题

第7章非结构化数据挖掘

7.1文本挖掘

7.1.1文本挖掘的一般过程与应用

7.1.2文本表示与预处理

7.1.3文本分类方法与文本聚类方法

7.1.4自动摘要方法

7.2Web数据挖掘

7.2.1非结构化Web数据源

7.2.2Web挖掘分类

7.2.3Web内容挖掘

7.2.4Web结构挖掘

7.2.5Web访问挖掘

7.2.6利用Web日志的聚类算法

7.2.7电子商务中的Web挖掘

7.3空间群数据挖掘

7.3.1空间数据挖掘的概念

7.3.2空间数据挖掘的分类

7.3.3空间数据挖掘的体系结构

7.4多媒体数据挖掘

7.4.1多媒体数据挖掘的概念

7.4.2多媒体数据挖掘的分类

7.4.3多媒体数据挖掘的体系结构

思考练习题

第8章离群数据挖掘

8.1离群数据挖掘的概念

8.2离群数据挖掘的分类

8.3离群数据挖掘的算法

8.3.1基于统计的方法

8.3.2基于距离的离群数据方法

8.3.3基于偏离的离群数据挖掘

8.3.4高维数据的离群数据挖掘

8.3.5基于小波的离群数据挖掘

8.4市场营销离群数据挖掘

8.4.1市场营销离群数据的特点

8.4.2基于分形的市场营销离群数据挖掘模型

思考练习题

第9章数据挖掘语言与工具的选择

9.1数据挖掘语言及其标准化

9.1.1数据挖掘语言的分类

9.1.2分析与评价

9.2数据挖掘的研究热点

9.3数据挖掘工具的选择

9.3.1评价数据挖掘工具的优劣指标

9.3.2通用数据挖掘产品与工具

9.3.3国内的数据挖掘产品与工具

9.3.4数据可视化工具的选择

9.3.5数据挖掘网站与可获得的数据挖掘算法源代码

思考练习题

第10章知识管理与知识管理系统

10.1知识管理

10.1.1知识

10.1.2知识管理的定义

10.1.3有效的知识管理

10.2知识管理系统

10.2.1知识管理共享的条件

10.2.2知识管理共享的困难

10.2.3知识管理的激励机制

10.2.4知识管理的体系结构

思考练习题

附录数据挖掘产品部分信息

参考文献

内容摘要:

  本书是系统阐述数据仓库和数据挖掘的理论、方法与实践的专业书籍,其内容融合了先进的数据库技术、web技术、数理统计技术、人工智能技术、现代的管理思想和系统的科学方法。本书的写作目的并非是要深入到每一种算法是如何编程的具体细节当中,而是以企业中正在从事或将要从事营销管理、经营决策和管理信息系统的深人开发等方面的工作者和IT人员作为对象,为其提供较为详细的信息分析技术、方法与总体思路。本书在组织材料上,力求做到系统性、准确性、完整性、先进性、实用性,把培养读者对信息进行管理和利用的能力作为出发点。本书所涉及的知识点既可促进管理创新,又可使信息技术在管理中得到更广泛深入的应用。要求读者在阅读本书前,应具备数理统计、数据结构、数据库技术和至少一门程序设计语言等方面的知识,还应具有一定的经营管理方面的知识。书中有部分章节难度较大,读者根据实际情况可跳过。本书可作为高等院校信息管理与信息系统专业、计算机应用专业的教材,也可作为从事信息系统建设和计算机应用工作的技术人员、管理人员的参考书,还可作为研究生的教学参考资料。  本书详细阐述了数据仓库与数据挖掘的基本原理,系统而全面地介绍了数据仓库与数据挖掘的概念、作用、算法和应用举例,并且给出了信息分析所涉及到的若干问题及框架。本书介绍了最新的信息分析技术研究成果,如小波分析、Rough分析、蚁群分析、分形技术、Agent、数据挖掘的进化算法、聚类分析、非结构数据的挖掘、离群数据挖掘,但并未详细描述,而将介绍重点放在其应用上,起到抛砖引玉的作用。  本书既可以作为信息管理与信息系统、计算机应用、经济管理等专业的高年级本科生和研究生的教材,又可以作为有关在经济管理领域中应用信息分析技术提高决策人员的参考。

书籍规格:

书籍详细信息
书名数据仓库与数据挖掘技术站内查询相似图书
9787030129345
《数据仓库与数据挖掘技术》pdf扫描版电子书已有网友提供下载资源链接
出版地北京出版单位科学出版社
版次1版印次1
定价(元)语种简体中文
尺寸26装帧平装
页数印数

书籍信息归属:

数据仓库与数据挖掘技术是科学出版社于2004.03出版的中图分类号为 TP311.13 ,TP274 的主题关于 数据库系统-高等学校-教材 ,数据采集-高等学校-教材 的书籍。