数据仓库与数据挖掘

数据仓库与数据挖掘

廖开际, 主编

出版社:北京大学出版社

年代:2008

定价:28.0

书籍简介:

本书是一本较系统地介绍数据仓库与数据挖掘的理论体系和应用的图书。本书总的指导思想是在掌握基本知识和基本理论的基础上,更强调实际应用能力的培养。全书力求深入浅出、通过通俗的语言及案例分析介绍了数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理(OLAP)应用等方面对数据仓库做了较为详细地介绍。从数据挖掘的定义、数据预处理、常用数据挖掘算法等方面对数据挖掘的基本知识和算法等理论做了介绍。本书强调数据仓库和挖掘工具的应用,重点介绍了SQL Sserver 2005数据仓库和数据挖掘工具的应用。在附录中还详细地介绍了一个优秀而又简单好用的数据挖掘工具——Weka,该工具可作为读者学习数据挖掘时的实验工具。

书籍目录:

第1章 企业数据资源管理 1.1 数据资源的概念 1.1.1 企业资源 1.1.2 数据资源 1.1.3 数据资源管理及其发展历程 1.2 数据资源管理的意义 1.2.1 信息系统进入成熟阶段的重要标志 1.2.2 解决企业内部数据不一致问题的根本途径 1.2.3 数据资源的管理和应用是取得竞争优势的关键 1.3 信息资源管理的相关技术 1.3.1 数据资源管理的技术框架 1.3.2 技术框架中的构成要素 1.3.3 技术框架中各部分的关联 1.4 企业通过数据仓库与数据挖掘获得竞争优势 本章小结

第1章 企业数据资源管理 1.1 数据资源的概念 1.1.1 企业资源 1.1.2 数据资源 1.1.3 数据资源管理及其发展历程 1.2 数据资源管理的意义 1.2.1 信息系统进入成熟阶段的重要标志 1.2.2 解决企业内部数据不一致问题的根本途径 1.2.3 数据资源的管理和应用是取得竞争优势的关键 1.3 信息资源管理的相关技术 1.3.1 数据资源管理的技术框架 1.3.2 技术框架中的构成要素 1.3.3 技术框架中各部分的关联 1.4 企业通过数据仓库与数据挖掘获得竞争优势 本章小结 思考与练习第2章 数据仓库的概念与结构 2.1 数据仓库的概念 2.1.1 数据仓库的定义 2.1.2 数据仓库的特征 2.1.3 数据集市 2.2 数据仓库系统 2.2.1 数据源 2.2.2 数据仓库管理层 2.2.3 数据仓库工具集 2.3 数据仓库中的数据组织 2.3.1 粒度的概念 2.3.2 面向主题的数据组织 2.3.3 数据分割 2.3.4 元数据的管理 本章小结 思考与练习第3章 数据仓库的设计与开发 3.1 数据仓库的开发过程及特点 3.1.1 数据仓库开发的生命周期 3.1.2 数据仓库开发的特点 3.1.3 数据仓库设计的主要内容 3.2 数据模型设计 3.2.1 概念模型设计 3.2.2 逻辑模型设计 3.2.3 物理模型设计 3.3 数据仓库的粒度设计 3.3.1 设计步骤 3.3.2 设计原则 3.4 创建数据仓库的基本步骤 3.4.1 建立运营环境文档 3.4.2 选择数据仓库的实现技术 3.4.3 设计数据仓库模型 3.4.4 创建数据准备区 3.4.5 创建数据仓库数据库 3.4.6 从操作型系统中抽取数据 3.4.7 清理和转换数据 3.4.8 将数据装入数据仓库数据库 3.4.9 准备显示信息 3.4.10 将数据分发到数据集市 本章小结 思考与练习第4章 联机分析处理 4.1 OLAP的基本概念 4.1.1 OLAP的发展背景 4.1.2 联机分析处理是数据仓库系统的一个应用 4.2 OLAP与多维分析 4.2.1 OLAP的一些基本概念 4.2.2 理解数据立方 4.2.3 OLAP的基本分析操作 4.3 OLAP的分类 4.3.1 ROLAP 4.3.2 MOLAP 4.3.3 HOLAP 4.4 OLAP的特性与不足 4.4.1 OLAP的特性 4.4.2 OLAP的不足 4.5 SQL Servei 2005统一维度模型 4.5.1 结构 4.5.2 优点 本章小结 思考与练习第5章 数据挖掘概述 5.1 数据挖掘技术的由来 5.1.1 信息爆炸但知识贫乏 5.1.2 支持数据挖掘技术的基础 5.1.3 从商业数据到商业信息的进化 5.1.4 数据挖掘逐渐演变的过程 5.2 数据挖掘的定义 5.2.1 技术角度的定义 5.2.2 商业角度的定义 5.2.3 数据挖掘与传统分析方法的区别 5.2.4 数据挖掘和数据仓库 5.2.5 数据挖掘和OLAP 5.2.6 数据挖掘、机器学习和统计 5.3 数据挖掘发现的知识类型 5.3.1 广义知识 5.3.2 关联知识 5.3.3 分类知识 5.3.4 预测知识 5.3.5 偏差知识 5.4 数据挖掘流程 5.4.1 知识发现过程 5.4.2 数据挖掘对象 5.4.3 数据挖掘任务 5.4.4 数据挖掘分类 5.4.5 数据预处理 5.5 数据挖掘的方法和技术 5.5.1 信息论方法 5.5.2 集合论方法 5.5.3 神经网络方法 5.5.4 遗传算法 5.5.5 模糊数学 5.5.6 公式发现 5.5.7 可视化技术 5.5.8 知识表示 本章小结 思考与练习第6章 数据预处理 6.1 数据预处理的目的及方法 6.1.1 原始数据中存在的问题 6.1.2 数据预处理的常用方法 6.2 数据清理 6.2.1 处理空缺值 6.2.2 噪声数据的处理 6.3 数据集成 6.3.1 模式匹配 6.3.2 数据冗余 6.3.3 数据冲突 6.4 数据变换 6.5 数据归约 6.5.1 数据立方体聚集 6.5.2 维归约 6.5.3 数据压缩 6.5.4 数值归约 6.5.5 离散化和概念分层 本章小结 思考与练习第7章 数据挖掘中的常用算法 7.1 Apriori算法 7.1.1 基本原理 7.1.2 Apriori算法的基本思想与分析 7.1.3 从频繁项集产生关联规则 7.2 决策树算法 7.2.1 信息论的基本原理 7.2.2 ID3算法 7.2.3 树剪枝 7.2.4 由决策树提取分类规则 7.3 神经网络算法 7.3.1 神经网络的基本原理 7.3.2 反向传播模型 7.3.3 定义神经网络拓扑结构 7.3.4 神经网络的工作过程 7.4 聚类分析 7.4.1 聚类分析的概念 7.4.2 聚类分析中的数据类型 7.4.3 几种主要的聚类分析方法 7.4.4 K means聚类分析算法 本章小结 思考与练习第8章 SQL Server数据仓库与数据挖掘工具及其应用 8.1 SQL Server 2005的功能构架 8.2 SQL Server数据仓库设计与数据挖掘准备 8.2.1 SQL Server数据仓库创建思路 8.2.2 SQL Server数据挖掘过程 8.2.3 案例数据准备 8.3 SQL Server集成服务 8.3.1 SQL Server集成服务的作用 8.3.2 控制流 8.3.3 数据流 8.3.4 设计和使用ETL 8.4 SQL Server分析服务 8.4.1 创建Analysis Services项目 8.4.2 定义数据源 8.4.3 定义数据源视图 8.4.4 用Analysis Services创建维与多维数据集 8.4.5 部署Analysis Services项目 8.5 SQL Server中的数据挖掘工具与应用 8.6 SQL Server报表服务 8.6.1 创建报表 8.6.2 使用报表 本章小结 思考与练习附录A 一个简易的数据挖掘工具——Weka参考文献

内容摘要:

本书比较系统地介绍数据仓库与数据挖掘的理论体系和应用。本书总的指导思想是在掌握基本知识和基本理论的基础上,强调实际应用能力的培养。全书力求深入浅出,通过通俗的语言及案例分析,介绍数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理应用等方面对数据仓库进行较为详细的介绍;从数据挖掘的定义、数据预处理、数据挖掘中的常用算法等方面对数据挖掘的基本知识和算法等理论进行介绍。本书强调数据仓库和数据挖掘工具的应用,重点介绍SQL Server 2005数据仓库和数据挖掘工具的应用。附录A详细介绍一个简易的数据挖掘工具——Weka,该工具可作为读者学习数据挖掘时的实验工具。 本书可作为普通高等学校电子商务、信息管理、计算机应用及其他相关专业的本科教材,也可作为经贸、管理类专业的研究生教材,以及各类管理人员的培训与自学用书。

编辑推荐:

丛书特点: 1.突出创造能力和创新意识。关注专业背景,拓宽理论基础、强调计算机应用与网络技术应用技能和专业知识,着眼于增强教学内容的实际和应用性。 2.符合各学校专业课程设置要求。以高等教育的培养目标为依据,注重教材的科学性、实用性和通用性,准确定位教材在人才培养过程中的地位和作用,满足各院校教学需求。 3.面向就业,突出应用。作者多为在电子商务与信息管理专业教学方面具有丰富经验的一线教师和研究人员,准确把握就业市场动向,注重培养学生实际操作能力。 4.合理选材和编排。传统内容与现代内容合理融合,补充了大量新知识、新技术和新成果;遵循最新准则或规范,根据教学内容、学时、教学大纲的要求,突出重点和难点。 5.侧重案例教学。对大量当前最新典型案例进行分析讲解,理论联系实际,通俗易懂。  本书共分为8章和1个附录。第1章介绍企业数据资源管理,旨在说明数据仓库与数据挖掘是企业数据资源管理的高级阶段,也是必然趋势。同时也介绍了数据仓库与数据挖掘能为企业做什么。第2章介绍数据仓库的概念与结构,读者在学完本章后可以明白什么是数据仓库,数据仓库是怎样构成的。第3章介绍数据仓库的设计与开发,在学完本章后,读者可以根据需求设计自己的数据仓库,并逐步地建立自己的数据仓库(或数据集市)。第4章介绍数据仓库的一个重要应用——联机分析处理,读者可以理解多维数据分析的方法。第5章介绍数据挖掘概述,在学完本章后,读者应能明白数据挖掘能做什么,有些什么方法。第6章介绍数据挖掘中的一个重要的也是工作量最大的一个环节——数据预处理,在学完本章后,读者应明白为什么要进行预处理,预处理的各种方法,并学会怎样进行数据的预处理。第7章介绍数据挖掘中的常用算法,读者可以理解这些算法的基本思想,掌握典型算法的应用。第8章结合一个实际案例介绍SQL Server 2005数据仓库与数据挖掘工具及其应用。建议读者在本章学习的基础上,自己深入钻研SQL Server 2005的数据仓库与数据挖掘工具。本书适合作为非计算机专业的教材及自学读物。

书籍规格:

书籍详细信息
书名数据仓库与数据挖掘站内查询相似图书
丛书名21世纪全国应用型本科计算机系列实用规划教材
9787301143131
如需购买下载《数据仓库与数据挖掘》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位北京大学出版社
版次1版印次1
定价(元)28.0语种简体中文
尺寸26装帧平装
页数印数

书籍信息归属:

数据仓库与数据挖掘是北京大学出版社于2008.10出版的中图分类号为 TP311.13 ,TP274 的主题关于 数据库系统-高等学校-教材 ,数据采集-高等学校-教材 的书籍。