出版社:机械工业出版社
年代:2009
定价:35.0
本书是数据仓库和商业智能领域的又一部经典著作,讲述了整个生命周期各个环节的具体工作,从业务需求的视角,引导读者全面认识下一代数据仓库系统的构架。本书包含了DW2.0详细的定义和描述,此外,书中对数据仓库的结构、内容及其前景进行了介绍。本书主要面向数据仓库的业务分析人员、信息构架师、系统开发人员、项目经理、数据仓库技术人员、数据库管理员、数据建模人员、数据管理员等。
出版者的话
译者序
前言
关于作者
第1章 数据仓库简史及第一代数据仓库
1.1 数据库管理系统
1.2 在线应用
1.3 个人电脑和4GL技术
1.4 蜘蛛网环境
1.5 企业角度的演化
1.6 数据仓库环境
1.7 什么是数据仓库
1.8 整合数据——一个痛苦的经历
1.9 数据的量
1.10 一种不同的开发方法
1.11 演变到DW2.0环境
1.12 数据仓库的商业影响
1.13 数据仓库环境的各种组件
1.13.1 ETL——抽取/转换/装载
1.13.2 ODS——操作数据存储
1.13.3 数据集市
1.13.4 探索仓库
1.14 数据仓库的演变——从企业的角度
1.15 关于数据仓库的其他观念
1.16 主动数据仓库
1.17 联合数据仓库方法
1.18 星状模式方法
1.19 数据集市数据仓库
1.20 建立一个“真正的”数据仓库
1.21 总结
第2章 DW2.0简介
2.1 DW2.0——一种新的范式
2.2 DW2.0——从企业的角度
2.3 数据的生命周期
2.4 设置不同区的原因
2.5 元数据
2.6 数据访问
2.7 结构化数据/非结构化数据
2.8 文本分析
2.9 “废话”
2.10 术语问题
2.11 特定文本/一般文本
2.12 元数据——一个主要组成部分
2.13 本地元数据
2.14 基础技术
2.15 不断变化的业务需求
2.16 DW2.0中的数据流
2.17 数据量
2.18 实用应用程序
2.19 DW2.0和参照完整性
2.20 DW2.0的报告
2.21 总结
第3章 DW2.0组成部分——关于不同区
3.1 交互区
3.2 整合区
3.3 近线区
3.4 归档区
3.5 非结构化处理
3.6 企业用户的观点
3.7 总结
第4章 DW2.0中的元数据
4.1 数据和分析的可复用性
4.2 DW2.0中的元数据
4.3 主动知识库/被动知识库
4.4 主动知识库
4.5 企业元数据
4.6 元数据和记录系统
4.7 分类
4.8 内部分类/外部分类
4.9 归档区元数据
4.10维护元数据
4.11举例说明如何使用元数据
4.12终端用户的观点
4.13总结
第5章 DW2.0技术基础设施的流动性
5.1 技术基础设施
5.2 快速的业务改变
5.3 环状改变
5.4 打破循环
5.5 缩短IT响应时间
5.6 语义暂态、语义常态数据
5.7 语义暂态数据
5.8 语义稳定的数据
5.9 混合语义稳定和不稳定数据
5.10 分离语义稳定和不稳定数据
5.11 减缓业务的改变
5.12 创建数据快照
5.13 历史记录
5.14 数据划分
5.15 终端用户的观点
5.16 总结
第6章 DW2.0的方法与途径
6.1 螺旋式方法——主要特点综述
6.2 七流法——总览
6.3 企业参考模型流
6.4 企业知识协调流
6.5 信息工厂开发流
6.6 数据归档定位流
6.7 数据纠正流(旧称数据清理流)
6.8 基础设施流
6.9 整体信息质量管理流
6.10 总结
第7章 统计处理和DW2.0
7.1 两种类型的处理
7.2 使用统计分析
7.3 比较的完整性
7.4 启发式分析
7.5 冻结的数据
7.6 探索型处理
7.7 分析频率
7.8 探索工具
7.9 探索型处理数据的来源
7.10 更新探索数据
7.11 基于项目的数据
7.12 数据集市和探索工具
7.13 数据回流
7.14 在内部使用探索数据
7.15 企业分析员的观点
7.16 总结
第8章 数据模型与DW2.0
8.1 智能路线图
8.2 数据模型和企业
8.3 整合范围
8.4 区别粒状型数据和概括型数据
8.5 数据模型的层次
8.6 数据模型和交互区
8.7 企业数据模型
8.8 模型转化
8.9 数据模型和非结构化数据
8.10 企业用户的观点
8.11 总结
第9章 监视DW2.0环境
9.1 监视DW2.0环境
9.2 事务监视
9.3 数据质量监视
9.4 数据仓库监视
9.5 事务监视——响应时间
9.6 高峰期处理
9.7 ETL数据质量监视
9.8 数据仓库监视工具
9.9 休眠数据
9.10 企业用户的观点
9.11 总结
第10章 DW2.0与安全
10.1 保护访问数据
10.2 加密技术
10.3 缺点
10.4 防火墙
10.5 使数据脱机
10.6 限制性加密
10.7 直接转储
10.8 数据仓库监视
10.9 检测攻击
10.10 近线区数据的安全
10.11 企业用户的观点
10.12 总结
第11章 时间相关数据
11.1 DW2.0中的所有数据——与时间相关
11.2 交互区中的时间相关性
11.3 DW2.0其他部分中的数据相关
11.4 整合区中的事务处理
11.5 离散数据
11.6 连续时间段数据
11.7 一个记录序列
11.8 非重叠记录集
11.9 开始和结束一个记录序列
11.10 数据的连续性
11.11 时间瓦解数据
11.12 归档区中的时间相关变量
11.13 企业用户的观点
11.14 总结
第12章 DW2.0的数据流
12.1 贯穿整个构架的数据流
12.2 进入交互区
12.3 ETL的角色
12.4 进入整合区的数据流
12.5 进入近线区的数据流
12.6 进入归档区的数据流
12.7 下降的数据访问概率
12.8 数据的异常流
12.9 企业用户的观点
12.10 总结
第13章 ETL处理与DW2.0
13.1 转换数据状态
13.2 ETL适用范围
13.3 应用数据到企业数据的转换
13.4 ETL工作模式
13.5 源和目标
13.6 ETL映射
13.7 状态转换——实例
13.8 更加复杂的转换
13.9 ETL与吞吐量
13.10 ETL与元数据
13.11 ETL与审核记录
13.12 ETL与数据质量
13.13 创建ETL
13.14 代码创建或参数驱动的ETL
13.15 ETL与丢弃
13.16 变化数据的捕获
13.17 ELT
13.18 企业用户的观点
13.19 总结
第14章 DW2.0与粒度管理器
14.1 粒度管理器
14.2 提高粒度级别
14.3 过滤数据
14.4 粒度管理器的功能
14.5 本地与第三方粒度管理器的比较
14.6 粒度管理器的并行化
14.7 作为副产品的元数据
14.8 企业用户眼中的粒度管理器
14.9 总结
第15章 DW2.0和性能
15.1 好的性能——DW2.0的基石
15.2 在线响应时间
15.3 分析响应时间
15.4 数据的流动
15.5 队列
15.6 启发式处理
15.7 分析的生产率和响应时间
15.8 索引
15.9 移除休眠数据
15.10 终端用户培训
15.11 监控环境
15.12 容量规划
15.13 元数据
15.14 批处理的并行
15.15 事务处理的并行
15.16 工作负荷量的管理
15.17 数据集市
15.18 探索工具
15.19 将事务分为不同的类
15.20 服务标准协议
15.21 保护交互区
15.22 数据分割
15.23 选择合适的硬件
15.24 区分“农民”和“探索者”
15.25 数据的物理分组
15.26 检查自动产生的代码
15.27 企业用户的观点
15.28 总结
第16章 迁移
16.1 房屋和城市
16.2 在一个完美情况中迁移
16.3 完美情况几乎永远不会发生
16.4 增量式添加组件
16.5 添加归档区
16.6 建立企业元数据
16.7 建立元数据基础结构
16.8 “吞没”源系统
16.9 作为缓冲器的ETL
16.10 迁移到非结构化的环境
16.11 企业用户的观点
16.12 总结
第17章 成本验证和DW2.0
17.1 DW2.0的成本值吗
17.2 宏观层次的价值验证
17.3 微观层次的价值验证
17.4 公司B拥有DW2.0
17.5 生成新的分析
17.6 按步骤执行
17.7 总成本是多少
17.8 考虑公司B
17.9 考虑DW2.0的成本
17.10 信息的现实情况
17.11 DW2.0真正的经济效益
17.12 信息的时间价值
17.13 整合的价值
17.14 历史信息
17.15 第一代DW和DW2.0——在经济效益上的比较
17.16 企业用户的观点
17.17 总结
第18章 DW2.0中的数据质量
18.1 DW2.0中的数据质量工具集
18.2 数据分析工具和逆向工程数据模型
18.3 数据模型种类
18.4 数据分析不一致对自上而下建模的挑战
18.5 总结
第19章 DW2.0和非结构化数据
19.1 DW2.0和非结构化数据
19.2 文本读取
19.3 在哪里进行文本分析处理
19.4 文本整合
19.5 简单编辑
19.6 无用词
19.7 同义词替换
19.8 同义词串联
19.9 同形异义解析
19.10 建立主题
19.11 外部术语表/分类法
19.12 分词
19.13 替换拼写
19.14 跨语言的文本
19.15 直接搜索
19.16 间接搜索
19.17 术语
19.18 半结构化数据/值=名称数据
19.19 准备数据所需的技术
……
第20章 DW2.0与记录系统
第21章 多方面的话题
第22章 DW2.0环境中的处理
第23章 管理DW2.0环境
《DW2.0:下一代数据仓库的构架》是数据仓库和商业智能领域的又一部经典著作,讲述了整个生命周期各个环节的具体工作,从业务需求的视角,引导读者全面认识下一代数据仓库系统的构架。《DW2.0:下一代数据仓库的构架》包含了DW20详细的定义和描述,此外,书中对数据仓库的结构、内容及其前景进行了介绍。
《DW2.0:下一代数据仓库的构架》主要面向数据仓库的业务分析人员、信息构架师、系统开发人员、项目经理、数据仓库技术人员、数据库管理员、数据建模人员、数据管理员等。
第二代数据仓库已经来临!在《DW2.0:下一代数据仓库的构架》中,数据仓库之父向有较强信息需求的公司展示了-些技术和构架上的可能性,是数据仓库和商业智能领域的又一部经典著作。
《DW2.0:下一代数据仓库的构架》包含了DW2.0详细的定义和描述,讨论了整个生命周期各个环节的具体工作,从业务需求的视角引导读者全面认识下一代数据仓库系统的构架。
《DW2.0:下一代数据仓库的构架》特色
●对租赁,技术投资、遗留系统的处理等做出正确的决策提供了具体的信息。
●充分地解释了在数据仓库环境中非结构化数据的整合。
●彻底地讨论了DW2.0的所有相关问题,包括非结构化数据、业务元数据、统计处理和探索处理、安全、粒度和系统性能。
●对从DW1.0顺利迁移到DW2.0提供了专家级建议。
书籍详细信息 | |||
书名 | DW2.0:下一代数据仓库的构架站内查询相似图书 | ||
丛书名 | 计算机科学丛书 | ||
9787111288268 如需购买下载《DW2.0:下一代数据仓库的构架》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 机械工业出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 35.0 | 语种 | 简体中文 |
尺寸 | 26 × 0 | 装帧 | 平装 |
页数 | 300 | 印数 | 3000 |
(美) 伊蒙 (Immon,W.I.) , 著
(美) 荫蒙 (Inmon,W.H.) , 著
(美) 波尼阿 (Ponniah,P.) , 著
(美) 依默霍夫 (Imhoff,C.) 等, 著
(意) 戈尔法雪利 (Golfarelli,M.) , 等著
(美) 克里什·克里希南 (Krish Krishnan) , 著
(美) 斯韦格特 (Sweiger,M.) , 著
(美) 拉伯格 (Laberge,R.) , 著
武森等, 著