出版社:武汉大学出版社
年代:2014
定价:35.0
本书覆盖了数据仓储构建的所有主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。本书给出了一个高性能的参照系统结构。基于此参照系统结构,本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。
第1章 绪论
1.1 数据仓储与数据
1.2 数据仓储的上下文
1.3 数据仓储的分类
1.3.1 拓扑结构/后台分类
1.3.2 组织机构/前端分类
1.3.3 时间性/更新分类
1.3.4 地理特性/位置分类
1.4 数据仓储需满足的要求
1.4.1 功能性要求
1.4.2 信息性要求
1.4.3 操作性要求
1.4.4 经济性要求
1.4.5 安全性要求
1.5 数据仓储方法论
1.5.1 教条的开发方法:自上而下
1.5.2 实用的开发方法:自下而上
1.5.3 有效的方法:居顶不下
1.6 数据仓储构建的方法
1.6.1 老方法:手工ELT法
1.6.2 新方法:工具辅助的ETL法
1.6.3 现代方法:工具辅助的ELT法
1.6.4 未来的方法:基于MGO的ELT法
1.7 构建本书同时构建一数据仓储
第一篇 设计问题、概念和体系结构
第2章 体系结构概要
第3章 预备域
3.1 源应用系统
3.1.1 分析
3.1.2 接口
3.2 预备域
3.2.1 平面文件区
3.2.2 原始袁区
3.2.3 已预备表区
3.2.4 平面文件加载
3.2.5 错误拒绝
3.2.6 变化量识别
3.2.7 列清洗和域完整性的保证
3.2.8 行过滤
3.2.9 操作识别
3.2.1 0最小设计原则
第4章 处理域
4.1 数据
4.1.1 代码数据
4.1.2 对象数据
4.1.3 事件数据
4.2 时间性
4.2.1 历史化
4.2.2 归档
4.2.3 三时维
4.3 数据完整性
4.3.1 参照完整性
4.3.2 实体完整性
4.4 收集
4.4.1 事件数据归档
4.4.2 对象数据历史化
4.4.3 代码数据历史化
4.5 整合
4.5.1 对象标识转换
4.5.2 列数据转换
4.5.3 表模式转换
4.6 完整性保证
4.6.1 参照完整性保证
4.6.2 实体完整性保证
4.7 错误处理
4.8 处理域组件
第5章 存储域
5.1 中央存储区
5.1.1 逻辑数据模型和规范化
5.1.2 物理数据模型和去规范化
5.2 分析展示层
5.3 效能强化区
5.3.1 维度数据模型
5.3.2 特殊结构
5.3.3 模型转换
5.4 使用数据区
5.5 访问控制层
5.6 存储域组件
第6章 基础设施
6.1 进程管理
6.1.1 依赖关系图
6.1.2 事务模型
6.2 元数据管理
6.2.1 元数据
6.2.2 采集、管理和利用
6.3 对象组织
第二篇 组件、算法与技术
第7章 数据预备
7.1 平面文件加载
7.1.1 平面文件加载器
7.1.2 平面文件加载脚本
7.2 变化量识别
7.3 列清洗
7.3.1 缺省值
7.3.2 列清洗器
7.4 行过滤
7.4.1 日志机制
7.4.2 行过滤器
7.5 数据导出
第8章 数据处理
8.1 数据收集
8.1.1 对象建史器
8.1.2 事件归档器
8.1.3 行存储器
8.1.4 行移除器
8.2 数据整合
8.2.1 代理键生成器
8.2.2 键转换器
8.2.3 列数据转换器
8.2.4 关系代数运算符
8.2.5 连接构建器
8.3 参照完整性保证
8.3.1 等待空间管理器
8.3.2 外键处理器
8.3.3 代码表补充器
8.4 实体完整性保证机制
8.4.1 重叠检测器
8.4.2 优先权决定器
8.4.3 双时维重叠的基本组合
8.4.4 基本矩形分解器
8.4.5 重叠消除器
8.4.6 重叠解决举例
8.4.7 分析
……
第9章 数据存储
第三篇 构建范式及元数据驱动通用操作器
第10章 范式基础
第11章 元数据驱动的通用操作器
第四篇 生存环境及更多
第12章 基础设施环境
第13章 方法论与经济学上的分析
第14章 结束语
索引
《基于元数据驱动通用操作器的数据仓储构建》主要关注数据仓储领域的两个有效性挑战。
第一个,即其主要挑战是实践性挑战。与当今的其他构建数据仓储方法相比,采用《基于元数据驱动通用操作器的数据仓储构建》介绍的方法可以实质性地更经济、更快速、更安全地构建数据仓储。第二个有效性挑战是概念性挑战。通过围绕几个基本概念的精确讨论,对数据仓储构建领域的思考和探讨会变得更加有效。
《基于元数据驱动通用操作器的数据仓储构建》覆盖了数据仓储构建的主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。《基于元数据驱动通用操作器的数据仓储构建》给出了一个高性能的参照系统结构。基于此参照系统结构,《基于元数据驱动通用操作器的数据仓储构建》系统地讨论了大量设计议题,包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则,并设计35个易学易做的构建练习。
最后,《基于元数据驱动通用操作器的数据仓储构建》提出的方法已在实际的商业领域进行应用,其成效是对方法的有效性最有力的证实。