出版社:电子工业出版社
年代:2013
定价:69.0
本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入NoSQL数据库;系统篇主要介绍了各种类型NoSQL数据库基本知识;应用篇对国内外知名公司在利用NoSQL数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及NoSQL数据库的基本知识做了清晰的阐述,有助于帮助读者整理思路,了解需求,并更有针对性、有选择的深入学习相关知识。
第1章 概论1.1 引子1.2 大数据挑战1.3 大数据的存储和管理1.3.1 并行数据库1.3.2 NoSQL数据管理系统1.3.3 NewSQL数据管理系统1.3.4 云数据管理1.4 大数据的处理和分析1.5 小结参考文献理 论 篇第2章 数据一致性理论2.1 CAP理论2.2 数据一致性模型2.3 ACID与BASE2.4 数据一致性实现技术2.4.1 Quorum系统NRW策略2.4.2 两阶段提交协议2.4.3 时间戳策略2.4.4 Paxos2.4.5 向量时钟2.5 小结参考文献第3章 数据存储模型3.1 总论3.2 键值存储3.2.1 Redis3.2.2 Dynamo3.3 列式存储3.3.1 Bigtable3.3.2 Cassandra与HBase3.4 文档存储3.4.1 MongoDB3.4.2 CouchDB3.5 图形存储3.5.1 Neo4j3.5.2 GraphDB3.6 本章小结参考文献第4章 数据分区与放置策略4.1 分区的意义4.1.1 为什么要分区4.1.2 分区的优点4.2 范围分区4.3 列表分区4.4 哈希分区4.5 三种分区的比较4.6 放置策略4.6.1 一致性哈希算法4.6.2 容错性与可扩展性分析4.6.3 虚拟节点4.7 小结参考文献第5章 海量数据处理方法5.1 MapReduce简介5.2 MapReduce数据流5.3 MapReduce数据处理5.3.1 提交作业5.3.2 初始化作业5.3.3 分配任务5.3.4 执行任务5.3.5 更新任务执行进度和状态5.3.6 完成作业5.4 Dryad简介5.4.1 DFS Cosmos介绍5.4.2 Dryad执行引擎5.4.3 DryadLINQ解释引擎5.4.4 DryadLINQ编程5.5 Dryad数据处理步骤5.6 MapReduce vs Dryad5.7 小结参考文献第6章 数据复制与容错技术6.1 海量数据复制的作用和代价6.2 海量数据复制的策略6.2.1 Dynamo的数据库复制策略6.2.2 CouchDB的复制策略6.2.3 PNUTS的复制策略6.3 海量数据的故障发现与处理6.3.1 Dynamo的数据库的故障发现与处理6.3.2 CouchDB的故障发现与处理6.3.3 PNUTS的故障发现与处理6.4 小结参考文献第7章 数据压缩技术7.1 数据压缩原理7.1.1 数据压缩的定义7.1.2 数据为什么可以压缩7.1.3 数据压缩分类7.2 传统压缩技术7.2.1 霍夫曼编码7.2.2 LZ77算法7.3 海量数据带来的3V挑战7.4 Oracle混合列压缩7.4.1 仓库压缩7.4.2 存档压缩7.5 Google数据压缩技术7.5.1 寻找长的重复串7.5.2 压缩算法7.6 Hadoop压缩技术7.6.1 LZO简介7.6.2 LZO原理7.7 小结参考文献第8章 缓存技术8.1 分布式缓存简介8.1.1 分布式缓存的产生8.1.2 分布式缓存的应用8.1.3 分布式缓存的性能8.1.4 衡量可用性的标准8.2 分布式缓存的内部机制8.2.1 生命期机制8.2.2 一致性机制8.2.3 直读与直写机制8.2.4 查询机制8.2.5 事件触发机制8.3 分布式缓存的拓扑结构8.3.1 复制式拓扑8.3.2 分割式拓扑8.3.3 客户端缓存拓扑8.4 小结参考文献系 统 篇第9章 key-value数据库9.1 key-value模型综述9.2 Redis9.2.1 Redis概述9.2.2 Redis下载与安装9.2.3 Redis入门操作9.2.4 Redis在业内的应用9.3 Voldemort9.3.1 Voldemort概述9.3.2 Voldemort下载与安装9.3.3 Voldemort配置9.3.4 Voldemort开发介绍9.4 小结参考文献第10章 Column-Oriented数据库10.1 Column-Oriented数据库简介10.2 Bigtable数据库10.2.1 Bigtable数据库简介10.2.2 Bigtable数据模型10.2.3 Bigtable基础架构10.3 Hypertable数据库10.3.1 Hypertable简介10.3.2 Hypertable安装10.3.3 Hypertable架构10.3.4 基本概念和原理10.3.5 Hypertable的查询10.4 Cassandra数据库10.4.1 Cassandra简介10.4.2 Cassandra配置10.4.3 Cassandra数据库的连接10.4.4 Cassandra集群机制10.4.5 Cassandra的读/写机制10.5 小结参考文献第11章 文档数据库11.1 文档数据库简介11.2 CouchDB数据库11.2.1 CouchDB简介11.2.2 CouchDB安装11.2.3 CouchDB入门11.2.4 CouchDB查询11.2.5 CouchDB的存储结构11.2.6 SQL和CouchDB11.2.7 分布式环境中的CouchDB11.3 MongoDB数据库11.3.1 MongoDB简介11.3.2 MongoDB的安装11.3.3 MongoDB入门11.3.4 MongoDB索引11.3.5 SQL与MongoDB11.3.6 MapReduce与MongoDB11.3.7 MongoDB与CouchDB对比11.4 小结参考文献第12章 图存数据库12.1 图存数据库的由来及基本概念12.1.1 图存数据库的由来12.1.2 图存数据库的基本概念12.2 Neo4j图存数据库12.2.1 Neo4j简介12.2.2 Neo4j使用教程12.2.3 分布式Neo4j——Neo4j HA12.2.4 Neo4j工作机制及优缺点浅析12.3 GraphDB12.3.1 GraphDB简介12.3.2 GraphDB的整体架构12.3.3 GraphDB的数据模型12.3.4 GraphDB的安装12.3.5 GraphDB的使用12.4 OrientDB12.4.1 背景12.4.2 OrientDB是什么12.4.3 OrientDB的原理及相关技术12.4.4 Windows下OrientDB的安装与使用12.4.5 相关Web应用12.5 三种图存数据库的比较12.5.1 特征矩阵12.5.2 分布式模式及应用比较12.6 小结参考文献第13章 基于Hadoop的数据管理系统13.1 Hadoop简介13.2 HBase13.2.1 HBase体系结构13.2.2 HBase数据模型13.2.3 HBase的安装和使用13.2.4 HBase与RDBMS13.3 Pig13.3.1 Pigr的安装和使用13.3.2 Pig Latin语言13.3.3 Pig实例
本书从理论、系统、应用三个方面详细讲述了大数据的技术知识,并针对NoSQL数据库技术做了深入的分享,是学习大数据技术的地图、指南手册。帮助读者跳出迷局,厘清思路,系统地做好相关知识储备,拥抱大数据时代! 本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入NoSQL数据库;系统篇主要介绍了各种类型NoSQL数据库基本知识;应用篇对国内外知名公司在利用NoSQL数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及NoSQL数据库的基本知识做了清晰的阐述,有助于帮助读者整理思路,了解需求,并更有针对性、有选择的深入学习相关知识。
书籍详细信息 | |||
书名 | 大数据挑战与NoSQL数据库技术站内查询相似图书 | ||
丛书名 | 大数据丛书 | ||
9787121196607 如需购买下载《大数据挑战与NoSQL数据库技术》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 电子工业出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 69.0 | 语种 | 简体中文 |
尺寸 | 23 × 18 | 装帧 | 平装 |
页数 | 440 | 印数 |