大数据架构师指南
大数据架构师指南封面图

大数据架构师指南

朱进云, 陈坚, 王德政, 编著

出版社:清华大学出版社

年代:2016

定价:48.0

书籍简介:

本书将按照大数据技术架构的层次,逐层展开,帮助读者建立系统的大数据知识架构,并能够利用此知识架构进行思考。本书将采用独立专题的模式,系统地说明该专题所涉及的技术脉络,以及该架构背后深层次的技术思考与思想。本书假设读者已经具备一定的IT基础知识,但大数据方面的知识不系统。本书不打算堆砌开源相关的源代码与工具界面,但力求表达对相关技术路线的观点与看法,并帮助读者将相关领域的技术思维系统化。

作者介绍:

陈坚,高级工程师,1995年加入中兴通讯,现任中兴通讯中心研究院副院长,先后主持会议电视、核心网、统一网管平台、大数据平台系统架构设计及经营工作,多次获得国家、省市科技进步奖。具有近20年的电信行业从业经验,积累了深厚的技术专业知识和丰富的管理经验。

书籍目录:

第一部分 大数据架构师入门

第1章 大数据概述 3

1.1 什么是大数据 4

1.2 大数据的本质 6

1.3 大数据技术当前状态 8

1.4 大数据的技术发展趋势 11

第2章 大数据项目常见场景 13

2.1 实验型部署场景 14

2.2 中小型部署场景 16

2.3 大型部署场景 19

第3章 大数据方案关键因素 23

3.1 数据存储规模与数据类型 24

3.2 数据来源与数据质量 25

3.3 业务特征 26

3.4 经济可行性 27

3.5 运维管理要求 28

3.6 安全性要求 29

3.7 部署要求 31

3.8 系统边界 32

3.9 约束条件 34

3.10 要点回顾 34

第二部分 大数据架构师基础

第4章 Hadoop基础组件 39

4.1 Hadoop简介 40

4.2 Hadoop版本演进 41

4.3 Hadoop2.0生态系统简介 42

4.4 Hadoop分布式文件系统HDFS 43

4.5 Hadoop统一资源管理框架YARN 48

4.6 Hadoop分布式计算框架MapReduce 52

4.7 Hadoop分布式集群管理系统ZooKeeper 57

第5章 Hadoop其他常用组件 61

5.1 Hadoop数据仓库工具Hive 62

5.2 Hadoop分布式数据库 HBase 65

5.3 Hadoop实时流处理引擎 Storm 70

5.4 Hadoop交互式查询引擎 Impala 74

5.5 其他常用组件 78

第6章 Spark内存计算框架 83

6.1 内存计算与Spark 84

6.2 Spark的主要概念 86

6.3 Spark核心组件介绍 96

6.4 Spark与Hadoop之间的关系 100

6.5 要点回顾 104

第7章大数据中间件层 105

7.1 中间件层简介 106

7.2 中间件层产品介绍 107

7.3 中间件层的应用 121

7.4 中间件层的发展 124

7.5 要点回顾 128

第8章大数据分析 129

8.1 数据时代 131

8.2 先进分析 133

8.3 架构与平台 136

8.4 数据分析流程 140

8.5 要点回顾 143

第9章可视化技术 145

9.1 可视化技术引言 146

9.2 什么是数据可视化 147

9.3 数据可视化设计 151

9.4 数据可视化的发展趋势 160

9.5 要点回顾 161

第10章大数据安全 163

10.1 安全体系 164

10.2 大数据系统安全 168

10.3 要点回顾 180

第11章大数据管理 181

11.1 数据管理的范围和定义 182

11.2 开源软件的管理能力 183

11.3 国内主流管理 187

11.4 大数据管理展望 195

11.5 要点回顾 195

第三部分大数据架构师实践

第12章大数据项目实践 199

12.1 大数据项目架构关键步骤 201

12.2 架构师实践思考 213

第13章大数据部署实践 217

13.1 中兴通讯DAP大数据平台功能和架构 218

13.2 DAP平台特点 219

13.3 某银行成功案例 220

第四部分 大数据架构师拓展

第14章分布式系统与大数据的关系 229

14.1 分布式系统概述 230

14.2 分布式系统关键协议和算法概述 237

14.3 分布式系统和大数据 241

第 15 章数据库系统与大数据的关系 245

15.1 数据库系统的历史 246

15.2 各类系统求同存异 258

15.3 大数据的发展展望 259

第16章云计算与大数据的关系 261

16.1 虚拟化概述 262

16.2 OpenStack云管理架构实现 267

16.3 大数据基于云计算IAAS部署的探讨 274

后记 277

内容摘要:

如果你是一名IT工程师,CTO希望你在一周内提交一份公司未来IT系统基础架构的初步建议; 如果你是一位IT营销人员,客户需要你在一周内向他汇报未来大数据系统的大致技术方向; …… 在这个信息严重过剩的时代,一周内从浩渺的技术细节的海洋中抓住关键的技术脉络,并进一步提出有一定理论依据的技术思考,这几乎是不可能完成的任务。您是否想过阅读一本关于大数据的图书帮助解决如上问题? 浩如烟海的大数据领域图书可以大致归纳为三类:第一类是描述大数据的应用前景与社会意义;第二类是研讨大数据作为一个大型IT系统的系统架构与技术架构;第三类是研讨大数据领域的具体技术,例如HADOOP相关的编程等。对于需要快速掌握大数据系统技术脉络,或者是需要对未来IT系统做系统思考的技术工作者来说,最需要的是第二类图书所提供的系统化知识。但目前业界大数据相关的书籍与资料,大多是第一类与第三类,第二类非常稀少,以至于某些希望开展大数据课程教学的高校难以找到合适的教材与参考数据。通过阅读本书,您将可以迅速建立大数据技术架构相关的知识与脉络,而不是迷失在浩如烟海的知识细节中。本书的目的就是为了帮助读者在最短的时间内,系统地把握大数据相关的技术框架,建立系统架构级别的技术思考能力与原则。本书适用于企业的IT与大数据的从业人员,IT与大数据相关的销售人员,企业的首席技术官(CTO)、首席信息官(CIO),由于本书在大数据知识具备系统性,也可以作为高校大数据方面课程的教材或辅导书。

编辑推荐:

中兴大数据平台DAP团队诚意之作
大数据实践指南
结合案例
总结大数据建设实践中的经验与知识

书籍规格:

书籍详细信息
书名大数据架构师指南站内查询相似图书
9787302435167
如需购买下载《大数据架构师指南》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位清华大学出版社
版次1版印次1
定价(元)48.0语种简体中文
尺寸26 × 19装帧平装
页数印数 4000

书籍信息归属:

大数据架构师指南是清华大学出版社于2016.出版的中图分类号为 TP274-62 的主题关于 数据处理-指南 的书籍。