Spark核心源码分析与开发实战

Spark核心源码分析与开发实战

王家林, 王雁军, 王家虎, 编著

出版社:机械工业出版社

年代:2016

定价:79.0

书籍简介:

本书共11章。书中第1章首先通过介绍Spark的生态系统和企业应用,使读者能够快速的对Spark技术的生态环境以及Spark的应用现状有个非常直观的了解。随后第2章,通过Spark集群的安装和部署把开发环境快速的搭建起来(对于90%以上想学习Spark技术的人来说,如何搭建集群是其难点之一),方便学习者进行一些简单的实战初体验。第3章,通过Spark API编程动手实战,进一步加深对Spark技术的理解。第4章,深入分析了Spark的工作机制,尤其是Spark的作业和任务调度,是Spark学习的重点和难点。 第5章,简单介绍了运行架构,特意分析了集群默认的Spark Standalone运行架构以及目前公认的最佳的分布式集群资源管理框架YARN的原理和最佳实践。第6章到第9章,详细介绍了基于Spark内核的四大子框架,如Spark Streaming、Spark SQL、Spark GraphX的原理和实例操作,更深一步的理解Spark的“One stack to rule them all”的特性。最后,介绍最著名的分布式内存存储系统Tachyon的架构和使用以及Spark的性能调优。

书籍规格:

书籍详细信息
书名Spark核心源码分析与开发实战站内查询相似图书
丛书名大数据科学丛书
9787111528609
如需购买下载《Spark核心源码分析与开发实战》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位机械工业出版社
版次1版印次1
定价(元)79.0语种简体中文
尺寸26 × 19装帧平装
页数 450 印数 3000

书籍信息归属:

Spark核心源码分析与开发实战是机械工业出版社于2016.1出版的中图分类号为 TP274 的主题关于 数据处理软件 的书籍。