出版社:机械工业出版社
年代:2016
定价:59.0
本书致力于Spark内核的深入解析,带领读者掌握Spark内核的各个关键知识点。具体内容由详细讲述RDD提供的功能以及内部实现的机制开始,通过源码引导读者深入理解Spark的集群部署的内部机制、Spark内部调度的机制、Executor的内部机制、Shuffle的内部机制,进而讲述Tungsten的内部机制,接着又进一步深入分析了Spark Streaming的内部机制。本书的最后部分,是任何Spark应用者都非常关注的Spark性能调优的内容。本书可以使读者对Spark内核有更深入彻底的理解,从而实现对Spark系统深度调优、Spark生产环境下故障的定位和排除、Spark的二次开发和系统高级运维。本书的每章开篇均有重点介绍以引导读者有目的有重点的阅读或查阅。本书适合于对大数据开发有兴趣的在校学生。同时,对有分布式计算框架应用经验的人员,本书也可以作为Spark源码解析的参考书籍。
吕云翔, 编著
朱锋, 张韶全, 黄明, 著
耿嘉安, 著
(加) 霍尔顿·卡劳 (Holden Karau) , (加) 雷切尔·沃伦 (Rachel Warren) , 著
刘驰, 主编
(美) 伊利亚·甘列林 (Ilya Ganelin) , 等著
李国辉, 时瑞鹏, 主编
(美) 彼得·泽斯维奇, (美) 马可·波纳奇, 著
(印) 苏密特·古普塔 (Sumit Gupta) , 著