出版社:清华大学出版社
年代:2019
定价:45.0
本书围绕Spark生态圈相关系统介绍了实时流处理架构Spark。全书共9章,其中第1章主要带大家认识了Spark框架的底层实现语言——Scala。第2章主要讲解了Spark集群环境的搭建。第3-8章主要介绍了弹性分布式数据集RDD、结构化数据文件处理Spark SQL、分布式数据库HBase、分布式订阅消息系统Kafka、实时计算框架Spark Streaming以及机器学习算法库MLib。第9章是一个综合项目,主要通过实时交易数据数据,其目的是教会大家如何利用Spark构建大数据架构并进行开发,同时加深Spark技术的理解。
书籍详细信息 | |||
书名 | Spark大数据分析与实战站内查询相似图书 | ||
丛书名 | 大数据技术与应用丛书 | ||
9787302534327 如需购买下载《Spark大数据分析与实战》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 清华大学出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 45.0 | 语种 | 简体中文 |
尺寸 | 26 × 19 | 装帧 | 平装 |
页数 | 印数 | 1500 |
张伟洋, 著
高彦杰, 倪亚宇, 著
郑述招, 何雪琪, 编著
刘景泽, 编著
(美) 穆罕默德·古勒 (Mohammed Guller) , 著
(美) 卡劳 (Karau,H.) , (美) 肯维尼斯科 (Konwinski,A.) , (美) 温德尔 (Wendell,P.) , (加) 扎哈里亚 (Zaharia,M.) , 著
(美) 文卡特·安卡姆 (Venkat Ankam) , 著
(美) 祖贝尔·纳比 (Zubair Nabi) , 著
(德) 雷扎尔·卡里姆 (Md. Rezaul Karim) , (美) 斯里达尔·阿拉 (Sridhar Alla) , 著