出版社:电子工业出版社
年代:2018
定价:69.0
经过多年的发展,大数据处理技术逐步成熟。作为业界大数据计算的事实标准,Apache Spark系统已经广泛应用于各大企业与研究机构,并形成完整的生态系统。Spark系统包含了SQL、GraphX和R等各个子系统以支持不同业务领域的需求。作为传统关系数据库/数据仓库在大数据场景下的解决方案,Spark SQL已经成为了业界的重要选择方案,同时也成为了Spark开源社区中最为活跃的部分。本书聚焦于Spark SQL系统,对其整体架构、内部各个模块的技术实现机制进行源码级别的剖析,涉及到SQL编译、逻辑计划、物理执行计划、重要查询(如Aggregation与Join等)的技术细节。此外,本书内容上还会结合生产环境的海量应用,分享大量真实开发案例与实践优化经验。
耿嘉安, 著
王家林, 等编著
王家林, 夏阳, 编著
刘驰, 主编
(美) 伊利亚·甘列林 (Ilya Ganelin) , 等著
(美) 彼得·泽斯维奇, (美) 马可·波纳奇, 著
(印) 苏密特·古普塔 (Sumit Gupta) , 著
王家林, 等编著
纪涵, 靖晓文, 赵政达, 著