出版社:清华大学出版社
年代:2018
定价:69.0
全书分为三篇,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL 实例,使得读者能够掌握一些Spark SQL的入门操作,对Spark RDD、DataFrame和DataSet有了一定的了解,以及熟悉了 DataFrame 各种操作。第三篇讲解了基于WIFI探针的商业大数据分析的Spark SQL项目 具体源码分析,实例中包含 数据采集,预处理,存储,利用Spark SQL 挖掘数据,一步一步带领读者学习Spark SQL 强大便易的数据挖掘功能。
(美) 比尔·尚贝尔 (Bill Chambers) , (美) 马特·扎哈里亚 (Matei Zaharia) , 著
(美) 比尔·钱伯斯 (Bill Chambers) , (美) 马太·扎哈里亚 (Matei Zaharia) , 著
(美) 艾哈迈德·谢里夫 (Ahmed Sherif) , (美) 阿姆里斯·拉文德拉 (Amrith Ravindra) , 著
朱锋, 张韶全, 黄明, 著
余辉, 著
陈欢, 林世飞, 著
刘驰, 主编
(美) 伊利亚·甘列林 (Ilya Ganelin) , 等著
饶琛琳, 编著