书籍简介:

书中第1章首先通过介绍Spark的生态系统和RDD编程模型，使读者能够快速的对Spark技术的生态环境以及对Spark的RDD编程模型有个非常直观的了解。第2章，首先介绍了Spark应用的两种部署模式；然后在应用部署模式基础上，开始Spark实战的案例与解析，通过提供一个完整的基础案例，使读者了解一个Spark应用的大致处理流程；接着对实战中的重点部分，结合源码分析、监控日志分析等深入解析了Spark运行机制、DAG图等关键内容；最后给出Spark开发者常用的应用程序构建案例与分析，以及调试环境搭建的案例与应用调试的案例。第3章重点针对Spark SQL子模块进行实战，首先概要分析了Spark 1.3版本中引入的DataFrame，然后基于DataFrame编程模型给出一个完整的基础案例与解析，接着也是针对实战中的难度、重点部分，给予了更丰富的案例与深入地分析，最后，重点关注Spark 1.3版本中DataFrame当前支持的各种数据源，并给出各种数据源基础上的案例与分析，数据源包括各种结构化数据文件、Hive表、外部数据库或现有的RDD。第4章针对流处理进行实战，首先分析流处理中的关键点和难度，并通过实例进行深入解析。然后针对各种数据源的情景，给出由浅入深的实战案例与解析，并结合部分源码，分析流处理的性能调优等，并给出实例与分析。第5章针对最著名的分布式内存存储系统Tachyon进行实战，并对实战案例进行分析，内容包括从Tachyon集群部署的案例与分析、Tachyon集群配置的案例与分析等，最后关注Tachyon对Spark应用的性能调优的影响，给出实战案例及其深入解析。第6章通过大约30个动手实践的案例循序渐进地展示Spark GraphX框架方方面面的功能和使用方法，并对Spark GraphX的源码进行解析，并用综合实战案例巩固知识；第7章从快速入门机器学习开始，详细解析MLlib框架，通过对线性回归、聚类、协同过滤的算法解析、源码解析和案例实战，循序渐进地揭秘MLLib，最后通过对MLlib中Basic Statics、朴素贝叶斯算法、决策树的解析和实战，进一步提升掌握Spark机器学习的技能。

书籍规格:

书籍详细信息
书名	Spark大数据实例开发教程站内查询相似图书
	9787111519096 如需购买下载《Spark大数据实例开发教程》pdf扫描版电子书或查询更多相关信息，请直接复制isbn,搜索即可全网搜索该ISBN
出版地	北京	出版单位	机械工业出版社
版次	1版	印次	1
定价(元)	69.0	语种	简体中文
尺寸	26 × 19	装帧	平装
页数	340	印数	3000

全网搜索试读资源

书籍信息归属:

Spark大数据实例开发教程是机械工业出版社于2015.10出版的中图分类号为 TP274 的主题关于数据处理软件的书籍。