出版社:机械工业出版社
年代:2017
定价:69.0
本书分为三大部分,共九章。第一部分(第1章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark 2.0版本的Spark SQL、Structured Streaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄入过程,以及在查询过程中如何实现Druid查询API;接着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;最后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。
吕兆星, 等著
成娅辉, 著
海天电商金融研究中心, 编著
任菊香, 著
(荷) 马克·冯·里吉门纳姆 (Mark van Rijmenam) , 著
董超, 编著
董超, 卢桂林, 胡青善, 主编
(美) 温克特·斯里尼瓦森 (Venkat Srinivasan ) , 著
(美) 伯纳德·马尔 (Bernard Marr) , 著