本书主题包括:用HDFS存储大数据集,用MapReduce做分布式计算,使用Hadoop的数据和I/O构件来做压缩、数据集...
2017.
ELKstack是Elasticsearch、Logstash、Kibana三个开源软件的组合,是目前开源界最流行的实时数据分析方案,...
2015.9
Apache Hadoop驱动着大数据的变革,现在数据处理方式已经完全改变了:Apache Hadoop YARN在数据中心规模提...
2015.2
本书详细介绍了Hadoop的技术原理及其应用,是一本非常权威的Hadoop编程指南。全书共16章3个附录,结合案例...
2014.
全书分为三篇,第一篇讲解了Hadoop的原生态组件,包括Hadoop以及Zookeeper、Hbase、Hive环境搭建与安装,以...
2017.
全书分为三篇,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL 实例,使得读者能够...
2018.
ELK是 Elasticsearch、Logstash、Kibana 三个开源软件的组合,是目前开源界最流行的实时数据分析方案,成为...
2017.5
本书开头部分讲了如何按照深度学习的需求来配置Apache Spark,以实现不同类型的神经网络,接下来讲述了在分...
2020.
通过本书你将学会如何使用、部署、维护Apache Spark这一流行的开源集群计算框架。本书由Spark的创始人所撰...
2019.11
基于”深入分析组件原理、充分展示搭建过程、详细指导应用开发”的理念,以最新版Hadoop及其生态组件为对象,...
2019.8