本书主题包括:用HDFS存储大数据集,用MapReduce做分布式计算,使用Hadoop的数据和I/O构件来做压缩、数据集...
2017.
ELK是 Elasticsearch、Logstash、Kibana 三个开源软件的组合,是目前开源界最流行的实时数据分析方案,成为...
2017.5
Spark是由伯克利大学(Berkeley)开源的计算框架,其特点是能够将任务的中间结果保存在内存中,不进行读写磁...
2017.10
Hadoop是一个开源的框架,它能够使用户在不了解分布式底层细节的情况下,开发分布式程序,以便进行大规模数...
2017.10
本书是一本讲解大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”编写。全书...
2017.7
本书涵盖大数据专业经典的40个实验,每一个实验给出具体的目的、要求、原理,并给出详细的实验步骤和试验程...
2017.6
本书分为三篇,分别是认知篇、分化篇、实践篇。认知篇(第1~7章)归纳了什么是科学,数据科学的范围、定义...
2017.5