Hadoop权威指南

本书主题包括:用HDFS存储大数据集,用MapReduce做分布式计算,使用Hadoop的数据和I/O构件来做压缩、数据集...

2017.

ELK Stack权威指南

ELK是 Elasticsearch、Logstash、Kibana 三个开源软件的组合,是目前开源界最流行的实时数据分析方案,成为...

2017.5

数据馆员的Spark简明手册

Spark是由伯克利大学(Berkeley)开源的计算框架,其特点是能够将任务的中间结果保存在内存中,不进行读写磁...

2017.10

数据馆员的Hadoop简明手册

Hadoop是一个开源的框架,它能够使用户在不了解分布式底层细节的情况下,开发分布式程序,以便进行大规模数...

2017.10

Hadoop大数据实战权威指南

本书是一本讲解大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”编写。全书...

2017.7

大数据实验手册

本书涵盖大数据专业经典的40个实验,每一个实验给出具体的目的、要求、原理,并给出详细的实验步骤和试验程...

2017.6

数据科学家养成手册

本书分为三篇,分别是认知篇、分化篇、实践篇。认知篇(第1~7章)归纳了什么是科学,数据科学的范围、定义...

2017.5