本书从Hadoop的缘起开始,结合理论和实践,全方位地介绍Hadoop这一高性能的处理海量数据集的理想工具。
2010.
本书是阿里ODPS平台的权威指南。本书基于很多范例解析,可以引导用户从零开始轻松入门ODPS。主要内容包括:...
2014.11
这是一本Hadoop实用手册,主要针对实际问题给出相应的解决方案。本书特色是以实践结合理论分析,手把手教读...
2014.1
全书分为三篇,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL 实例,使得读者能够...
2018.
ELK是 Elasticsearch、Logstash、Kibana 三个开源软件的组合,是目前开源界最流行的实时数据分析方案,成为...
2017.5
本书的核心内容是如何使用统计软件Stata实现对数据的管理和分析。全书共11章,包括这一介绍章(第一章),...
2013.11
本书提供了如何处理不良数据,进行数据清理的案例。而这些工作,正是数据科学工作中最重要、核心的方面。本...
2016.3
本书不是一本数据挖掘的教材,而是写给程序员的一本数据挖掘知识普及和实践图书。本书用程序员通俗易懂的方...
2015.8
这是一本简单的一站式指南,书中包含丰富的示例和多样的实际应用场景,以一种简单而直接的方式呈现了90个实...
2015.4
本书作者从2008年开始使用和查看GDAL,目前为止对其使用的方式,以及实现有一个整体的了解。我个人希望能够...
2014.1