本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你...
2016.7
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工...
2014.
本书一共分为五个部分:基础篇(1~2章),主要介绍了Hadoop的概念、用途、整个生态环境中的其他技术,以及...
2014.1
Spark是一个通用的并行分布式计算框架,由UCBerkeley的AMP实验室开发。Spark使得程序员更容易地编写分布式...
2014.7
第1章大数据概论、第2章 搭建Hadoop分布式集群、第3章 HDFS分布式文件系统入门、第4章 HDFS 接口、第5章 HD...
2019.1
本书首先介绍如何设置基本的数据科学工具箱,然后带你进入数据改写和预处理阶段,这一部分主要是阐明所有与...
2016.7
本书作为Hadoop及其周边框架的入门书,涵盖当前主流的大数据开发技术,以实操为主,深入讲解每一个操作步骤...
2019.
共分11章,第1章对大数据及Hadoop进行总体介绍,第2章讲解了如何搭建Hadoop集群。第3-5章讲解了HDFS分布式...
2020.8
共分11章,第1章对大数据及Hadoop进行总体介绍,第2章讲解了如何搭建Hadoop集群。第3-5章讲解了HDFS分布式...
2020.1
本书主要基于python 3.6介绍数据科学与大数据技术领域中的编程基础及数据分析工具的基本应用,培养读者在数...
2019.9