出版社:中国电力出版社
年代:2015
定价:28.0
尽管不需要一个巨大的计算基础设施来运用Apache Hadoop处理大规模数据,要开始启动项目仍然是十分困难的。本实践指南展示了如何在云中使用亚马逊弹性MapReduce(EMR)来快速启动数据分析项目,EMR是亚马逊Web服务(AWS)提供的Hadoop框架。本书为读者展示了如何装配解决大数据分析问题所必要的基础材料。主要内容有:获取用于大规模数据分析的AWS和Apache软件工具的概览。使用一个简单的日志分析器来贯穿执行JobFlow处理的全过程。发现用于过滤和分析数据集的有用的MapReduce模式。使用Apache Hive 和Pig来代理编写Java程序来构建MapReduce Job Flow。学习使用亚马逊EMR来运行机器算法的基础知识。开发使用亚马逊EMR和其他AWS工具的项目开销模型。
王晓华, 著
(美) 迈纳 (Miner,D.) , (美) 舒克 (Shook,A.) , 著
杨雷, 著
(美) 埃里克·马瑟斯 (Eric Matthes) , 著
沙行勉, 著
(美) 谷泰格 (Guttag,J.V.) , 著
(美) 卢茨 (Lutz,M.) , 著
(美) 坎贝尔 (Campbell,J.) , 等著
(美) 萨默菲尔德 (Summerfield,M.) , 著