云计算大数据处理

云计算大数据处理

刘鹏, 于全, 杨震宇, 陈伟, 王磊, 张乃甜, 编著

出版社:人民邮电出版社

年代:2015

定价:78.0

书籍简介:

本书介绍了面向移动互联网的云计算与物联网技术,包括服务器与桌面虚拟化技术、云存储技术和实时云计算数据库技术等。介绍了最近取得突破性进展的深度学习人工智能技术,几款典型的云计算与物联网应用App,以及如何利用云计算技术来优化物联网。最后,给出了三个典型的物联网与云计算相结合的应用案例。

作者介绍:

刘鹏,1970年生,男,博士,解放军理工大学教授。以第一作者编著中文专著一部:《云计算》,由电子工业出版社于2010年出版。 于全,中国工程院院士,中国电子系统设备工程公司研究员,西安电子科技大学、北京邮电大学兼职教授、博士生导师。曾获国家进步一等奖1项、二等奖1项,部级科技进步一等奖4项。发表学术论文近百篇。 杨振宇,南京云创存储科技有限公司云处理部门经理在将大数据技术与互联网业务相结合、搭建、优化及维护超大规模集群方面,有丰富的实战经验。 陈伟,长期致力于大数据处理相关技术的研发,对开源大数据平台Hadoop及其相关技术有非常深入的研究,并积累了大量源码阅读和分析的技巧与方法。 王磊,中国矿业大学硕士毕业,专注于分布式平台下大数据计算任务的调度和可靠性研究。发表多篇分布式环境下任务调度和可靠性论文,并被EI检索。 张乃甜,自身Java研发工程师,现任江苏天泽信息产业有限公司研究院大数据平台研发工程师,对分布式系统、Java虚拟机和Java程序优化等都有深入的研究,并在大量实践和工作中积累了丰富的经验

书籍目录:

第1章 大数据挑战

1.1 当前面临的大数据挑战

1.1.1 大数据急剧膨胀

1.1.2 大数据智能分析

1.1.3 大数据深度挖掘

1.1.4 业务与技术脱节

1.2 大数据催生云计算

1.2.1 云计算不是偶然

1.2.2 云计算带来挑战与机遇

1.2.3 云计算对大数据的意义

1.2.4 云计算未来展望

1.3 大数据存储

1.3.1 存储仅是第一步

1.3.2 行存储还是列存储

1.3.3 PB级大数据存储

1.3.4 大数据存储的未来

1.4 大数据处理

1.4.1 大数据处理的瓶颈

1.4.2 大数据处理的需求

1.4.3 大数据处理技术决定未来

1.4.4 大数据处理解决方案

第2章 当前的大数据处理系统

2.1 开源大数据处理平台

2.1.1 Hadoop

2.1.2 MapReduce

2.2 NoSQL数据库

2.2.1 Google BigTable 的开源JAVA实现:HBase

2.2.2 纯分布式数据库:Cassandra

2.2.3 NoSQL数据库的应用场景

2.3 数据仓库平台

2.3.1 Hive

第3章 数据立方简介

3.1 数据立方产生背景

3.2 相关技术

3.2.1 云计算中的大数据处理技术--MapReduce

3.2.2 并行数据库技术

3.2.3 云计算与数据库相结合的技术

3.3 新一代EB级云计算数据库--数据立方

3.3.1 数据立方的体系架构

3.3.2 数据立方与Hadoop的关系

第4章 数据立方及配套环境的安装

4.1 安装流程

4.2 操作系统的安装

4.2.1 CentOS6.3的安装

4.2.2 安装JDK

4.2.3 配置SSH

4.3 HADOOP的安装

4.3.1 Hadoop的版本

4.3.2 HDFS的配置安装

4.3.3 MapReduce的配置安装

4.4 数据立方的配置安装

4.4.1 安装mysql-connector

4.4.2 编辑数据立方的配置文件

4.4.3 数据立方的启动

4.5 监控工具GANGLIA的安装

4.5.1安装依赖

4.5.2 安装ganglia

4.5.3 配置ganglia

4.6 数据导入工具SQOOP的安装

4.6.1 安装前提

4.6.2 安装步骤

第5章 hello word数据立方快速入门

5.1 智慧交通数据处理实例

5.1.1 智慧交通数据处理实例背景

5.1.2 建表

5.1.3 数据入库

5.1.4 数据查询

5.2 编程实现

5.2.1 JAVA开发包

5.2.2 示例

5.3 总结

第6章 数据立方开发

6.1 开发说明

6.2 数据立方SQL规范

6.2.1 数据定义与数据操作语言

6.2.2 数据查询语言

6.3 数据入库接口开发

6.3.1 单条多条记录入库JAVA开发包

6.3.2 开发说明

6.3.3 示例

6.4 数据查询接口开发

6.4.1 JAVA开发包

6.4.2 接口介绍

6.4.3 示例

6.5 数据导入工具SQOOP的使用

6.5.1 SQOOP命令

6.5.2 SQOOP命令的使用

第7章 数据立方的维护

7.1 HDFS的维护

7.1.1 HDFS的dfsadmin命令

7.1.2 HDFS的balancer工具

7.2 SHELL的使用

7.2.1数据立方SHELL说明

7.2.2数据定义与数据操作的shell

7.2.3数据查询的shell

7.3 数据立方的常见问题及其解决方法

7.3.1 启动时的常见问题

7.4 Sqoop的常见问题及其解决方法

7.4.1 Mysql的用户问题

7.4.2 Mysql的权限问题

7.4.3 Mysql的path问题

7.4.4 Mysql的path问题

7.5 数据立方管理系统

第8章 数据立方的可靠性

8.1 Hadoop的可靠性

8.1.1 HDFS中NameNode单点问题

8.1.2 HDFS数据块副本机制

8.1.3 HDFS心跳机制

8.1.4 HDFS负载均衡

8.1.5 MapReduce容错

8.2 Hadoop的SecondaryNameNode机制

8.2.1磁盘镜像与日志文件

8.2.2 SecondaryNameNode更新镜像的流程

8.3 Avatar机制

8.3.1 系统架构

8.3.2 Avatar元数据同步机制

8.3.3 故障切换过程

8.3.4 Avatar运行流程

8.3.5 Avatar故障切换流程

8.4 Avatar实战

8.4.1 实验环境

8.4.2 编译Avatar

8.4.3 Avatar安装和配置

8.5 数据立方可靠性

8.5.1 数据立方的可靠性

8.5.2 数据立方的工作流程

8.5.3 数据立方的可靠性

第9章 数据统计分析实例--供电信息采集系统

9.1 客户需求分析

9.1.1 测试过程及数据量描述

9.1.2 测试过程分解及效率统计

9.2 数据表设计

9.3 查询语句设计与结果展现

9.4 查询优化

9.4.1 存储方面的优化

9.4.2 内存方面的优化

9.5 性能测试结果

9.5.1 数据下载解压及标记

9.5.2 数据解析入库

9.5.3 数据计算流程

9.5.4 数据导入ORACLE数据库

9.5.5 查询总时长统计

第10章 在线数据检索实例--移动信令分析云平台

10.1 需求分析

10.2 数据表设计

10.2.1 CDR数据文件的检测与索引创建任务调度

10.2.2 从HDFS读取数据并创建索引

10.2.3 查询CDR信息

10.3 查询语句设计与结果展现

10.3.1 CDR文件检测和索引创建任务调度程序

10.3.2 读取CDR数据和索引创建处理

10.3.3 CDR查询

10.4 查询优化

10.5 性能测试结果

第11章 实时数据处理实例-地震数据

11.1 需求分析

11.2 数据表分析

11.3 查询语句设计与结果展现

11.4 查询优化

11.4.1 存储方面的优化

11.4.2 计算方面的优化

11.5 性能测试结果

11.5.1 单机模拟集群测试

11.5.2 字段测试

11.5.3 排序测试

11.5.4 随机读取测试

内容摘要:

《云计算大数据处理》介绍了基于云计算的大数据处理技术,重点介绍了一款高效的、实时分析处理海量数据的强有力工具——数据立方。数据立方是针对大数据处理的分布式数据库,能够可靠地对大数据进行实时处理,具有即时响应多用户并发请求的能力。
《云计算大数据处理》通过对当前主流的大数据处理系统进行深入剖析,阐述了数据立方产生的背景,介绍了数据立方的整体架构以及安装和详细开发流程,并给出了4个完整的数据立方综合应用实例。所有实例都经过验证并附有详细的步骤说明,论是对于云计算的初学者还是想进一步深入学习大数据处理技术的研发人员、研究人员都有很好的参考价值。

书籍规格:

书籍详细信息
书名云计算大数据处理站内查询相似图书
丛书名学术中国
9787115378101
如需购买下载《云计算大数据处理》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位人民邮电出版社
版次1版印次1
定价(元)78.0语种简体中文
尺寸24 × 17装帧平装
页数 106 印数 2000

书籍信息归属:

云计算大数据处理是人民邮电出版社于2015.5出版的中图分类号为 TP393 的主题关于 计算机网络-数据处理 的书籍。