出版社:人民邮电出版社
年代:2015
定价:49.0
本书先介绍实时大数据平台架构上的一些知识和难点,然后引入Storm来解决其中的问题。开始介绍Storm开发,再分享Storm集群中性能调优、资源隔离的一些知识和经验,然后加入Storm监控和日志的内容。后面介绍如何通过Storm构建公司的基础数据层;如何通过良好的架构设计实时更新基础数据层的用户画像、分布式索引等,最后依托实时更新的基础数据层,介绍如何构建各类个性化应用。
第1章 绪论
1.1 Storm的基本组件
1.1.1 集群组成
1.1.2 核心概念
1.1.3 Storm的可靠性
1.1.4 Storm的特性
1.2 其他流式处理框架
1.2.1 Ap
1.2.2 SparkSt
1.2.3 流计算和Storm的应用
第2章 实时平台介绍
2.1 实时平台架构介绍
2.2 Kafka架构
2.2.1 Kafka的基本术语和概念
2.2.2 Kafka在实时平台中的应用
2.2.3 消息的持久化和顺序读写
2.2.4 sendfile系统调用和零复制
2.2.5 Kafka的客户端
2.2.6 Kafka的扩展
2.3 大众点评实时平台
2.3.1 相关数据
2.3.2 实时平台简介
2.3.3 Bla
2.4 1号店实时平台
第3章 Storm集群部署和配置
3.1 Storm的依赖组件
3.2 Storm的部署环境
3.3 部署Storm服务
3.3.1 部署ZooKeeper
3.3.2 部署Storm
3.3.3 配置Storm
3.4 启动
3.5 Storm的守护进程
3.6 部署Storm的其他节点
3.7 提交Top
第4章 Storm内部剖析
4.1 Storm客户端
4.2 Nimbus
4.2.1 启动Nimbus服务
4.2.2 Nimbus服务的执行过程
4.2.3 分配Ex
4.2.4 调度器
4.2.5 默认调度器DefaultSch
4.2.6 均衡调度器EvenSch
4.3 Supervisor
4.3.1 ISupervisor接口
4.3.2 Supervisor的共享数据
4.3.3 Supervisor的执行过程
4.4 Worker
4.4.1 Worker中的数据流
4.4.2 创建Worker的过程
4.5 Executor
4.5.1 Executor的创建
4.5.2 创建Spout的Executor
4.5.3 创建Bolt的Executor
4.6 Task
4.6.1 Task的上下文对象
4.6.2 Task的创建
4.7 Storm中的统计
4.7.1 stats框架
4.7.2 metric框架
4.8 Ack框架
4.8.1 Ack的原理
4.8.2 Acker Bolt
4.9 Storm总体架构
第5章 Storm运维和监控
第6章 Storm的扩展
第7章 Storm开发
第8章 基于Storm的实时数据平台
第9章 大数据应用案例
第10章 Storm使用经验和性能优化
附录A Kafka原理
附录B 将Storm源码导入Ecl
《Storm技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源码、运维监控、实时系统扩展、以用户画像为主的数据平台,最后到推荐、广告、搜索等具体的大数据应用。书中提到的不少问题是实际生产环境中因为数据量增长而遇到的一些真实问题,对即将或正在运用实时系统处理大数据问题的团队会有所帮助。