出版社:东南大学出版社
年代:2013
定价:54.0
本书由实例驱动的指南为你展示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和MapReduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。
Preface
1. Introduction
An Overview of Hadoop and MapReduce
Hive in the Hadoop Ecosystem
Pig
HBase
Cascading, Crunch, and Others
Java Versus Hive: The Word Count Algorithm
What's Next
2. Getting Started
Installing a Preconfigured Virtual Machine
Detailed Installation
Installing Java
Installing Hadoop
Local Mode, Pseudodistributed Mode, and Distributed Mode
Testing Hadoop
Installing Hive
What Is Inside Hive?
Starting Hive
Configuring Your Hadoop Environment
Local Mode Configuration
Distributed and Pseudodistributed Mode Configuration
Metastore Using JDBC
The Hive Command
Command Options
The Command-Line Interface
CLI Options
Variables and Properties
Hive "One Shot" Commands
Executing Hive Queries from Files
The .hiverc File
More on Using the Hive CLI
Command History
Shell Execution
Hadoop dfs Commands from Inside Hive
Comments in Hive Scripts
Query Column Headers
3. Data Types and File Formats
Primitive Data Types
Collection Data Types
Text File Encoding of Data Values
Schema on Read
4. HiveQL: Data Definition
Databases in Hive
Alter Database
Creating Tables
Managed Tables
External Tables
Partitioned, Managed Tables
External Partitioned Tables
Customizing Table Storage Formats
Dropping Tables
Alter Table
Renaming a Table
Adding, Modifying, and Dropping a Table Partition
Changing Columns
Adding Columns
Deleting or Replacing Columns
Alter Table Properties
Alter Storage Properties
Miscellaneous Alter Table Statements
5. HiveQt: Data Manipulation
Loading Data into Managed Tables
Inserting Data into Tables from Queries
Dynamic Partition Inserts
Creating Tables and Loading Them in One Query
Exporting Data
……
6.HiveQL: Queries
7.HiveQL: Views
8.HiveQL: Indexes
9.Schema Design
10.Tuning
11.Other File Formats and Compression
12.Developing
13.Functions
14.Streaming
15.Customizing Hive File and Record Formats
16.Hive Thrift Service
17.Storage Handlers and NoSQL
18.Security
19.Locking
20.Hive Integration with Oozie
21.Hive and Amazon Web Services(AWS)
22.HCatalog
23.Case Studies
Glossary
Appendix:References
Index
你是否需要把一个关系型数据库应用迁移到Hadoop上?卡普里奥罗等著的《Hive编程(影印版)》这本全面的指南将为你介绍Apache Hive,它是Hadoop的数据仓库平台。你将快速了解如何使用Hive的SQL方言——HiveQL——来汇总、查询和分析存储在Hadoop分布式文件系统中的大数据集。
《Hive编程(影印版)》为你展数据库应用于示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和Map Reduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。
使用Hive来创建、改变和删除数据库、表、视图、函数和索引
定制文件和外部数据库中的数据格式和存储选项
从表中加载和提取数据——以及使用查询、分组、过滤、连接和其他常用查询方法
获取创建用户自定义函数的最佳实践
了解你应该使用的Hive模式和你应该避免的错误模式
把Hive集成到其他数据处理程序中
在NoSQL数据库和其他数据存储中使用存储处理器
了解在Arnazorl公司的Elastic MapRedtme上运行Hive的优点和缺点
书籍详细信息 | |||
书名 | Hive编程站内查询相似图书 | ||
9787564141974 如需购买下载《Hive编程》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 南京 | 出版单位 | 东南大学出版社 |
版次 | 影印本 | 印次 | 1 |
定价(元) | 54.0 | 语种 | 英文 |
尺寸 | 24 × 17 | 装帧 | 平装 |
页数 | 印数 |
Hive编程是东南大学出版社于2013.5出版的中图分类号为 TP311.13 的主题关于 数据库系统-程序设计-英文 的书籍。
(美) 卡普廖洛 (Capriolo,E.) , (美) 万普勒 (Wampler,D.) , (美) 卢森格林 (Rutherglen,J.) , 著
(美) 斯科特·肖, (南非) 安德烈亚斯·弗朗索瓦·弗穆尔恩, (印) 安库尔·古普塔, (美) 戴维·杰鲁姆加德, 著
林志煌, 编著
杨力, 著
孙帅, 王美佳, 主编
湖北美和易思教育科技有限公司, 编著
湖北美和易思教育科技有限公司, 编著
杨忠, 著
范景行, 王政锋, 康凤, 主编