Hive编程

Hive编程

(美) 卡普里奥罗 (Capriolo,E.) , (美) 万普勒 (Wampler,D.) , (美) 卢森格林 (Jason,R.) , 著

出版社:东南大学出版社

年代:2013

定价:54.0

书籍简介:

本书由实例驱动的指南为你展示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和MapReduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。

作者介绍:

Edward CaPriolo,是Media6degrees的系统管理员,也是Apache软件基金会的成员和Hadoop—Hive项目的委员之一。      Dean Wampler,是Think Big Analytics公司的资深咨询顾问,他专长于大数据问题以及诸如HadOOP这样的工具和MachineLearning(机器学习)。      Jason Rutherglen,是Think Big Analytics公司的软件架构师,他专长于大数据、Hadoop、搜索和安全。

书籍目录:

Preface

1. Introduction

An Overview of Hadoop and MapReduce

Hive in the Hadoop Ecosystem

Pig

HBase

Cascading, Crunch, and Others

Java Versus Hive: The Word Count Algorithm

What's Next

2. Getting Started

Installing a Preconfigured Virtual Machine

Detailed Installation

Installing Java

Installing Hadoop

Local Mode, Pseudodistributed Mode, and Distributed Mode

Testing Hadoop

Installing Hive

What Is Inside Hive?

Starting Hive

Configuring Your Hadoop Environment

Local Mode Configuration

Distributed and Pseudodistributed Mode Configuration

Metastore Using JDBC

The Hive Command

Command Options

The Command-Line Interface

CLI Options

Variables and Properties

Hive "One Shot" Commands

Executing Hive Queries from Files

The .hiverc File

More on Using the Hive CLI

Command History

Shell Execution

Hadoop dfs Commands from Inside Hive

Comments in Hive Scripts

Query Column Headers

3. Data Types and File Formats

Primitive Data Types

Collection Data Types

Text File Encoding of Data Values

Schema on Read

4. HiveQL: Data Definition

Databases in Hive

Alter Database

Creating Tables

Managed Tables

External Tables

Partitioned, Managed Tables

External Partitioned Tables

Customizing Table Storage Formats

Dropping Tables

Alter Table

Renaming a Table

Adding, Modifying, and Dropping a Table Partition

Changing Columns

Adding Columns

Deleting or Replacing Columns

Alter Table Properties

Alter Storage Properties

Miscellaneous Alter Table Statements

5. HiveQt: Data Manipulation

Loading Data into Managed Tables

Inserting Data into Tables from Queries

Dynamic Partition Inserts

Creating Tables and Loading Them in One Query

Exporting Data

……

6.HiveQL: Queries

7.HiveQL: Views

8.HiveQL: Indexes

9.Schema Design

10.Tuning

11.Other File Formats and Compression

12.Developing

13.Functions

14.Streaming

15.Customizing Hive File and Record Formats

16.Hive Thrift Service

17.Storage Handlers and NoSQL

18.Security

19.Locking

20.Hive Integration with Oozie

21.Hive and Amazon Web Services(AWS)

22.HCatalog

23.Case Studies

Glossary

Appendix:References

Index

内容摘要:

你是否需要把一个关系型数据库应用迁移到Hadoop上?卡普里奥罗等著的《Hive编程(影印版)》这本全面的指南将为你介绍Apache Hive,它是Hadoop的数据仓库平台。你将快速了解如何使用Hive的SQL方言——HiveQL——来汇总、查询和分析存储在Hadoop分布式文件系统中的大数据集。
  《Hive编程(影印版)》为你展数据库应用于示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和Map Reduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。

编辑推荐:

使用Hive来创建、改变和删除数据库、表、视图、函数和索引
  定制文件和外部数据库中的数据格式和存储选项
  从表中加载和提取数据——以及使用查询、分组、过滤、连接和其他常用查询方法
  获取创建用户自定义函数的最佳实践
  了解你应该使用的Hive模式和你应该避免的错误模式
  把Hive集成到其他数据处理程序中
  在NoSQL数据库和其他数据存储中使用存储处理器
  了解在Arnazorl公司的Elastic MapRedtme上运行Hive的优点和缺点

书籍规格:

书籍详细信息
书名Hive编程站内查询相似图书
9787564141974
如需购买下载《Hive编程》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地南京出版单位东南大学出版社
版次影印本印次1
定价(元)54.0语种英文
尺寸24 × 17装帧平装
页数印数

书籍信息归属:

Hive编程是东南大学出版社于2013.5出版的中图分类号为 TP311.13 的主题关于 数据库系统-程序设计-英文 的书籍。