求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

HBase權威指南檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋
HBase權威指南

《HBase權威指南(影印版)(英文版)》探討了與Hadoop的高度集成如何使HBase的可伸縮性變得簡單;把大型數據集分布到相對廉價的商業服務器集群中;使用本地Java客戶端,或者通過提供了REST、Avro和Thrift應用編程接口的網關服務器來訪問HBase;讓你了解HBase架構的細節,包括存儲格式預寫日誌後台進程等等;在HBase中集成用于海量並行數據處理任務的Hadoop的MapReduce框架;助你了解如何調節集群、設計模式、拷貝表、導入批量數據、刪除節點以及其他更多的任務等。

基本內容

作者:喬治

出版時間:2012-4

定價:72.00元

ISBN:9787564133924

外文名:HBase:The Definitive Guide

語種:英語

副標題:HBase權威指南

頁數:522

裝幀:平裝

書名:HBase權威指南

開本:16

類型:計算機與互聯網

內容介紹

《HBase權威指南(影印版)(英文版)》探討了與Hadoop的高度集成如何使HBase的可伸縮性變得簡單;把大型數據集分布到相對廉價的商業服務器集群中;使用本地Java客戶端,或者通過提供了REST、Avro和Thrift應用編程接口的網關服務器來訪問HBase;讓你了解HBase架構的細節,包括存儲格式、預寫日誌、後台進程等等;在HBase中集成用于海量並行數據處理任務的Hadoop的MapReduce框架;助你了解如何調節集群、設計模式、拷貝表、導入批量數據、刪除節點以及其他更多的任務等。

推薦

《HBase權威指南(影印版)(英文版)》提供了很多有意義的答案,無論你是否正在評估這種非關係型數據庫或者正試圖立刻把它付諸實踐。

目錄

Foreword

Preface

1.Introduction

The Dawn of Big Data

The Problem with Relational Database Systems

Nonrelational Database Systems,Not-Only SQL or NoSQL?

Dimensions

Scalability

Database(De-)Normalization

Building Blocks

Backdrop

Tables,Rows,Columns,and Cells

Auto-Sharding

Storage API

Implementation

Summary

HBase: The Hadoop Database

History

Nomenclature

Summary

2.Installation

Quick-Start Guide

Requirements

Hardware

Software

Filesystems for HBase

Local

HDFS

S3

Other Filesystems

Installation Choices

Apache Binary Release

Building from Source

Run Modes

Standalone Mode

Distributed Mode

Configuration

hbase-site.xml and hbase'-default.xml

hbase-env.sh

regionserver

log4j.properties

Example Configuration

Client Configuration

Deployment

Script-Based

Apache Whirr

Puppet and Chef

Operating a Cluster

Running and Confirming Your Installation

Web-based UI Introduction

Shell Introduction

Stopping the Cluster

3.Client APh The Basics

General Notes

CRUD Operations

Put Method

Get Method

Delete Method

Batch Operations

Row Locks

Scans

Introduction

The ResultScanner Class

Caching Versus Batching

Miscellaneous Features

The HTable Utility Methods

The Bytes Class

4.Client API:Advanced Features

Filters

Introduction to Filters

Comparison Filters

Dedicated Filters

Decorating Filters

FilterList

Custom Filters

Filters Summary

Counters

Introduction to Counters

Single Counters

Multiple Counters

Coprocessors

Introduction to Coprocessors

The Coprocessor Class

Coprocessor Loading

The RegionObserver Class

The MasterObserver Class

Endpoints

HTablePool

Connection Handling

5.Client APh Administrative Features

Schema Definition

Tables

Table Properties

Column Families

HBaseAdmin

Basic Operations

Table Operations

Schema Operations

Cluster Operations

Cluster Status Information

6.Available Clients

Introduction to REST,Thrift,and Avro

Interactive Clients

Native Java

REST

Thrift

Avro

Other Clients

Batch Clients

MapReduce

Hive

Pig

Cascading

Shell

Basics

Commands

Scripting

Web-based UI

Master UI

Region Server UI

Shared Pages

7.MapReduce Integration

Framework

MapReduce Introduction

Classes

Supporting Classes

MapReduce Locality

Table Splits

MapReduce over HBase

Preparation

Data Sink

Data Source

Data Source and Sink

Custom Processing

8.Architecture

Seek Versus Transfer

B+ Trees

Log-Structured Merge-Trees

Storage

Overview

Write Path

Files

HFile Format

KeyValue Format

Write-Ahead Log

Overview

HLog Class

HLogKey Class

WALEdit Class

LogSyncer Class

LogRoller Class

……

9.Advanced Usage

10.Cluster Monitoring

11.Performance Tuning

12.Cluster Administration

A.HBase Configuration Properties

B.Road Map

C Upgrade from Previous Releases

D.Distributions

E.Hush SQL Schema

F.HBaseVersusBigtable

Index

作者簡介

作者:(比利時)喬治(Lars George)

Lars George,HBase項目組成員,他是cloudera的解決方案架構師,提供了關於Hadoop和HBase的技術支持、諮詢服務和培訓工作。他曾經在多個不同的Hadoop用戶組會議發言,並且在如布魯塞爾的自由及開源軟件開發者歐洲會議(FOSDEM)這樣的大型會議中發言。

媒體推薦

「分布式系統充其量只能說是經常『多雲』的。Lars George從那些主題的『水蒸氣』中提煉出了實際的項目,在此過程中,他為我們呈現了一本卓越的HBase指南。」

——Josh Patterson Cloudera公司[1]

參考文獻