什么是HBase

本文概述

  • 为什么选择HBase
  • Hbase的特点
Hbase是一个基于Hadoop的开源和分类地图数据。它是面向列的并且可以水平扩展。
【什么是HBase】它基于Google的Big Table。它具有一组表, 这些表将数据保留为键值格式。 Hbase非常适合稀疏数据集, 而稀疏数据集在大数据用例中非常常见。 Hbase提供了几乎可以使用任何编程语言进行开发的API。它是Hadoop生态系统的一部分, 可提供对Hadoop File System中数据的随机实时读写访问。
为什么选择HBase
  • 随着数据变大, RDBMS呈指数增长
  • 期望数据具有高度结构化的能力, 即能够适应定义良好的模式
  • 模式的任何更改都可能需要停机
  • 对于稀疏数据集, 维护NULL值的开销过多
Hbase的特点
  • 水平可伸缩:你可以随时添加任意数量的列。
  • 自动故障转移:自动故障转移是一种资源, 系统管理员可以在系统受到破坏时自动将数据处理切换到备用系统
  • 与Map / Reduce框架的集成:所有命令和Java代码在内部实现Map / Reduce以完成任务, 并且它是基于Hadoop分布式文件系统构建的。
  • 稀疏, 分布式, 持久性, 多维排序的映射, 由行键, 列键和时间戳编制索引。
  • 通常称为键值存储或面向列族的数据库, 或存储映射的版本化映射。
  • 从根本上讲, 它是一个用于通过随机访问存储和检索数据的平台。
  • 它不在乎数据类型(对于同一列, 将一个整数存储在一行中, 将字符串存储在另一行中)。
  • 它不会在数据中强制执行关系。
  • 它旨在运行在使用商用硬件构建的计算机群集上。

    推荐阅读