本文概述
- 为什么选择HBase
- Hbase的特点
【什么是HBase】它基于Google的Big Table。它具有一组表, 这些表将数据保留为键值格式。 Hbase非常适合稀疏数据集, 而稀疏数据集在大数据用例中非常常见。 Hbase提供了几乎可以使用任何编程语言进行开发的API。它是Hadoop生态系统的一部分, 可提供对Hadoop File System中数据的随机实时读写访问。
为什么选择HBase
- 随着数据变大, RDBMS呈指数增长
- 期望数据具有高度结构化的能力, 即能够适应定义良好的模式
- 模式的任何更改都可能需要停机
- 对于稀疏数据集, 维护NULL值的开销过多
- 水平可伸缩:你可以随时添加任意数量的列。
- 自动故障转移:自动故障转移是一种资源, 系统管理员可以在系统受到破坏时自动将数据处理切换到备用系统
- 与Map / Reduce框架的集成:所有命令和Java代码在内部实现Map / Reduce以完成任务, 并且它是基于Hadoop分布式文件系统构建的。
- 稀疏, 分布式, 持久性, 多维排序的映射, 由行键, 列键和时间戳编制索引。
- 通常称为键值存储或面向列族的数据库, 或存储映射的版本化映射。
- 从根本上讲, 它是一个用于通过随机访问存储和检索数据的平台。
- 它不在乎数据类型(对于同一列, 将一个整数存储在一行中, 将字符串存储在另一行中)。
- 它不会在数据中强制执行关系。
- 它旨在运行在使用商用硬件构建的计算机群集上。