hbase为什么按列存储,hbase为什么是列数据库( 二 )


3、HBase 是 Apache 的 Hadoop 项目的子项目,它不同于一般的关系数据库 , 而是一个适合于非结构化数据存储的数据库 。HBase 分布式数据库具有如下几个显著特点 。
HBase从入门到精通11:HBase数据保存过程和Region分裂HBase表的列族在创建之初只有一个Region,随着插入数据的增多Region变得越来越大 。
以fileServer为例,在使用默认的split策略--IncreasingToUpperBoundRegionSplitPolicy 的情况下,16个预分区Region,则单个Resion容量达到 min(32,50),即32GB时分裂 。
默认 , HBase 在创建表的时候,会自动为表分配一个 Region , 正处于混沌时期,start-end key 无边界,所有 RowKey 都往这个 Region里分配 。
Hbase Split 是一个很重要的功能,HBase 通过把数据分配到一定数量的 Region 来达到负载均衡的 。
由于在HBase中数据存储是Key-Value形式 , 若向HBase中同一张表插入相同RowKey的数据 , 则原先存在的数据会被新的数据覆盖 。设计的RowKey应均匀的分布在各个HBase节点上, 避免数据热点现象 。
【hbase为什么按列存储,hbase为什么是列数据库】hbase为什么按列存储的介绍就聊到这里吧 , 感谢你花时间阅读本站内容,更多关于hbase为什么是列数据库、hbase为什么按列存储的信息别忘了在本站进行查找喔 。

推荐阅读