HBase入门实例:|HBase入门实例: Table中Family和Qualifier的关系与区别 HBase入门实例:Table中Family和Qu

Table中Family和Qualifier的关系与区别
就像用MySQL一样，我们要做的是表设计，MySQL中的表，行，列的在HBase已经有所区别了，在HBase中主要是Table和Family和Qualifier，这三个概念。Table可以直接理解为表，而Family和Qualifier其实都可以理解为列，一个Family下面可以有多个Qualifier，所以可以简单的理解为，HBase中的列是二级列，也就是说Family是第一级列，Qualifier是第二级列。两个是父子关系。
【HBase入门实例:|HBase入门实例: Table中Family和Qualifier的关系与区别】谈谈Table中Family和Qualifier的设置
对于传统关系型数据库中的一张table，在业务转换到hbase上建模时，从性能的角度应该如何设置family和qualifier呢？
最极端的，可以每一列都设置成一个family，也可以只有一个family，但所有列都是其中的一个qualifier，那么有什么区别呢？
family越多，那么获取每一个cell数据的优势越明显，因为io和网络都减少了，而如果只有一个family，那么每一次读都会读取当前rowkey的所有数据，网络和io上会有一些损失。
当然如果要获取的是固定的几列数据，那么把这几列写到一个family中比分别设置family要更好，因为只需一次请求就能拿回所有数据。
以上是从读的方面来考虑的，那么写呢？可以参考一下这篇文章：
http://hbase.apache.org/book/number.of.cfs.html
首先，不同的family是在同一个region下面。而每一个family都会分配一个memstore，所以更多的family会消耗更多的内存。
其次,目前版本的hbase，在flush和compaction都是以region为单位的，也就是说当一个family达到flush条件时，该region的所有family所属的memstore都会flush一次，即使memstore中只有很少的数据也会触发flush而生成小文件。这样就增加了compaction发生的机率，而compaction也是以region为单位的，这样就很容易发生compaction风暴从而降低系统的整体吞吐量。
第三，由于hfile是以family为单位的，因此对于多个family来说，数据被分散到了更多的hfile中，减小了split发生的机率。这是把双刃剑。更少的split会导致该region的体积比较大，由于balance是以region的数目而不是大小为单位来进行的，因此可能会导致balance失效。而从好的方面来说，更少的split会让系统提供更加稳定的在线服务。
上述第三点的好处对于在线应用来说是明显的，而坏处我们可以通过在请求的低谷时间进行人工的split和balance来避免掉。
因此对于写比较多的系统，如果是离线应该，我们尽量只用一个family好了，但如果是在线应用，那还是应该根据应用的情况合理地分配family。

HBase入门实例:|HBase入门实例: Table中Family和Qualifier的关系与区别

推荐阅读

尼康3400值得入手吗尼康340价格

中医四诊室中医堂怎么样

运动励志币计划

打新冠加强针不满48小时核酸会阳性吗

河南赊刀人最新预言2021 赊刀人2021年10月前兑现

匆匆那些年

遇到博世冰箱显示横杠怎么办？3个处理方法帮助你

电脑hdmi接口没有反应解决方法

win10系统与安卓系统,安装手机驱动程序需要注意什么?

芥菜种植最佳时间和方法及注意事项图片芥菜种植最佳时间和方法及注意事项

电饭煲内胆涂层有划痕还能用吗电饭煲内胆涂层有划痕还能用吗视频

姓氏来源姓氏来源查询表

甲状腺结节忌食哪些食物

店面部分转租没有经过房东同意转租犯法吗？

玉米秃尖怎么办如何防治玉米秃尖

mla-tl10是什么型号mla-tl10型号是什么

老人失眠怎么办：6招还你好睡眠

md788zp/a是什么型号 md788zp/a的型号是什么

比亚迪f3水温正常不过沒有热风 17年比亚迪f3有时候水温高有时候不高

达尔文进化岛新手攻略,达尔文进化岛若何举行搭配