hbase基本,HBase基本操作

hbase不适合哪些应用场景1、列如商城系统中:用户,商品,订单,店铺,卖家,这些数据关系复杂不适合用Hbase 。这里面订单数据量很大,而且要频繁拿出来计算,可以考虑只将订单这项存入Hbase 。
2、最后,淘宝大部分工程师是java背景的同学,因此hbase的api对于他们来说非常容易上手,培训成本相对较低 。当然也必须指出,在大数据量的背景下银弹是不存在的,hbase本身也有不适合的场景 。
3、value应用场景,如日志信息的存储,对于内容信息不需要完全结构化出来的类CMS应用等 。注意hbase针对的仍然是OLTP应用为主 。
4、单节点和伪分布式?单节点:单独的进程运行在同一台机器上 hbase应用场景:存储海量数据低延迟查询数据 hbase表由多行组成 hbase行一行在hbase中由行健和一个或多个列的值组成,按行健字母顺序排序的存储 。
5、如日志)的批任务处理 。而基于HBase的查询,支持和row-level的更新 。Hive提供完整的SQL实现 , 通常被用来做一些基于历史数据的挖掘、分析 。而HBase不适用与有join , 多级索引,表关系复杂的应用场景 。
【hbase基本,HBase基本操作】6、用户画像 比如大型的视频网站,电商平台产生的用户点击行为、浏览行为等等存储在HBase中为后续的智能推荐做数据支撑 。
HBase支持的数据格式有哪些?1、HBase 通过 Put 操作和 Result 操作支持 “byte-in / bytes-out” 接口,所以任何可以转换为字节数组的内容都可以作为一个值存储 。输入可以是字符串、数字、复杂对象、甚至可以是图像,只要它们可以呈现为字节 。
2、如果量不是非常大,转成“逗号分隔”、“TAB分隔”等文本格式即可以,注意编码的对应,有中文不会乱码 。
3、HBase的数据文件都存储在HDFS上 , 格式主要有两种:HFile:HBase中KeyValue数据的存储格式 , HFile是Hadoop的二进制文件 , 实际上StoreFile就是对HFile做了轻量级的包装,即StoreFile底层就是HFile 。
4、LSM-Tree是一种支持高写入吞吐量的数据结构,它把数据分成多个层,每层采用不同的策略来管理数据,包括内存中的缓存、写入磁盘的SSTable、和合并SSTable的操作 。
5、hbase的核心数据结构为LSM树 。LSM树分为内存部分和磁盘部分 。内存部分是一个维护有序数据集合的数据结构 。RowKey与nosql数据库们一样,RowKey是用来检索记录的主键 。
6、HBase数据结构是什么?hbase的核心数据结构为LSM树 。LSM树分为内存部分和磁盘部分 。内存部分是一个维护有序数据集合的数据结构 。RowKey 与nosql数据库们一样,RowKey是用来检索记录的主键 。
Hbase扩容原理1、Hbase是列存储的非关系数据库 。传统数据库MySQL等,数据是按行存储的 。其没有索引的查询将消耗大量I/O 并且建立索引和物化视图需要花费大量时间和资源 。因此,为了满足面向查询的需求 , 数据库必须被大量膨胀才能满 足性能要求 。
2、Hbase的原型是google的BigTable论文,受到该论文思想的启发 , 目前作为hadoop的子项目来开发维护,用于支持结构化的数据存储 。
3、首先Hbase是依赖于HDFS和zookeeper的 。Zookeeper分担了Hmaster的一部分功能,客户端进行DML语句的时候,都是先跟ZK交互 。
4、BloomFilter是一个列族级别的配置属性,如果在表中设置了BloomFilter,那么HBase会在生成StoreFile时包含一份BloomFilter结构的数据,称其为MetaBlock;MetaBlock与DataBlock(真实的KeyValue数据)一起由LRU BlockCache维护 。
5、HBase数据写入通常会遇到两类问题 , 一类是写性能较差 , 另一类是数据根本写不进去 。

推荐阅读