hbase|HBase snapshot分析

HBase以往数据的备份基于distcp或者copyTable等工具,这些备份机制或多或少对当前的online数据读写存在一定的影响,Snapshot提供了一种快速的数据备份方式,无需进行数据copy。
参见下图
hbase|HBase snapshot分析
文章图片

Snapshot包括在线和离线的,在线方式,
离线方式是disabletable,由HBase Master遍历HDFS中的table metadata和hfiles,建立对他们的引用。
在线方式是enabletable,由Master指示region server进行snapshot操作,在此过程中,master和regionserver之间类似两阶段commit的snapshot操作。
hbase|HBase snapshot分析
文章图片

HFile是不可变的,只能append和delete, region的split和compact,都不会对snapshot引用的文件做删除(除非删除snapshot文件),这些文件会归档到archive目录下,进而需要重新调整snapshot文件中相关hfile的引用位置关系。
hbase|HBase snapshot分析
文章图片


基于snapshot文件,可以做clone一个新表,restore,export到另外一个集群中操作;其中clone生成的新表只是增加元数据,相关的数据文件还是复用snapshot指定的数据文件
参见clone新表操作示意图:
hbase|HBase snapshot分析
文章图片

snashot相关的操作命令如下,
快照:
【hbase|HBase snapshot分析】hbase> snapshot 'myTable','myTableSnapshot-122112'
列出当前所有得快照:
hbase> list_snapshots
删除快照信息:
hbase> delete_snapshot'myTableSnapshot-122112'
基于快照,clone一个新表:
hbase> clone_snapshot'myTableSnapshot-122112', 'myNewTestTable'
基于快照恢复表:
hbase> disable 'myTable'
hbase> restore_snapshot'myTableSnapshot-122112'
导出到另外一个集群中:
$bin/hbase class org.apache.hadoop.hbase.snapshot.tool.ExportSnapshot -snapshotMySnapshot -copy-to hdfs:///srv2:8082/hbase -mappers 16




    推荐阅读