TDengine|TDengine 可通过数据同步工具 DataX 读写
小 T 导读:DataX 是由阿里云开源的离线数据同步工具/平台,目前已经支持多种主流异构数据源在内的高效的数据互相同步功能。我们的研发团队完成了 TDengine 的适配,相关代码已被 DataX 官方接受并合并到主干中。DataX 是由阿里云开源的离线数据同步工具/平台,目前已经实现了包括 MySQL、Oracle、OceanBase、SQL Server、PostgreSQL、HDFS、Hive、HBase 等多种异构数据源在内的高效的数据互相同步功能。
DataX 的设计思路是:
DataX 本身作为数据同步框架,将不同数据源的同步抽象为从数据源读取数据的 Reader 插件,以及向目标端写入数据的 Writer 插件,理论上 DataX 框架可以支持任意数据源类型的数据同步工作。同时 DataX 插件体系作为一套生态系统,每接入一套新数据源,就可以实现该数据源和现有数据源的互通。基于该设计思路,我们的研发团队完成了 TDengine 的适配,实现了 TDengineReader 和 TDengineWriter 两个插件,并被 DataX 官方接受,合并到了其主干中。
TDengineReader 提供的功能包括:
- 支持通过 SQL 进行数据筛选;
- 根据时间间隔进行任务切分;
- 支持 TDengine 的全部数据类型;
- 支持批量读取,可以通过 batchSize 参数控制批量拉取结果集的大小,从而提高读取性能。
- 支持 OpenTSDB 的 json 格式的行协议,可以使用 TDengine 的 Schemaless 方式写入 TDengine。
- 支持批量写入,可以通过 batchSize 参数控制批量写入的数量,从而提高写入性能。
文章图片
现在,如果用户要将历史 Database(比如 MySQL、OpenTSDB 等)中的数据迁移到 TDengine,或者将 TDengine 中的数据导出,就可以利用 DataX 来实现了。
更多使用细节,可以参考“基于 DataX 的 TDengine 数据迁移工具”一文。
基于 DataX 的 TDengineWriter 和 TDengineReader 的实现和最新动态,请关注:https://github.com/taosdata/D...
【TDengine|TDengine 可通过数据同步工具 DataX 读写】想了解更多 TDengine Database的具体细节,欢迎大家在GitHub上查看相关源代码。
文章图片
推荐阅读
- 全数据库创建语句(包含所有数据类型)
- CentOS中实现基于Docker部署BI数据分析
- 云原生数据湖以存储、计算、数据管理等能力通过信通院评测认证
- 数据分析|【20220623】【信号处理】深入理解Pearson相关系数和Matlab corr()、corrcoef()仿真
- R语言绘图数据可视化Ridgeline|R语言绘图数据可视化Ridgeline plot山脊图画法
- log4net 控制台和文件和数据库输出三种方式
- 三行Python代码,实现数据库和excel之间的导入导出!
- SQL数据分析实战(好用的窗口函数)
- 记录一下MySql|记录一下MySql update会锁定哪些范围的数据
- 开源一款监控数据采集器,啥都能监控