Flink|Flink 实践教程-入门(8)( 简单 ETL 作业)
作者:腾讯云流计算 Oceanus 团队
流计算 Oceanus 简介
流计算 Oceanus 是大数据产品生态体系的实时化分析利器,是基于 Apache Flink 构建的具备一站开发、无缝连接、亚秒延时、低廉成本、安全稳定等特点的企业级实时大数据分析平台。流计算 Oceanus 以实现企业数据价值最大化为目标,加速企业实时化数字化的建设进程。
本示例使用流计算 Oceanus 平台的 ETL 功能,将 PostgreSQL 数据取出,经过时间转换函数处理后存入 PostgreSQL 中。用户无需编写 SQL 代码,只用在界面上进行简单的点击操作即可创建流计算 Oceanus ETL 作业。
操作视频
前置准备
创建流计算 Oceanus 集群
进入流计算 Oceanus 控制台 [1],点击左侧【集群管理】,点击左上方【创建集群】,具体可参考流计算 Oceanus 官方文档 创建独享集群 [2]。
创建 PostgreSQL 实例
进入 PostgreSQL 控制台 [3],点击左上角【新建】创建实例,具体参考 创建 PostgreSQL 实例 [4]。进入实例数据库,创建表。
-- 用于 Source CREATE TABLE public.oceanus8_output ( idINT, time_oneTIMESTAMP, PRIMARYKEY(id) ); -- 手动插入数据 INSERT INTO public.oceanus8_output VALUES (1,'2020-10-01 18:00:00'); INSERT INTO public.oceanus8_output VALUES (2,'2021-10-01 18:30:24'); -- 用于 Sink CREATE TABLE public.oceanus8_input ( idINT, transf_oneVARCHAR(50), transf_twoTIMESTAMP, const_fourINT, PRIMARYKEY(id) );
笔者这里使用 DBeaver 进行外网连接,更多连接方式参考官网文档 连接 PostgreSQL 实例 [5]流计算 Oceanus 作业 进入流计算 Oceanus 控制台 [1],点击左上角【新建】创建 ETL 作业,点击【开发调试】进入作业编辑页面。ETL 作业源端可以是 MySQL、PostgreSQL,目的端可以是 MySQL、PostgreSQL、ClickHouse 和 Elasticsearch。
1. 创建 Source 单击【数据源表】右侧【添加】按钮,选择
PostgreSQL
,选择并填写数据库表相关的信息。2. 创建 Sink 单击【数据目的表】右侧【添加】按钮,选择
PostgreSQL
,选择并填写数据库表相关的信息。3. 映射字段 编写需要创建映射字段的业务逻辑。这里使用
DATA_FORMAT
函数将 time_one
字段类型由 TIMESTAMP
映射为 STRING
,使用 TIMESTAMPADD
函数将 time_one
字段增加一周,并将常量 1000
存入 const_str
字段。文章图片
【Flink|Flink 实践教程-入门(8)( 简单 ETL 作业)】
ETL 作业开发详见流计算 Oceanus 官方文档 ETL 开发指南 [6]。
添加数据源表和目的表后,可配置字段映射。字段映射分为原字段映射和新增字段映射两个部分。
原字段映射 在左侧的数据源表中可以勾选本次 ETL 作业需要从数据源表抽取的数据字段,并在右侧选择要加载进目的表的对应的映射字段名称。这样在数据源表中的数据就会复制加载到目的表中。
新增字段映射 字段生成方式有计算字段和常量字段两种。
- 计算字段可以对从数据源表抽取出来的字段数据进行 内置函数 数值转换或者计算。
- 常量字段可以输入一个自定义常量字段到目的源表相应的字段中。
- 计算字段:字段取值可以输入字段值或者表达式,对每个满足的输入源数据进行表达式计算。将计算结果返回到数据目的表所选的映射字段中。
- 常量字段:字段取值可以输入字符串或者数字(输入类型与目的表类型要一致),这个常量字段取值将会加载到每一条数据目的表所选的映射字段中。
总结 流计算 Oceanus ETL 作业最简化了用户操作,开发人员甚至无需了解编程语言,只需要选择数据源表和目的表,并根据业务逻辑完成字段映射的配置,花费几分钟即可轻松启动 ETL 作业。
计算字段:可以对从数据源表抽取出来的字段数据进行 内置函数 [7] 数值转换或者计算。参考链接 [1] 流计算 Oceanus 控制台:https://console.cloud.tencent.com/oceanus/overview
常量字段:可以输入一个自定义常量字段到目的源表相应的字段中。
[2] 创建独享集群:https://cloud.tencent.com/document/product/849/48298
[3] PostgreSQL 控制台:https://console.cloud.tencent.com/postgres/index
[4] 创建 PostgreSQL 实例:https://cloud.tencent.com/document/product/409/56961
[5] 连接 PostgreSQL 实例:https://cloud.tencent.com/document/product/409/40429
[6] ETL 开发指南:https://cloud.tencent.com/document/product/849/59839
[7] 内置函数:https://cloud.tencent.com/document/product/849/18083
流计算 Oceanus 限量秒杀专享活动火爆进行中↓↓
文章图片
推荐阅读
- 2.6|2.6 Photoshop操作步骤的撤消和重做 [Ps教程]
- 漫画初学者如何学习漫画背景的透视画法(这篇教程请收藏好了!)
- 不废话,代码实践带你掌握|不废话,代码实践带你掌握 强缓存、协商缓存!
- 六项精进20180530
- 数据库|SQL行转列方式优化查询性能实践
- 【Day31课后实践】
- 用npm发布一个包的教程并编写一个vue的插件发布
- 20180322【w4复盘日志】
- 狗狗定点大小便视频教程下载地址
- SwiftUI|SwiftUI iOS 瀑布流组件之仿CollectionView不规则图文混合(教程含源码)