【工作】Flink源码目录结构全貌
基于 flink1.13.0 202105
flink-annotations
一些注解flink-clients
客户端提交任务相关 包括Graph解析和转换flink-connectors
环境校验 与JobMaster通信等
实现了一堆官方数据源连接器:Cassandra,Hbase,ES,Kafka,Hive,RabbitMQ,JDBC等flink-container
有几个需要重点关注
flink-file-sink-common:分布式数据入库框架,Bucket、Bulk写的抽象、文件管理、策略等
flink-connector-files:基于文件的各种数据源,Split、Reader、Format各种定义
没啥用 passflink-contrib
没啥用 passflink-core
框架的核心flink-dist
定义了类型系统、IO、内存模型、State、Operation、Transform、Function体系、Graph、Job、Task等抽象
是执行引擎
打大包的描述flink-docs
文档flink-end-to-end-tests
样例工程 只是更上层 如kafka-kafkaflink-examples
样例工程flink-external-resources
外部资源框架的驱动如GPUflink-filesystems
各种FS的适配如Hadoop、Amazonflink-formats
应该是针对SQL模块的文件格式读写实现flink-fs-tests
CSV、AVRO、Parquet、ORC、JSON等
【需要细看】
passflink-java
Java API 封装和一些共性类 环境操作等flink-jepsen
好像是自动化测试相关的flink-kubernetes
k8s集成flink-libraries
图计算Gelly、复杂事件处理CEP框架、带状态处理函数State Procesing框架 几个库flink-mesos
【TODO 这里的State Procesing 和flink中的状态不是一个事情 这里更多应该是以状态函数为核心的分布式部署方式 不是计算中带状态】
mesos集成 passflink-metrics
定义了指标系统和几个输出实现如log/jmx/promethus等flink-optimizer
不清楚是不是针对SQL框架的优化器flink-python
passflink-queryable-state
集群中状态共享和注册相关的?flink-quickstart
passflink-runtime
【也是核心 运行时 实现 】flink-runtime-web
各种通信、调度、管理等
passflink-scala
Scala APIflink-scala-shell
passflink-state-backends
状态存储后端flink-streaming-java
有heap/rocksdb实现
流计算DataStream的定义相关和apiflink-streaming-scala
数据结构、Graph表示、水印、状态、Window实现等
scala版flink-table
parser/planer/runtime 挺复杂的 SQL模块flink-test-utils-parent
passflink-tests
passflink-walkthroughs
pass 文档里的例子工程flink-yarn
passflink-yarn-tests
【【工作】Flink源码目录结构全貌】pass
推荐阅读
- 宽容谁
- 我要做大厨
- 增长黑客的海盗法则
- 画画吗()
- 2019-02-13——今天谈梦想()
- 远去的风筝
- 三十年后的广场舞大爷
- 叙述作文
- 20190302|20190302 复盘翻盘
- 学无止境,人生还很长