当前位置: 首页 > article >正文

flink StreamGraph解析

Flink程序有三部分operation组成,分别是源source、转换transformation、目的地sink。这三部分构成DAG。

DAG首先生成的是StreamGraph。

用户代码在添加operation的时候会在env中缓存(变量transformations),在env.execute()执行的时候才会生成对应StreamGraph。

生成StreamGraph

transformations中只存了3个变量,其实是5个。

getStreamGraph顾名思义就是生成StreamGraph。

最后是getStreamGraphGenerator(transformations).generate()生成。getStreamGraphGenerator获取生成器,generate生成StreamGraph

generate方法中首先创建了StreamGraph对象,再遍历transformations给StreamGraph添加相关操作信息(transform(transformation))。其余部分都是处理相关的运行参数(执行参数、checkpoint参数、savepoint参数等)

transform中主要有三部分。

没有并行度,添加并行度

要是指定了slotGroup,将需要的slot资源记录到slotSharingGroupResources中

最后实际转换。优先使用_translatorMap_中存在的translator。这些translator是已经定义好的解释器,可以根据不同场景选择是流模式还是批模式。传统是legacyTransform

legacyTransform

根据情况处理单个流输入或多个流输入。

translate根据情况选择批处理或者流处理

addOperator和addEdge是重点方法,添加顶点和边。

StreamEdge

一个edge连接上下游两个node。

edgeId:唯一id

sourceId、targetId:连接的上下游node的id

outputPartitioner:分区器

StreamNode

一个node可以有多个edge

inEdges、outEdges:node的入边和出边

jobVertexClass:封装用户函数的执行类

StreamGraph

有多个streamNodes组成,streamNodes之间是streamEdge相连。

类似以下这种:

streamNodes:缓存graph所有的node

sources:DAG的输入源集合

sinks:DAG的输出源集合

添加node

addSink、addSource、addOperator是主要方法。可以看到addSink、addSource也是addOperator。

addOperator中addNode是添加StreamNode的方法。

addNode就是创建StreamNode对象,并添加到streamNodes中。

添加edge

方法是addEdge,内部调用addEdgeInternal

addEdgeInternal中前面是处理虚拟节点的。后面是调用createActualEdge来添加

createActualEdge中首先确定partitioner,没有指定partitioner就优先使用ForwardPartitioner,要求上下游并行度一样,否则使用RebalancePartitioner。

然后创建StreamEdge对象,并将相关信息绑定到对应的StreamNode上。


http://www.kler.cn/a/521513.html

相关文章:

  • origin如何在已经画好的图上修改数据且不改变原图像的画风和格式
  • 我的AI工具箱Tauri+Django内容生产介绍和使用
  • 搜索引擎快速收录:关键词布局的艺术
  • 【Block总结】动态蛇形卷积,专注于细长和弯曲的局部结构|即插即用
  • 上位机知识篇---GitGitHub
  • FAST-DDS and ROS2 RQT connect
  • 为何SAP S4系统中要设置MRP区域?MD04中可否同时显示工厂级、库存地点级的数据?
  • Hive:内部表和外部表,内外转换
  • 企业微信开发009_使用WxJava企业微信开发框架_封装第三方应用企业微信开发002_并且实现多企业授权访问---企业微信开发011
  • C#实现SQL Server数据血缘关系生成程序
  • C++初阶—string类
  • MS10-087 挂马漏洞复现
  • FastExcel使用详解
  • three.js+WebGL踩坑经验合集(5.1):THREE.Line2又一坑:镜像后不见了
  • jEasyUI 创建复杂布局
  • 【知识科普】HTTP相关内容说明
  • JavaWeb 学习笔记 XML 和 Json 篇 | 020
  • 单片机基础模块学习——PCF8591芯片
  • Mac m1,m2,m3芯片使用nvm安装node14报错
  • Excel制作合同到期自动提醒!
  • ESP32服务器和PC客户端的Wi-Fi通信
  • 海浪波高预测(背景调研)
  • Linux——rzsz工具
  • 反向代理模块。。
  • Unity——从共享文件夹拉取资源到本地
  • 1_相向双指针_leetcode_15_2