startupOptions 讲解
startupOptions 有三个参数initial、earliest、latest
initial:因为binlog中不一定包含所有的数据,那么需要全表扫描所有的表,形成快照。常用于历史数据
earliest:从最早的变更日志开始读取(仅增量,忽略全量数据)。
latest:读binlog中最新的数据 ,常用实时表
在这里插入图片描述
算子并行度

kafka 事务方式

kafka两阶段时间不能超过flink第一阶段提交的时间,所以这里直接设置最大15分钟

上面的方式是kafka生产者的两阶段提交保证的事务,消费者也需要

