当前位置: 首页 > article >正文

Flink-CDC实时读Postgresql数据

前言

        CDC,Change Data Capture,变更数据获取的简称,使用CDC我们可以从数据库中获取已提交的更改并将这些更改发送到下游,供下游使用。这些变更可以包括INSERT,DELETE,UPDATE等。

用户可以在如下的场景使用cdc:

  • 实时数据同步:比如将Postgresql库中的数据同步到我们的数仓中。
  • 数据库的实时物化视图。

Postgresql数据库配置

Postgresql参数修改

# 更改wal日志方式为logical
wal_level = logical # minimal, replica, or logical
# 更改solts最大数量(默认值为10),flink-cdc默认一张表占用一个slots
max_replication_slots = 20 # max number of replication slots
# 更改wal发送最大进程数(默认值为10),这个值和上面的solts设置一样
max_wal_senders = 20 # max number of walsender processes
# 中断那些停止活动超过指定毫秒数的复制连接,可以适当设置大一点(默认60s)
wal_sender_timeout = 180s # in milliseconds; 0 disable  

新建用户并且给用户赋流权限

-- 创建用户 cdc_user
CREATE USER cdc_user PASSWORD 'cdc';

-- 授权连接
GRANT CONNECT ON DATABASE postgres TO cdc_user;

-- 给用户复制流权限
ALTER ROLE cdc_user replication;

-- 授权public的使用
GRANT USAGE ON SCHEMA PUBLIC TO cdc_user;

创建复制槽

---- 创建复制槽
-- wal2json decoder_raw test_decoding pgoutput
select pg_create_logical_replication_slot('cdc_1','wal2json');<

http://www.kler.cn/a/234092.html

相关文章:

  • 【数据科学导论】第一二章·大数据与数据表示与存储
  • WPF Binding 绑定
  • 【Spring】Spring框架之-AOP
  • leetcode45.跳跃游戏II
  • 基于 uniapp 开发 android 播放 webrtc 流
  • RabbitMQ消息可靠性保证机制7--可靠性分析-rabbitmq_tracing插件
  • HiveSQL——连续增长问题
  • ECMAScript Modules规范的示例详解
  • 微信小程序(四十)API的封装与调用
  • 【J2EE笔记】2万字!我当时学习时做的笔记
  • vue3 之 商城项目—项目搭建起步
  • JAVA学习笔记9
  • 力扣[面试题 01.02. 判定是否互为字符重排(哈希表,位图)
  • 使用client-only 解决组件不兼容SSR问题
  • 【十四】【C++】list 的常见用法
  • 【Qt 学习之路】在 Qt 使用 ZeroMQ
  • Rust基础拾遗--核心功能
  • 深入探究 HTTP 简化:httplib 库介绍
  • 用EXCEL从地址(上海)中提取各区(浦东新区等区)信息
  • 【笔记】Harmony学习:下载安装 DevEco Studio 开发工具IDE
  • Stable Diffusion 模型下载:GhostMix(幽灵混合)
  • 海外云手机——平台引流的重要媒介
  • NAS如何成为生产力?使用绿联DX4600 Pro搭建图床并实现创作自由
  • Solidworks:平面草图练习
  • 前端小案例——动态导航栏文字(HTML + CSS, 附源码)
  • C# CAD交互界面-自定义面板集-添加快捷命令(五)