当前位置: 首页 > article >正文

使用AWS Redshift从AWS MSK中读取数据

Amazon Redshift 流式摄取的目的是简化将流式数据直接从流式服务摄取到 Amazon Redshift 或 Amazon Redshift Serverless 的过程。

官方文档[1]中有详细步骤。用unauthenticated, IAM 的方式均可以进行连接,只不过使用的是不同端口:9092或者9098

[1] https://docs.amazonaws.cn/redshift/latest/dg/materialized-view-streaming-ingestion-getting-started-MSK.html

使用IAM方式:

dev=# CREATE EXTERNAL SCHEMA external_schema_name_msk
FROM MSK
IAM_ROLE default
AUTHENTICATION iam
URI 'b-3.testtest.6ruea7.c2.kafka.cn-northwest-1.amazonaws.com.cn:9098';
CREATE SCHEMA
Time: 309.537 ms

dev=# SELECT schemaname, tablename
FROM SVV_EXTERNAL_TABLES
WHERE schemaname = 'external_schema_name_msk';
        schemaname        |      tablename
--------------------------+---------------------
 external_schema_name_msk | __amazon_msk_canary
 external_schema_name_msk | __consumer_offsets
 external_schema_name_msk | kafka-default-topic
(3 rows)

dev=# CREATE MATERIALIZED VIEW common_msk_cdp_wecom_tag AUTO REFRESH YES AS
SELECT * FROM external_schema_name_msk."kafka-default-topic";
CREATE MATERIALIZED VIEW
Time: 667.501 ms

dev=# select kafka_timestamp from common_msk_cdp_wecom_tag;
 kafka_timestamp 
-----------------
(0 rows)

Time: 18.564 ms

dev=# refresh MATERIALIZED VIEW common_msk_cdp_wecom_tag;
INFO:  Materialized view common_msk_cdp_wecom_tag was incrementally updated successfully. Stream returned no new data.
REFRESH
Time: 1493.006 ms

dev=# select kafka_timestamp from common_msk_cdp_wecom_tag;
     kafka_timestamp
-------------------------
 2024-10-12 04:49:19.693
 2024-10-12 04:49:20.136
 2024-10-12 04:49:20.193
 2024-10-12 04:49:20.206
 2024-10-12 04:49:20.214
 2024-10-12 04:49:20.241
 2024-10-12 04:49:20.248
 2024-10-12 04:49:20.256
(8 rows)

Time: 6141.639 ms

使用Unauthenticated 方式:

dev=# CREATE EXTERNAL SCHEMA msktest
dev-# FROM MSK
dev-# IAM_ROLE 'arn:aws-cn:iam::123456789:role/shiranredshift'
dev-# AUTHENTICATION none
dev-# CLUSTER_ARN 'arn:aws-cn:kafka:cn-north-1:123456789:cluster/shiranmsk/03260cbd-b23c-442f-a858-8af96e6b90de-2';
CREATE SCHEMA
dev=#
dev=#
dev=# CREATE MATERIALIZED VIEW mskview AUTO REFRESH YES AS
dev-# SELECT *
dev-# FROM msktest."mirror1";
CREATE MATERIALIZED VIEW
dev=#
dev=#
dev=# select * from mskview;
 kafka_partition | kafka_offset | kafka_timestamp_type | kafka_timestamp | kafka_key | kafka_value | kafka_head
ers | refresh_time
-----------------+--------------+----------------------+-----------------+-----------+-------------+-----------
----+--------------
(0 rows)

dev=#

http://www.kler.cn/a/375993.html

相关文章:

  • 图数据库 | 18、高可用分布式设计(中)
  • SUN的J2EE与微软的DNA
  • 无公网IP 实现外网访问本地 Docker 部署 Navidrome
  • 数字人助力企业出海增长,魔珐科技亮相2025晋江跨境电商峰会
  • 金融项目实战 05|Python实现接口自动化——登录接口
  • apidoc thinkphp likeadmin 遇到解析报错
  • Dropout 技术:防止神经网络过拟合的有效手段
  • 20241029软考架构-------软考案例9答案
  • AI 大模型的发展趋势是怎样的?
  • 量子神经网络(Quantum Neural Network):结合量子计算的 AI 新探索
  • cv.dnn.blobFromImage参数详解
  • Unity项目使用的.net版本
  • 【网络】HTTP(超文本传输协议)详解
  • Java面试题十五
  • 基于大数据的智能家居销量数据分析
  • 基于OSS搭建在线教育视频课程分享网站
  • 提升效率:中小企业常用的8款任务管理工具
  • 官方源码,LVDS中判断数据是否对齐时钟上升沿的方法解析
  • kkfileview4.2.1 LibreOffice_7.1.4_Linux_x86-64_rpm.tar.gz
  • 【25届秋招】蚂蚁集团 0825算法岗笔试
  • Nginx开发实战——网络通信(一)
  • 免费开放商用!Stability AI推轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型
  • 在线体验Sketch中文版,免费下载即刻上手!
  • ubuntu怎么查看端口占用进程
  • Vue3访问页面时自动获取数据
  • 真题与解析 202112三级 青少年软件编程(Python)考级