当前位置: 首页 > article >正文

阿里dataworks数据集成同步Mongodb数据到阿里

背景

数据入仓需求,来源数据类型为MongoDB,需要同步到阿里ODPS且历史数据同步完毕后设置增量同步。

不需要考虑来源数据schema,整条数据同步到ODPS中存入

同步单个数据集合

Step 1 准备工作

配置MongoDB数据源
在这里插入图片描述

Step 2 创建集成任务

在这里插入图片描述

Step 3 字段配置

1、固定字段配置
{"name":"_id","type":"string"}
{"name":"col_string","type":"string"}
{"name":"col_int32","type":"long"}
{"name":"col_int32_min","type":"long"}

在这里插入图片描述

2、Combine类型

在这里插入图片描述

2.1 保留全部信息-全部字段作为一个字段入仓

如果我不想要具体细分某个字段,想要全部字段

{"name":"col_combine","type":"combine"}

在这里插入图片描述

2.2 保留全部信息 - 拆分个别字段字段

所有数据中,我想要拆除2个字段,其余的所有数据仍旧保留下来,那么可以结合上面两个方法

{"name":"_id","type":"string"}
{"name":"timestamp","type":"string"}
{"name":"col_combine","type":"combine"}

在这里插入图片描述

在这里插入图片描述

多个集合同步

参考文档

“DataWorks支持哪些MongoDB数据同步能力_大数据开发治理平台 DataWorks(DataWorks)-阿里云帮助中心.” Aliyun.com, 18 Apr. 2023, help.aliyun.com/zh/dataworks/user-guide/mongodb-data-source?spm=a1z3jh.13523495.0.0.713f6242HRd1Vh#section-7am-fsh-gum. Accessed 15 Oct. 2024.

“如何通过数据集成将MongoDB的数据离线同步至MaxCompute_大数据开发治理平台 DataWorks(DataWorks)-阿里云帮助中心.” Aliyun.com, 22 Feb. 2023, help.aliyun.com/zh/dataworks/user-guide/use-a-batch-synchronization-node-to-read-data-from-a-mongodb-data-source?spm=a2c4g.11186623.0.i15. Accessed 15 Oct. 2024.


http://www.kler.cn/news/356883.html

相关文章:

  • 电脑基础知识:mfc110.dll丢失的解决方法
  • 【p2p、分布式,区块链笔记 Blockchain】truffle001 以太坊开发框架truffle初步实践
  • 华为OD机试真题---货币单位换算
  • 单独配置LVS负载均衡服务器+web
  • C#学习笔记(四)
  • TCP/IP传输协议,易懂!!!
  • PHP(一)从入门到放弃
  • 速盾:cdn 速度取决于什么?
  • 【H2O2|全栈】关于CSS(14)如何完成常规的页面布局
  • 简单实现通过电脑操作手机
  • 【优选算法】探索双指针之美(一):双指针与单调性的完美邂逅
  • MySQL 异常: “Host ‘xxx‘ is not allowed to connect to this MySQL server“
  • IMX6UL的RGB的显示实验
  • 一起搭WPF架构之LiveCharts.Wpf的简单了解与安装
  • 微信小程序-封装通用模块
  • Mac 远程 Windows 等桌面操作系统工具 Microsoft Remote Desktop for Mac 下载安装详细使用教程
  • 《仓库猎手模拟》风灵月影游戏辅助使用教程
  • 数据库原理与应用(基于MySQL):实验六数据查询
  • 【Golang】Go语言http编程底层逻辑实现原理与实战
  • 大数据治理:技术挑战与解决方案