当前位置: 首页 > article >正文

msyql迁移到mongodb

关系型数据库迁移到mongodb的理由
高并发需求,关系型数据库不容易扩展
快速迭代
灵活的json模式
大数据量需求

应用迁移难度:
关系型到关系
oracle-》mysql oracle -》 postgresql
关系到文档-
oracle -》 mongodb
需要考虑:
总体架构(单体到分布式)
模式设计(关系模式到文档模型)
SQL语句/储存过程/JDBC/ORM
数据迁移(如何处理已有数据?)

模式设计:
针对已有关系模型,考虑如何用文档模型进行设计

方法一:使用mongexport

一次性导入,需要停机

1.数据库导出

mysql添加参数secure-file-priv=/tmp #/tmp为导出的目录
方法一:
mysqldump导出:
-T 参数用于指定导出结果的目录和表文件名前缀,会导出txt格式的数据
mysqldump -uroot -p123456 test -T /tmp/
cat /tmp/testlog.txt

select导出:
select * from test.testlog into outfile ‘/tmp/testlog.csv’;

导出后添加,号 sed -i.bak ‘s/\t/,/g’ testlog.txt

2.导入
mongoexport导入
方法一

 --headerline -第一行做为mongodb中的列,要编辑testlog.txt添加列
 mongoimport  -d test -c testlog --headerline --type=csv /tmp/testlog.txt
2023-11-30T00:46:52.430+0800	connected to: mongodb://localhost/
2023-11-30T00:46:52.756+0800	29757 document(s) imported successfully. 0 document(s) failed to import.

在这里插入图片描述

方法二
-f指定列(就是mongodb中的列)导入
mongoimport -d test -c testlog -f id,name,salary --type=csv /tmp/testlog.txt

mongodb查看文档信息正常
test> use test
already on db test
test> db.testlog.find()

在这里插入图片描述

db.dropDatabase() 删除当前数据库

方法二:批量同步

安装同步工具(如kettle/Talend)
创建输入源(关系型数据库)
创建输入源(mongodb)
编辑数据同步任务
执行
备注:
适用3变量同步,定期更新,特别是每晚跑批
支持基于时间戳的增量同步,需要源表有合适的时间戳支持
对源库有明显的性能影响,不宜频繁查询
不支持实时同步

三 实时同步

安装实时同步工具(如informatica/Tapdata)
创建输入
创建输入源(关系型数据库)
创建输入源(mongodb)
编辑实时数据同步任务
执行

备注:
基于源库的日志文件解析进制,可以实现秒级数据同步
对源库性能影响较少
可以支持应用的无缝迁移

四 应用主导迁移

应用程序写代码

在这里插入图片描述


http://www.kler.cn/news/150333.html

相关文章:

  • SpringCloudSleuth+Zipkin 整合及关键包汇总
  • 机器学习与 S3 相集成 :释放数据的力量
  • YOLOv5改进之ShuffleNetV2
  • springboot 使用脚本进行启动部署
  • 绘制彩色正多边形-第11届蓝桥杯选拔赛Python真题精选
  • 【MySQL库的操作】
  • 边界突破之linux系统上线Cobalt Strike
  • android 特殊权限处理
  • QT之QMediaPlayer的用法
  • Reactor模式
  • 从0开始学习JavaScript--JavaScript 模板字符串的全面应用
  • 【论文学习】机器学习模型安全与隐私研究综述
  • 05_MySQL主从复制架构
  • NX二次开发UF_CURVE_create_joined_feature 函数介绍
  • 重要端口及服务速查
  • docker搭建rabbit集群
  • base64转PDF
  • Debian arm系统安装wxPython
  • ubuntu下训练自己的yolov5数据集
  • C++ 通过CryptoPP计算Hash值
  • 从0开始学习JavaScript--JavaScript 工厂模式
  • Nginx 实现动静资源分离和负载均衡
  • 数据库系统原理——备考计划2:数据库系统的概述
  • EasyRecovery数据恢复软件好不好用?有哪些功能
  • docker 中的–mount 和-v 参数有啥区别
  • gRPC之grpc负载均衡(resolver)
  • 升级openssh以及回滚,telnet远程链接
  • 园区智能配电系统(电力智能监控系统)
  • tomcat调优配置
  • F. Magic Will Save the World