当前位置: 首页 > article >正文

【企业级分布式系统】Linux-Rsync远程同步

文章目录

  • rsync
    • 基本功能与特点
    • 工作原理
    • 应用场景
    • 配置与使用
    • 注意
  • rsync部署安装示例
    • 配置rsync源服务器
    • 发起端配置
    • 发起端配置rsync+inotify
    • 使用rsync快速删除大量文件

rsync

Remote Sync,远程同步。是一个开源的快速备份工具

基本功能与特点

  1. 跨主机同步:rsync可以在不同主机之间镜像同步整个目录树,非常适合异地备份、镜像服务器等应用。
  2. 增量备份:它支持增量备份,即只传输修改过的文件,大大提高了同步效率。
  3. 保持文件属性:rsync可以保持文件的权限、时间戳、软硬链接等元数据,确保同步后的文件与原始文件完全一致。
  4. 优化算法:采用优化的同步算法,并在传输前执行压缩,进一步提高了同步速度和效率。
  5. 安全传输:rsync可以通过SSH等安全协议进行远程同步,保障数据传输的安全性。

工作原理

rsync使用所谓的“Rsync算法”来使本地和远程两个主机之间的文件达到同步。这个算法只传送两个文件的不同部分(通过差分编码实现),而不是每次都整份传送,因此速度相当快。
具体的工作流程:

  1. 发起端(客户机)构造FileList,FileList包含了需要与同步源(服务器)同步的所有文件信息对(name->id)。
  2. 发起端将FileList发送到同步源。
  3. 同步源上运行的rsync进程处理FileList,构建NewFileList。其中根据MD5值的比较来删除同步源上已经存在的文件的信息对,只保留同步源上不存在或变化的文件。
  4. 发起端得到NewFileList后,将NewFileList中的文件重新传输到同步源。

应用场景

  1. 文件和目录备份:rsync可以对文件和目录进行快速、高效的备份。
  2. 文件镜像和复制:在分布式环境中,多个节点需要保持一致性。rsync可以实现节点间的文件同步和复制,使得分布式文件系统保持一致性并及时反映文件更改。
  3. 远程文件同步:rsync可以将本地和远程文件的变更快速地同步,通过网络进行文件传输,并自动检测并传输差异部分,从而减少网络带宽和传输时间。
  4. 自动化脚本运行:rsync可以结合脚本进行自动化的文件同步和备份。
  5. 带宽限制文件同步:rsync支持带宽限制同步,用户可以对上传和下载带宽进行限制控制。

配置与使用

  1. 服务端配置:需要配置rsyncd.conf文件,指定同步的目录、访问控制等。然后启动rsync守护进程,等待客户端连接。
  2. 客户端配置:客户端使用rsync命令发起同步操作,指定原始位置和目标位置。可以使用多种选项来控制同步的行为,如递归模式、压缩传输、保留文件属性等。

注意

  1. 权限问题:确保发起端对同步源上的文件具有读取权限,同时确保同步目标位置具有写入权限。
  2. 网络问题:在网络条件不好的情况下,可能需要调整rsync的传输参数以提高同步效率。
  3. 安全性:使用SSH等安全协议进行同步时,需要确保网络连接的安全性,防止敏感信息泄露。

rsync部署安装示例

首先关闭防火墙

systemctl stop firewalld
setenforce 0

配置rsync源服务器

  1. 检查rsync是否已安装
    rpm -q rsync  # 检查系统中是否已安装rsync
    
  2. 创建并配置/etc/rsyncd.conf文件
    vim /etc/rsyncd.conf  # 编辑rsync配置文件
    
    添加以下内容:
    uid = root            # 运行rsync的用户ID
    gid = root            # 运行rsync的组ID
    use chroot = yes      # 使用chroot,将进程限制在源目录中
    address = 192.168.80.10  # 监听的IP地址
    port = 873            # 监听的端口号
    log file = /var/log/rsyncd.log  # 日志文件的位置
    pid file = /var/run/rsyncd.pid  # 存放进程ID的文件位置
    hosts allow = 192.168.80.0/24  # 允许访问的客户机地址范围
    dont compress = *.gz *.bz2 *.tgz *.zip *.rar *.z  # 不压缩的文件类型
    
    [wwwroot]            # 共享模块名称
    path = /var/www/html  # 源目录的实际路径
    comment = Document Root of www.xy101.com  # 共享模块的描述
    read only = yes       # 设置为只读
    auth users = backuper  # 授权账户
    secrets file = /etc/rsyncd_users.db  # 存放账户信息的数据文件
    #如采用匿名的方式,只要将其中的“auth users”和“secrets file”配置项去掉即可。
    
  3. 创建账户信息数据文件
    vim /etc/rsyncd_users.db  # 编辑账户信息文件
    
    添加内容:
    backuper:abc123  # 用户名和密码
    
    chmod 600 /etc/rsyncd_users.db  # 设置文件权限,仅所有者可读写
    
  4. 确保源目录有读取权限
    chmod +r /var/www/html/  # 为源目录添加读取权限
    ls -ld /var/www/html/  # 列出源目录的详细信息
    
  5. 启动rsync服务
    rsync --daemon  # 以守护进程方式启动rsync服务
    netstat -anpt | grep rsync  # 检查rsync服务是否在监听端口
    
  6. 关闭rsync服务
    kill $(cat /var/run/rsyncd.pid)  # 杀死rsync进程
    rm -rf /var/run/rsyncd.pid  # 删除pid文件
    

发起端配置

  1. 基本格式和常用选项
    rsync [选项] 原始位置 目标位置  # rsync的基本使用格式
    
    常用选项:
  • -r:递归模式,包含目录及子目录中的所有文件。
  • -l:对于符号链接文件仍然复制为符号链接文件。
  • -v:显示同步过程的详细(verbose)信息。
  • -z:在传输文件时进行压缩(compress)。
  • -p:保留文件的权限标记。
  • -t:保留文件的时间标记。
  • -g:保留文件的属组标记(仅超级用户使用)。
  • -o:保留文件的属主标记(仅超级用户使用)。
  • -D:保留设备文件及其他特殊文件。
  • -H:保留硬连接文件。
  • -a:归档模式,保留文件的权限、属性等信息,等同于组合选项“-rlptgoD”。
  • -A:保留 ACL 属性信息。
  • --delete:删除目标位置有而原始位置没有的文件。
  • --checksum:根据校验和(而不是文件大小、修改时间)来决定是否跳过文件。
  1. 下载资源到本地备份
    rsync -avz backuper@192.168.80.10::wwwroot /opt/  # 使用rsync从远程服务器同步文件到本地目录
    
    rsync -avz rsync://backuper@192.168.80.10/wwwroot /opt/  # 使用rsync协议从远程服务器同步文件到本地目录
    
  2. 免交互格式配置
    echo "abc123" > /etc/server.pass  # 创建包含密码的文件
    chmod 600 /etc/server.pass  # 设置文件权限,仅所有者可读写
    crontab -e  # 编辑定时任务
    30 22 * * * /usr/bin/rsync -az --delete --password-file=/etc/server.pass backuper@192.168.80.10::wwwroot /opt/  # 每晚22:30执行rsync同步任务
    systemctl restart crond  # 重启定时任务服务
    systemctl enable crond  # 设置定时任务服务开机自启
    
  3. 使用ssh认证方式
    rsync 有两种常用的认证方式,一种为 rsync-daemon 方式,另外一种则是 ssh
    在一些场合,使用 rsync-daemon 方式会比较缺乏灵活性,ssh 方式则成为首选。
    rsync -avz -e 'ssh -p 22' /var/www/html/index.html root@192.168.80.10:/opt/  # 使用ssh协议进行rsync同步
    
    -e 'ssh -p 22':rsync 使用 ssh 指定端口,端口如果是 22 默认端口则不用指定该参数。

发起端配置rsync+inotify

使用inotify通知接口,可以用来监控文件系统的各种变化情况,如文件存取、删除、移动、修改等。利用这一机制,可以非常方便地实现文件异动告警、增量备份,并针对目录或文件的变化及时作出响应。
inotify机制与rsync工具相结合,可以实现触发式备份(实时同步),即只要原始位置的文档发生变化,则立即启动增量备份操作;否则处于静默等待状态。这样,就避免了按固定周期备份时存在的延迟性、周期过密等问题。
因为 inotify 通知机制由 Linux 内核提供,因此主要做本机监控,在触发式备份中应用时更适合上行同步。

  1. 修改rsync源服务器配置文件
    vim /etc/rsyncd.conf  # 编辑rsync配置文件
    
    修改read only = no,重启rsync服务。关闭只读,上行同步需要可以写
  2. 调整inotify内核参数
    vim /etc/sysctl.conf  # 编辑内核参数配置文件
    fs.inotify.max_queued_events = 16384  # 最大监控事件队列
    fs.inotify.max_user_instances = 1024  # 最多监控实例数
    fs.inotify.max_user_watches = 1048576  # 每个实例最多监控文件数
    sysctl -p  # 应用内核参数更改
    
  3. 安装inotify-tools
    tar zxvf inotify-tools-3.14.tar.gz -C /opt/  # 解压inotify-tools源码包
    cd /opt/inotify-tools-3.14  # 进入源码目录
    ./configure  # 配置编译选项
    make && make install  # 编译并安装inotify-tools
    
  4. 编写触发式同步脚本
    vim /opt/inotify.sh  # 编辑触发式同步脚本
    
    添加内容:
    #!/bin/bash
    INOTIFY_CMD="inotifywait -mrq -e modify,create,attrib,move,delete /var/www/html/"  # inotifywait命令,监控文件变化
    RSYNC_CMD="rsync -azH --delete --password-file=/etc/server.pass /var/www/html/ backuper@192.168.80.10::wwwroot/"  # rsync同步命令
    $INOTIFY_CMD | while read DIRECTORY FILE EVENT  # 循环读取监控结果
    do
        if [ $(pgrep rsync | wc -l) -le 0 ] ; then  # 如果rsync未在执行,则立即启动
            $RSYNC_CMD  # 执行rsync同步命令
        fi
    done
    
    chmod +x /opt/inotify.sh  # 设置脚本可执行权限
    chmod 777 /var/www/html/  # 设置源目录可读写执行权限
    chmod +x /etc/rc.d/rc.local  # 设置系统启动脚本可执行权限
    echo 'nohup /opt/inotify.sh &' >> /etc/rc.d/rc.local  # 将脚本添加到系统启动项
    

使用rsync快速删除大量文件

mkdir /home/blank  # 创建一个空目录
rsync --delete-before -a -H -v --progress --stats /home/blank/ /usr/local/nginx/proxy_temp/  # 使用rsync快速清空目标目录

选项说明:

  • --delete-before: 接收者在传输进行删除操作
  • -a: 归档模式,表示以递归方式传输文件,并保持所有文件属性
  • -H: 保持硬连接的文件
  • -v: 详细输出模式
  • --progress: 在传输时显示传输过程
  • --stats: 给出某些文件的传输状态

http://www.kler.cn/a/387613.html

相关文章:

  • golang常用标准库
  • 下载并安装MySQL
  • QT鼠标、键盘事件
  • 【源码解析】Java NIO 包中的 ByteBuffer
  • golang单元测试
  • 【Apache Paimon】-- 13 -- 利用 paimon-flink-action 同步 mysql 表数据
  • vue3实现一个无缝衔接、滚动平滑的列表自动滚屏效果,支持鼠标移入停止移出滚动
  • (Go语言)条件判断与循环?切片和数组的关系?映射表与Map?三组关系傻傻分不清?本文带你了解基本的复杂类型与执行判断语句
  • 2024 第五次周赛
  • Python数据分析——pandas
  • hhdb数据库介绍(9-4)
  • SpringBoot实现的汽车共享业务管理系统
  • go语言中的map类型详解
  • CSRF 令牌
  • mysql约束和高级sql
  • Docker:LXC容器操作实战
  • (没有跳过联网激活)导致使用微软账号激活电脑---修改为本地账户和英文名字
  • VSCode Snippets 如何帮助我们提高开发效率
  • 深度学习神经网络:开启智能未来的钥匙
  • C++11 --可变参数模版
  • 解锁视频 “声” 意,尽在“云剪辑”
  • ElfBoard技术贴|如何完成FRP内网穿透
  • 深度学习之卷积神经网络(CNN)
  • AndroidStudio-文本显示
  • dell服务器安装ESXI8
  • 架构零散知识点