分布式文件系统和企业级应用 ——rsync远程同步

逆水行舟用力撑,一篙松劲退千寻。这篇文章主要讲述分布式文件系统和企业级应用 ——rsync远程同步相关的知识,希望能为你提供帮助。
rsync介绍

  1. rsync(Remote Sync,远程同步)是一个开源的快速备份工具,可以在不同主机之间镜像同步整个目录树,支持增量备份,并保持链接和权限,且采用优化的同步算法,传输前执行压缩,因此非常适用于异地备份、镜像服务器等应用
  2. rsync的官方站点的网址是 http://rsync.samba.org/,目前最新版本是3.1.3,由 Wayne Davison 进行维护。作为一种最常用的文件备份工具,rsync往往是Linux和UNIX系统默认安装的基本组件之一
rsync下行/拉取流程
分布式文件系统和企业级应用 ——rsync远程同步

文章图片

  1. 在远程同步任务中,负责发起rsync同步操作的客户机称为发起端,而负责响应来自客户机的rsync同步操作的服务器称为同步源。
  2. 在同步过程中,同步源负责提供文件的原始位置,发起端应对该位置具有读取权限
    例:
    A服务器同步B服务器的数据,B服务器就是备份源
    反过来,B服务器同步A服务器的数据,那么A服务器就是备份源
配置rsync下行同步1、基本思路
  • 建立rsyncd.conf配置文件、独立的rsunc账号文件
  • 启用rsync的 --daemon模式
    2、配置文件rsyncd.conf
  • 认证配置auth users、secrets file,不加则为匿名
    3、独立的账号文件
  • 用户名:密码
  • 每行一个用户记录
  • 独立的账号数据,不依赖系统账号
    4、启用rsync服务
  • 通过 --daemon独自提供服务,rsync --daemon
  • 执行kill $(cat /var/run/rsyncd.pid)关闭服务
rsync命令格式
rsync [选项]原始位置目标位置

常用选项 说明
-r 递归模式,包含目录及子目录中的所有文件
-l 对于符号链接文件仍然复制为符号链接文件
-v 显示同步过程的详细信息
-z 在传输文件时进行压缩
-a 归档模式,递归并保留对象属性,等同于-rlptgoD
-p 保留文件的权限标记
-t 保留文件的时间标记
-g 保留文件的属组标记(仅超级用户使用)
-o 保留文件的属主标记(仅超级用户使用)
-H 保留硬链接文件
-A 保留ACL属性信息
-D 保留设备文件及其他特殊文件
--delete 删除目标位置有而原始位置没有的文件
--checksum 根据对象的校验和来决定是否跳过文件
--checksum 根据对象的校验和来决定是否跳过文件
--password-file=file 从file中得到密码,用于免交互处理,file文件的权限要是600
2.配置rsync发起端测试备份Slave(192.168.163.20) 将指定的资源下载到本地/opt目录下进行备份
格式一:用户名@主机地址::共享模块名 rsync -avz backuper@192.168.163.10::wwwroot /opt/ #密码123456格式二:rsync://用户名@主机地址/共享模块名 rsync -avz rsync://backuper@192.168.163.10/wwwroot /opt/

免交互格式
echo "密码" > /etc/密码文件 chmod 600 /etc/密码文件#设置周期性任务 crontab -e 30 22 * * * /usr/bin/rsync -az --delete --password-file=/etc/密码文件 backuper@192.168.163.10::wwwroot /optsystemctl restart crond systemctl enable crond

rsync上行/推送流程
  1. Linux内核从 2.6.13 版本开始提供了inotify通知接口,用来监控文件系统的各种变化情况,如文件存取、删除、移动、修改等。利用这一机制,可以非常方便地实现文件异动告警、 增量备份,并针对目录或文件的变化及时作出响应
  2. 将inotify机制与rsync工具相结合,可以实现触发式备份(实时同步)——只要原始位 置的文档发生变化,则立即启动增量备份操作;否则处于静默等待状态,这样,就避免了按固定周期备份时存在的延迟性、周期过密等问题
  3. 因为inotify通知机制由linux内核提供,因此主要做本机监控,在触发式备份中应用时更适合上行同步
分布式文件系统和企业级应用 ——rsync远程同步

文章图片

1. 调整inotify内核参数(优化)
/etc/sysctl.conf(内核参数配置文件),需要配置 1)max_queue_events :监控事件队列大小 2)max_user_instances :最多监控实例 3)max_user_watches :每个实例最多监控文件数 4)配置的监控数量应该大于监控目标的总文件数例如: vim /etc/sysctl.conf max_queue_events = 16384 max_user_instances = 1024 max_user_watches = 1048576

2. 使用inotify-tools辅助工具
1)用inotify机制还需要安装 inotify-tools,以便提供 inotifywait、inotifywatch 辅助工具程序。 2)notifywait:可监控modify(修改)、create(创建)、move(移动)、delete(删除)、attrib(属性更改)等各种事件,一有变动立即输出结果。 3)inotifywatch:可用来收集文件系统变动情况,并在运行结束后输出汇总的变化情况例: inotifywait -mrq -e modify,create,attrib,move,delete 文件或目录 #参数解释# -m持续进行监控 -r递归监控所有子对象 -q简化输出信息 -e指定要监控哪些事件类型 modify修改 create创建 attrib属性更改 move移动 deletc删除

3. 编写触发式脚本(客户端)
vim /opt/inotify_rsynx.sh #!/bin/bash #定义两个变量:监控文件,执行备份 INOTIFY_CMD="inotifywait -mrq -e create,delete,move,modify,attrib /var/www/html/" 需要监控的目录或文件" RSYNC_CMD="rsync -azH --delete --password-file=/etc/1.pass /var/www/html/backuper@192.168.163.10::wwwroot/"密码文件 刚才监控的目录或文件 用户名@主机地址::共享模块名" #while read获取监控结果 $INOTIFY_CMD | while read DIRECTORY EVENT FILE do #如果rsync没有运行,执行rsync进行备份操作 if [ $(pgrep rsync | wc -l) -le 0 ] ; then $RSYNC_CMD fi donechmod +x inotify_rsynx.sh mkdir -p /var/www/html/ chmod 777 /var/www/html/ ls -ld /var/www/html/ chmod +x /etc/rc.d/rc.local echo "/root/jiankong.sh" > > /etc/rc.d/rc.local

实验
下行同步:将master服务器数据备份到slave服务器
主机 IP地址 安装包
Master 192.168.163.10 rsync
Slave 192.168.163.20 rsync / inotify-tools-3.14.tar.gz
1. 配置rsync源服务器(192.168.163.10) 1. 关防火墙、安装相应的软件
systemctl stop firewalld.service setenforce 0 #检查是否安装,一般系统已默认安装rsync rpm -q rsync yum -y install rsync

分布式文件系统和企业级应用 ——rsync远程同步

文章图片

2. 建立/etc/rsyncd.conf 配置文件
  • 如采用匿名的方式,只要将下面配置中的“auth users”和“secrets file”配置项去掉即可
    vim /etc/rsyncd.conf uid = root gid = root use chroot = yes address = 192.168.163.10 port 873 log file = /var/log/rsyncd.log pid file = /var/run/rsyncd.pid hosts allow = 192.168.163.0/24 [wwwroot] path = /var/www/html comment = Document Root of www.test.com read only = yes dont comperss = *.gz *.bz2 *.tgz *.zip *.rar *.z auth users = backuper lisi secrets file = /etc/rsyncd_users.db #---------配置解释---------------------------------------------- uid = root gid = root use chroot = yes#禁锢在源目录 address = 192.168.163.10#监听地址,监听本机地址 port 873#监听端口 tcp/udp 873,可通过cat /etc/services | grep rsync查看 log file = /var/log/rsyncd.log#日志文件位置 pid file = /var/run/rsyncd.pid#存放进程 ID 的文件位置 hosts allow = 192.168.163.0/24#允许同步的客户机网段 [wwwroot]#共享模块名称 path = /var/www/html#源目录的实际路径(同步的目录) comment = Document Root of www.test.com read only = yes#是否为只读 dont compress = *.gz *.bz2 *.tgz *.zip *.rar *.z#同步时不再压缩的文件类型 auth users = backuper zhangsan#授权账户,多个账号以空格分隔 secrets file = /etc/rsyncd_users.db#存放账户信息的数据文件

    分布式文件系统和企业级应用 ——rsync远程同步

    文章图片

3. 为备份账户创建数据文件
  • 无须建立同名系统用户
    vim /etc/rsyncd_users.db zhangsan:123456

chmod 600 /etc/rsyncd_users.db
![15.png](https://s2.51cto.com/images/20220226/1645856128875846.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![16.png](https://s2.51cto.com/images/20220226/1645856128340640.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 4. 保证所有用户对源目录/var/www/html(需要备份的文件目录)都有读取权限

yum -y install httpd
chmod +r /var/www/html
ls -ld /var/www/html
![17.png](https://s2.51cto.com/images/20220226/1645856329226274.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 5. 启动 rsync 服务程序 - 启动 rsync 服务,以独立监听服务的方式(守护进程)运行

rsync --daemon
netstat -natp | grep rsync
![18.png](https://s2.51cto.com/images/20220226/1645856539977504.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 6. 关闭 rsync 服务

kill $(cat /var/run/rsyncd.pid)
rm -rf /var/run/rsyncd.pid
![19.png](https://s2.51cto.com/images/20220226/1645856873408847.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 7. 创建文件用于测试

cd /var/www/html
echo " this is test" > > 1.txt
cat 1.txt
![19.png](https://s2.51cto.com/images/20220226/1645857089184498.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)## 1. Slave(192.168.163.20)

systemctl stop firewalld.service
setenforce 0
yum -y install rsync
cd /opt
mkdir abc
chmod 777 abc
vim /etc/server.pass
123456
chmod 600 /etc/server.pass
![20.png](https://s2.51cto.com/images/20220226/1645857613859531.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)## 2. 验证 #### 1)Master(192.168.163.10)

cd /var/www/html/
vim 1.html
![21.png](https://s2.51cto.com/images/20220226/1645860914260527.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)#### 2)Slave(192.168.163.20)

rsync -az --delete --password-file=/etc/server.pass lisi@192.168.163.10::wwwroot /opt/abc
ls abc
![22.png](https://s2.51cto.com/images/20220226/1645860927123444.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)#### 3)加入到计划性任务

企业中不可能手动执行,一般都要使用周期性任务
#设置周期性任务
crontab -e
0 2 * /usr/bin/rsync -az --delete --password-file=/etc/server.pass lisi@192.168.163.10::wwwroot /opt/abc
systemctl restart crond
systemctl enable crond
# rsync+inotify实时同步 ## 1. Master(192.168.163.10) - 修改rsync源服务器配置文件

vim /etc/rsyncd.conf
#关闭只读,上行同步需要可以写
read only = no
#重启服务
kill cat /var/run/rsyncd.pid
netstat -natp | grep rsync
rsync --daemon
netstat -natp | grep rsync
chmod 777 /var/www/html
![23.png](https://s2.51cto.com/images/20220226/1645862571809100.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![24.png](https://s2.51cto.com/images/20220226/1645862538555328.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)## 2. Slave(192.168.163.20) ### 1)调整 inotify 内核参数

max_queue_events(监控事件队列,默认值为16384)
max_user_instances(最多监控实例数,默认值为128)
max_user_watches(每个实例最多监控文件数,默认值为8192)
当要监控的目录、文件数量较多或者变化较频繁时,建议加大这三个参数的值。
cat /proc/sys/fs/inotify/max_queued_events
cat /proc/sys/fs/inotify/max_user_instances
cat /proc/sys/fs/inotify/max_user_watches
vim /etc/sysctl.conf
fs.inotify.max_queued_events = 17000
fs.inotify.max_user_instances = 1024
fs.inotify.max_user_watches = 1048576
sysctl -p
![25.png](https://s2.51cto.com/images/20220226/1645863900326537.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![26.png](https://s2.51cto.com/images/20220226/1645863900315352.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![27.png](https://s2.51cto.com/images/20220226/1645863900232281.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 2)安装 inotify-tools

yum -y install gcc gcc-c++ make
#放入安装包
tar zxvf inotify-tools-3.14.tar.gz -C /opt
cd /opt/inotify-tools-3.14/
./configure & & make & & make install
![28.png](https://s2.51cto.com/images/20220226/1645864809762865.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![29.png](https://s2.51cto.com/images/20220226/1645864809634081.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 3)编写触发式同步脚本

vim /opt/inotify_rsync.sh
#!/bin/bash
INOTIFY_CMD=" inotifywait -mrq -e create,delete,move,modify,attrib /opt/abc/"
RSYNC_CMD=" rsync -azH --delete --password-file=/etc/server.pass /opt/abc/ zhangsan@192.168.163.10::wwwroot"
$INOTIFY_CMD | while read DIRECTORY EVENT FILE
do
if [ $(pgrep rsync | wc -l) -le 0 ] ; then
$RSYNC_CMD
fi
done
cd /opt/
chmod +x inotify_rsync.sh
. /opt/inotify_rsync.sh &
#加入开机自动执行
chmod +x /etc/rc.d/rc.local
echo /opt/inotify_rsync.sh > > /etc/rc.d/rc.local
![30.png](https://s2.51cto.com/images/20220226/1645867064589500.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![31.png](https://s2.51cto.com/images/20220226/1645867064415938.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)## 3. 查看上行结果 ### 1)Slave(192.168.163.20)

cd /opt/abc
touch test.html
ls
rm -rf test.html
ls
### 2)Master(192.168.163.10)

cd /var/www/html
ls
![32.png](https://s2.51cto.com/images/20220226/1645867265509537.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![33.png](https://s2.51cto.com/images/20220226/1645867265970374.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)# 使用rsync来实现快速删除大量文件 ## 需求 假如要在Linux下删除大量文件,比如100万、1000万,像/usr/local/nginx/proxy_ temp的nginx缓存等,那么rm -rf *可能就不好使了,因为要等待很长一段时间。在这种情况下我们可以使用rsync来巧妙处理。rsync实际用的是替换原理## 步骤### 1. 建立一个空的文件夹并添加文件

mkdir /root/blank#空文件夹
mkdir /opt/test
cd /opt/test
touch 1..1000.txt#模拟大缓存文件
![34.png](https://s2.51cto.com/images/20220226/1645867694921541.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)### 2. 用rsync删除目标目录

rsync --delete-before -a -H -v --progress --stats /root/blank/ /opt/test#这样目标目录很快就被清空了
【分布式文件系统和企业级应用 ——rsync远程同步】ls /opt/test
![35.png](https://s2.51cto.com/images/20220226/1645867907382001.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)![36.png](https://s2.51cto.com/images/20220226/1645867907793925.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)


    推荐阅读