运维|Redis集群(一)

目录

简介
Redis主从复制
主从复制的作用
主从复制的流程
搭建主从复制
安装redis
主从服务器操作
验证主从
哨兵模式
哨兵模式原理
哨兵模式作用
哨兵模式结构组成
故障转移机制
搭建哨兵模式
环境
修改哨兵模式的配置文件
验证
简介 虽然Redis可以实现单机的数据持久化,但无论是RDB也好或者AOF也好,都解决不了单点宕机问题,即一旦单台 redis服务器本身出现系统故障、硬件故障等问题后,就会直接造成数据的丢失,此外单机的性能也是有极限的,因此需要使用另外的技术来解决单点故障和性能扩展的问题。
主从复制:主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。缺陷:故障恢复无法自动化; 写操作无法负载均衡; 存储能力受到单机的限制。
哨兵:在主从复制的基础上,哨兵实现了自动化的故障恢复。缺陷:写操作无法负载均衡:存储能力受到单机的限制; 哨兵无法对从节点进行自动故障转移,在读写分离场景下,从节点故障会导致读服务不可用,需要对从节点做额外的监控、切换操作。
集群:通过集群,Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。
Redis主从复制主从复制,是指将一台redis服务器的数据,复制到其他的redis服务器。前者称为主节点(master),后者称为从节点(slave);数据复制是单向的,只能由主节点到从节点。
默认情况下,每台redis服务器都是主节点;且一个主节点可以有多个从节点(或者没有从节点),但是每一个从节点只能有一个主节点。
主从复制的作用 1、数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
2、故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复; 实际上是一种服务的冗余。
3、负载均衡:在主从复制的基础.上,配合读写分离,可以让主节点提供写服务,由从节点提供读服务〈即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载; 尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
4、高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
主从复制的流程 1、若启动一个Slave机器,则它会向Master机器发送一个"sync command"命令,请求同步连接。从发给主
2、无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中。
3、后台进程完成缓存操作之后,Master机器就会向Slave机器发送数据文件存储,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若slave出现故障导致宕机,则恢复正常后会自动重新连接。
4、Master机器收到Slave端机器的连接后,将其完整的数据文件发送给slave端机器,如果Master同时收到多个slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。
搭建主从复制

master节点:192.168.37.100
slave节点1:192.168.37.101
slave节点2:192.168.37.102
要把所有的防火墙关闭
安装redis
安装前先安装依赖包
[root@localhost /opt]# yum install -y gcc gcc-c++ make

将redis-5.0.7.tar.gz 压缩包上传到/opt目录中
运维|Redis集群(一)
文章图片

[root@localhost /opt]# tar -zxf redis-5.0.7.tar.gz

由于Redis源码包中直接提供了Makefile 文件,所以在解压完软件包后,不用先执行./configure 进行配置,可直接执行make与make install命令进行安装
[root@localhost /opt/redis-5.0.7]# make

运维|Redis集群(一)
文章图片

[root@localhost /opt/redis-5.0.7]# make PREFIX=/usr/local/redis install

运维|Redis集群(一)
文章图片

执行软件包提供的 install_server.sh 脚本文件设置Redis服务所需要的相关配置文件
运维|Redis集群(一)
文章图片

查看是否启动
[root@localhost /opt/redis-5.0.7/utils]# ss -natp |grep redis LISTEN0128127.0.0.1:6379*:*users:(("redis-server",pid=98106,fd=6))

在添加一个属于自己的IP地址,(添不添无所谓,因为做主从的时候就直接设置为任意网端了)
[root@localhost /opt/redis-5.0.7/utils]# vim /etc/redis/6379.conf

运维|Redis集群(一)
文章图片

重启
[root@localhost /opt/redis-5.0.7/utils]# /etc/init.d/redis_6379 restart Stopping ... Waiting for Redis to shutdown ... Redis stopped Starting Redis server...

在查看端口
[root@localhost /opt/redis-5.0.7/utils]# ss -natp |grep redis LISTEN0128192.168.37.100:6379*:*users:(("redis-server",pid=98241,fd=7)) LISTEN0128127.0.0.1:6379*:*users:(("redis-server",pid=98241,fd=6))

把redis的可执行程序文件放入路径环境变量的目录中便于系统识别
[root@localhost /opt/redis-5.0.7/utils]# ln -s /usr/local/redis/bin/* /usr/local/bin/

另外两台从服务也要安装redis!!!!!
主从服务器操作
------------------------------------------------------主节点------------------------------------------------------------------
修改配置文件
[root@localhost /opt/redis-5.0.7]# vim /etc/redis/6379.conf

71行:
运维|Redis集群(一)
文章图片

138行 :
运维|Redis集群(一)
文章图片

173行:
运维|Redis集群(一)
文章图片

265行:运维|Redis集群(一)
文章图片

701行:
运维|Redis集群(一)
文章图片

重启
[root@localhost /opt/redis-5.0.7/utils]# /etc/init.d/redis_6379 restart Stopping ... Waiting for Redis to shutdown ... Redis stopped Starting Redis server...

-------------------------------------------------------从节点------------------------------------------------------------
配置基本一样,就是多一条指定主节点即可
运维|Redis集群(一)
文章图片

重启
[root@localhost /opt/redis-5.0.7/utils]# /etc/init.d/redis_6379 restart Stopping ... Waiting for Redis to shutdown ... Redis stopped Starting Redis server...

验证主从
在master节点上看日志:
运维|Redis集群(一)
文章图片

在两台从节点查看信息的回应
运维|Redis集群(一)
文章图片

运维|Redis集群(一)
文章图片

在主节点创建100个键值对
[root@localhost /data]# vim redis.sh#/bin/bashfor ((i=0; i<100; i++))doecho -en 'hello' | redis-cli -x set v$i done

执行bash
我们去从节点可以看到创建的键值对已经从主节点复制过来了,
运维|Redis集群(一)
文章图片


但是不能在创建键值对,它会报你不能写一个只读副本
127.0.0.1:6379> set v10 100 (error) READONLY You can't write against a read only replica.

哨兵模式 哨兵的核心功能:在主从复制的基础上,哨兵引入了主节点的自动故障转移。
哨兵模式原理 哨兵(sentinel):是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的Master并将所有Slave连接到新的 Master。所以整个运行哨兵的集群的数量不得少于3个节点。
哨兵模式作用 1、监控:哨兵会不断地检查主节点和从节点是否运作正常。
2、自动故障转移:当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从节点升级为新的主节点,并让其他从节点改为复制新的主节点。
3、通知提醒:哨兵可以将故障转移的结果发送给客户端。
哨兵模式结构组成 1、哨兵节点:哨兵系统由一个或多个哨兵节点组成,哨兵节点就是特殊的redis节点,不存储数据
2、数据节点:主节点和从节点都是数据节点。
哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式,所有节点上都需要部署哨兵模式,哨兵模式会监控所有的Redis工作节点是否正常,当Master出现问题的时候,因为其他节点与主节点失去联系,因此会投票,投票过半就认为这个Master的确出现问题,然后会通知哨兵间,然后从Slaves中选取一个作为新的 Master。
需要特别注意的是,客观下线是主节点才有的概念:如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作
故障转移机制 1、由哨兵节点定期监控发现主节点是否出现了故障,每个哨兵节点每隔1秒会向主节点、从节点及其它哨兵节点发送一次ping命令做一次心跳检测。如果主节点在一定时间范围内不回复或者是回复一个错误消息,那么这个哨兵就会认为这个主节点主观下线了(单方面的),当超过半数哨兵节点认为该主节点下线了,这样就客观下线了。
2、当主节点出现故障,此时哨兵节点会通过Raft算法〈选举算法)实现选举机制共同选举出一个哨兵节点为leader,来负责处理主节点的故障转移和通知。所以整个运行哨兵的集群的数量不得少于3个节点。
3、由leader哨兵节点执行故障转移,过程如下:
●将某一个从节点升级为新的主节点,让其它从节点指向新的主节点;
●若原主节点恢复也变成从节点,并指向新的主节点;
●通知客户端主节点已经更换。
需要特别注意的是,客观下线是主节点才有的概念:如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观线和故障转移操作
主节点的选举:
1过滤掉不健康的(已下线的),没有回复哨兵ping响应的从节点
2选择配置文件中从节点优先级最高的(replication-priority,默认值为100)
3选择复制偏移量最大的,也就是复制最完整的从节点。
sentinel中的三个定时任务
1每10秒每个sentinel对master和slave执行info发现slave节点
2每2秒确认主从关系:每2秒每个sentinel通过master节点的channel交换信息(pub/sub)通过sentinel__:hello频道交互交互对节点的“看法”和自身信息
3每1秒每个sentinel对其他sentinel和redis执行ping
运维|Redis集群(一)
文章图片


运维|Redis集群(一)
文章图片


Sentinel 进程是用于监控redis集群中Master主服务器工作的状态,在Master主服务器发生故障的时候,可以实现Master和Slave服务器的切换,保证系统的高可用,此功能在redis2.6+的版本已引用,Redis的哨兵模式到了2.8版本之后就稳定了下来。一般在生产环境也建议使用Redis的2.8版本的以后版本。
哨兵(Sentinel) 是一个分布式系统,可以在一个架构中运行多个哨兵(sentinel) 进程,这些进程使用流言协议(gossip protocols)来接收关于Master主服务器是否下线的信息,并使用投票协议(Agreement Protocols)来决定是否执行自动故障迁移,以及选择哪个Slave作为新的Master
有主观宕机,对应的有客观宕机。当“哨兵群”中的多数Sentinel进程在对Master主服务器做出SDOWN 的判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的Master Server下线判断,这种方式就是“客观宕机”(客观:是不依赖于某种意识而已经实际存在的一切事物),英文名称是:Objectively Down, 简称 ODOWN通过一定的vote算法,从剩下的slave从服务器节点中,选一台提升为Master服务器节点,然后自动修改相关配置,并开启故障转移(failover)Sentinel 机制可以解决master和slave角色的自动切换问题,但单个 Master 的性能瓶颈问题无法解决,类似于MySQL中的MHA功能Redis Sentinel中的Sentinel节点个数应该为大于等于3且最好为奇数客户端初始化时连接的是Sentinel节点集合,不再是具体的Redis节点,但Sentinel只是配置中心不是代理。Redis Sentinel 节点与普通redis 没有区别,要实现读写分离依赖于客户端程序redis 3.0 之前版本中,生产环境一般使用哨兵模式,但3.0后推出redis cluster功能后,可以支持更大规模的生产环境
可以配置来提升slave优先级
运维|Redis集群(一)
文章图片


搭建哨兵模式 环境
master节点:192.168.37.100
slave1节点:192.168.37.101
slave2节点:192.168.37.102
修改哨兵模式的配置文件
在所有节点上配置
[root@localhost /opt/redis-5.0.7]# vim sentinel.conf

运维|Redis集群(一)
文章图片

运维|Redis集群(一)
文章图片

运维|Redis集群(一)
文章图片

将 sentinel.conf文件复制到从节点上去
运维|Redis集群(一)
文章图片

启动时先启动master 再启动slave
后台启动服务
[root@localhost /opt/redis-5.0.7]# redis-sentinel sentinel.conf &[1] 100112[root@localhost /opt/redis-5.0.7]# ss -natp |grep 6379 LISTEN0128*:26379*:*users:(("redis-sentinel",pid=100113,fd=7)) LISTEN0128*:6379*:*users:(("redis-server",pid=99022,fd=6)) ESTAB00192.168.37.100:52116192.168.37.101:6379users:(("redis-sentinel",pid=100113,fd=13)) ESTAB00192.168.37.100:35374192.168.37.100:6379users:(("redis-sentinel",pid=100113,fd=8)) ESTAB00192.168.37.100:6379192.168.37.101:34434users:(("redis-server",pid=99022,fd=8)) ESTAB00192.168.37.100:40548192.168.37.102:6379users:(("redis-sentinel",pid=100113,fd=10)) ESTAB00192.168.37.100:6379192.168.37.100:35374users:(("redis-server",pid=99022,fd=10)) ESTAB00192.168.37.100:6379192.168.37.100:35376users:(("redis-server",pid=99022,fd=11)) ESTAB00192.168.37.100:35376192.168.37.100:6379users:(("redis-sentinel",pid=100113,fd=9)) ESTAB00192.168.37.100:52114192.168.37.101:6379users:(("redis-sentinel",pid=100113,fd=12)) ESTAB00192.168.37.100:6379192.168.37.102:33712users:(("redis-server",pid=99022,fd=9)) ESTAB00192.168.37.100:40550192.168.37.102:6379users:(("redis-sentinel",pid=100113,fd=11)) LISTEN0128:::26379:::*users:(("redis-sentinel",pid=100113,fd=6)) [1]+完成redis-sentinel sentinel.conf

查看哨兵,从上面有三个哨兵,主都是指向192.168.37.100
主: [root@localhost /opt/redis-5.0.7]# redis-cli -p 26379 127.0.0.1:26379> info sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=192.168.37.100:6379,slaves=2,sentinels=1Slave1: [root@localhost /opt/redis-5.0.7]# redis-cli -p 26379 127.0.0.1:26379> info sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=192.168.37.100:6379,slaves=2,sentinels=3Slave2: [root@localhost /opt/redis-5.0.7]# redis-cli -p 26379 127.0.0.1:26379> info sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=192.168.37.100:6379,slaves=2,sentinels=3

验证
[root@localhost /opt/redis-5.0.7]# ps -elf |grep redis 5 S root9902210800 - 39613 ep_pol 13:43 ?00:00:09 /usr/local/redis/bin/redis-server 0.0.0.0:6379 5 S root10011310800 - 38461 ep_pol 14:30 ?00:00:03 redis-sentinel *:26379 [sentinel] 0 S root100223882930800 - 28169 pipe_w 14:40 pts/100:00:00 grep --color=auto redis

将redis服务关闭
[root@localhost /opt/redis-5.0.7]# /etc/init.d/redis_6379 stop Stopping ... Waiting for Redis to shutdown ... Redis stopped


,并且将节点日志打开
[root@localhost /opt/redis-5.0.7]# tail -f /var/log/sentinel.log

开启redis服务
[root@localhost /opt/redis-5.0.7]# /etc/init.d/redis_6379 start Starting Redis server...

再看日志
运维|Redis集群(一)
文章图片

查看从节点的哨兵配置文件
【运维|Redis集群(一)】运维|Redis集群(一)
文章图片

    推荐阅读