Redis的三种集群方式及原理
主从复制
原理
- 从服务器连接主服务器,发送SYNC命令
- 主服务器接收到SYNC命令后,开始执行BGSAVE命令生成RDB文件,并使用缓冲区记录此后执行的所有写命令
- 主服务器BGSAVE执行完后,向所有从服务器发送快照文件,并在发送期间继续记录被执行的写命令
- 从服务器收到快照文件后丢弃所有旧数据,载入收到的快照
- 主服务器快照发送完毕后开始向从服务器发送缓冲区中的写命令
- 从服务器完成对快照的载入,开始接受命令请求,并执行来自主服务器缓冲区的写命令(从服务器初始化完成)
- 主服务器每执行一个写命令就会向从服务器发送相同的写命令,从服务器接收并执行收到的写命令(从服务器初始化完成后的操作)
初始化完成之后,主从服务器之间会保持缓冲区写命令的同步
优缺点
优点
- 支持主从复制,主机会自动将数据同步到从机,可以进行读写分离
- 为了分载Master的读操作压力,Slave服务器可以为客户端提供只读操作的服务,写服务必须由Master来完成
- Slave同样可以接受其他Slaves的连接和同步请求,这样可以有效的分载Master的同步压力
- Master Server是以非阻塞的方式为Slaves提供服务。所以在Master-Slave同步期间,客户端可以提交查询或修改请求
- Slave Server同样是以非阻塞的方式完成数据同步。在同步期间,如果有客户端提交查询请求,则返回同步前的数据
缺点
- Redis不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分的读写请求失败,需要等待机器重启或者手动切换前端的IP才能恢复
- 主机宕机,宕机前有部分数据未能及时同步到从机,切换IP后会引入数据不一致的问题,降低了系统的可用性
- Redis较难支持在线扩容,在集群容量达到上限时,在线扩容会变得复杂
哨兵模式
当主服务器中断服务后,可以将一个从服务器升级为主服务器,以便继续提供服务,但是这个过程需要人工手动来操作。为此Redis2.8中提供了哨兵工具来实现自动化的系统监控和故障恢复功能。
哨兵的作用就是监控Redis系统的运行状况。它的功能有以下两个:
- 监控主服务器和从服务器是否正常运行
- 主服务器出现故障时自动将从服务器转换为主服务器
哨兵的工作方式
- 每个哨兵进程以每秒一次的频率向整个集群的Master、Slave以及其他哨兵进程发送一个Ping命令
- 如果一个示例距离最后一次有效回复Ping命令的时间超过
down-after-milliseconds
设置的值,则这个实例会被哨兵进程标记为主观下线(SDOWN) - 如果一个Master被标记为主观下线(SDOWN),则正在监视这个Master的所有哨兵进程都要以每秒一次的频率确认Master进入了主观下线状态(SDOWN)
- 当有足够数量的哨兵进程(大于配置文件指定的值)在指定时间范围内确认Master进入了主观下线状态,则Master会被标记为客观下线(ODOWN)
- 在一般情况下,每个哨兵进程会以每10秒一次的频率向集群中的所有Master、Slave发送INFO命令
- 当Master被哨兵进程标记为客观下线时,哨兵进程向下线的Master的所有Slave发送Info命令的频率会从10s一次改为1s一次
- 若没有足够数量的哨兵进程同意Master下线,Master的客观下线状态就会被移除。若Master重新向哨兵进程发送Ping命令返回有效回复,Master的主观下线状态就会被移除
优缺点
优点
Redis-Cluster集群
Redis的哨兵模式基本已经可以实现高可用,读写分离。但是在这种模式下每台服务器都存储相同的数据,很浪费内存,所以在redis3.0上加入了Cluster模式,实现了redis的分布式存储,也就是说在每台redis节点上存储不同的内容
Redis-Cluster采用无中心结构,它的特点如下:
- 所有的redis节点彼此互联(ping-pong机制),内部使用二进制协议优化传输速度和带宽
- 节点的fail是通过集群中超过半数的节点检测失效时才会生效
- 客户端与redis节点直连,不需要中间代理层,客户端不需要连接集群所有节点,连接集群中任何一个节点即可
工作方式
在redis的每一个节点上,都有这么两个东西,一个是插槽(slot),它的取值范围是0-16383。还有一个就是Cluster,可以理解为是一个集群管理插件。当我们存取的key到达的时候,redis会根据crc16的算法得出一个结果,然后把结果对16383求余数,这样每个key都会对应一个编号在0-16383之间的哈希值,通过这个值找到对应插槽的节点,然后直接自动跳转到这个对应的节点上进行存取操作。一致性哈希算法解决分布式热点问题
为了保证高可用,Redis-Cluster集群引入了主从模式,一个主节点对应一个或多个从节点,当主节点宕机的时候,就会启用从节点。当其他主节点ping一个主节点A时,如果半数以上的主节点与A通信超时,那么主节点A宕机。如果主节点A和他的从节点A1都宕机,那么该集群无法再提供服务。