Forrest’s 博客

Ctrl+K

如果去做，还有一丝希望；但是不去做，就毫无希望

个人总结

🎭 读「阿里巴巴管理三板斧」

🔇 2025年终总结

🏐 我的MBTI

🎯 2024年终总结

技术分享

🧲 GLM 系列音频模型总结：输入、输出与文件格式全解析

⛓️ 阿里云核心服务概念梳理： FC / ECS /ECI / ACK /ACS

🧵 prometheus为代表的监控构建

📹 限流、熔断与降级：微服务高可用性的核心保障机制

🏹 kubebuilder 总结

🌚 版本控制规范

🕹️ kafka学习笔记

📽️ 如何构建一个短链系统

🎤 mac VMware Fusion 虚拟机安装

💈 MongoDB 总结

🎯 深入理解 IO 多路复用：从 select、poll 到 epoll 的演进

🎰 常见的网络设备

🚍 高可用的常见手段

🌇 基于Casbin的RBAC权限认证｜权限管理

🪩 从0到1，利用kubevirt构建ubuntu虚拟机

🧩 iptables in linux

🏓 在mac中，如何将标准输出保存到剪切板中

🌦️ nvidia驱动和cuda安装记录

🌞 正则表达式

🧮 内存对齐

👨‍💻 go中常见的内存泄露场景

🐒 常用限流组件及其实现

⛺ pprof的使用

🏁 sqlite内存模式下的性能测试

🌐 全局唯一ID生成方案

🌑 linux笔记

LLM

🔐 超大规模MaaS System Design

🎉 OpenAI API格式

🔇 读「大模型训练与推理加速实战：基于CUDA计算平台（python版）」

📔 读「大模型时代的基础架构：大模型算力中心建设指南」

🚡 深度学习模型架构解析：以Encoder-Decoder为核心的分类体系

k8s

🏞️ 初探 Volcano Scheduler

🧭 AI 时代下的 Kubernetes 调度器：架构、挑战与演进路径

🛑 Kubelet → CRI → containerd/CRI-O → runc/kata：Kubernetes 容器运行时完整调用链

🎎 CloudEvents

🏪 深入解析 Kubernetes Informer 架构

♠️ K8s网络深度解析：CNI、VXLAN与主流插件的实现差异

♦️ Kube-proxy 机制深度解析：API Server 交互与 iptables 规则生成

☄️ openEBS lvm_localpv

📱 CNI In k8s

🛻 k8s架构简介

🚓 Kind相关操作

knative

🌑 Knative Service 多版本管理指南

🌑 Knative + Istio 环境下的会话亲和性实现方案

🛻 Knative Architecture

🎻 Knative Hands-on

🎎 Knative-Overview

agentic

🎣 从模型视角看上下文工程

🚪 Function Calling、MCP、Skill 三者本质区别与适用场景

⚱️ Prompt Engineering

🥌 vLLM 初体验

istio

🩻 服务网格 | istio

HAMI

♦️ 在k8s环境中使用vgpu | HAMI

Golang

🎗️ Golang map

🔒 如何避免channel重复关闭

🪝 Golang channel

🔒 golang的单机锁

🔂 sync/atomic包

📂 Golang 内存分配与管理机制

转发

🧿 【转】如何阅读源码

计算机网络

📌 计算机网络-网络层

📌 计算机网络-传输层

📌 计算机网络-应用层

Redis

📌 Redis-内存过期和内存淘汰策略

🥎 Redis-大key问题

🛩️ Redis-高可用

📅 Redis-缓存

✨ Redis-持久化

⛑️ Redis-基础数据类型

MySQL

☃️ MySQL-日志

✂️ MySQL-事务

Mysql

⌚ MySQL-索引

⌚ MySQL-存储引擎

🛩️Redis-高可用

type

Post

status

Published

date

Dec 30, 2023

slug

redis-ha

summary

category

Redis

tags

redis

icon

password

AI summary

Blocked by

Blocking

Category

Redis的高可用（HA High Avalibility）要解决的是：

避免单点故障

保证数据尽可能不丢失

保证服务队外不中断

Redis 官方给出了三套HA的框架

特性	主从复制	哨兵模式	切片集群
数据分布	每个节点保存全量数据	每个节点保存全量数据	数据分片存储
读写分离	✓	✓	✓
自动故障转移	✗	✓	✓
扩展性	低	中	高
部署复杂度	简单	中等	复杂
维护成本	低	中	高
适用数据量	GB 级别	TB 级别	PB 级别

主从复制（Master-Slave）

主从式高可用的基础，是哨兵和cluster的底层依赖。

notion image

基本原理

主节点负责写操作

从节点负责读操作

主节点数据自动同步到从节点

对于全量复制而言

slave初次连接时必须执行全量复制，过程耗时长，网络、磁盘负载较高

对于增量复制而言

当主从短暂断开后，slave可以继续同步

master保留自己的rep backlog buffer

slave发送自己的replication offset

master按照offset差异，发送缺失的命令

其中有一个比较重要的点：如果 backlog 太小导致丢失 offset 范围 → 回退到全量同步（代价很大）

优缺点

pros：

读写分离，提高性能

数据备份

实现简单

cons：

主节点故障需要手动切换

无法自动故障转移

无法实现自动化运维

哨兵模式（Sentinel）

notion image

主从模式下，当主节点fail时，写入会中断。所以需要拥有failover的能力。

基本原理

在主从复制基础上，增加哨兵节点监控集群状态

自动进行故障检测和转移

提供自动化运维能力

哨兵的功能

每个哨兵对master做PING/PONG心跳检测，多哨兵经投票后判断matser状态。

主节点自动故障检测

自动切换（failover）

通知客户端新的master地址

哨兵如何选择新的master

优先级规则：

slave priority（redis.conf 配置）

replication offset（数据最新）

runid（字典序最小）

配置

切片集群（Redis Cluster）

哨兵模式解决了主从模式下的不可failover问题。但是单node的内存往往是有瓶颈的。所以可以通过分布式的方式——分片，通过分片实现现行扩展，实现多主多从。

notion image

基本原理

数据自动分片到多个节点

每个分片可以有主从节点

支持自动故障转移

实现步骤

数据分片机制

使用 16384 个哈希槽

根据 key 的 CRC16 值对 16384 取模来分配

每个节点负责一部分哈希槽

故障转移

节点间通过 Gossip 协议通信

自动检测节点故障

从节点自动升级为主节点

新增节点是否需要数据迁移？

新增 Master 节点默认不负责任何 slot，因此必须通过 reshard 将部分 slot 从旧节点迁移到新节点。迁移采取在线 MIGRATE 方式，逐 key 搬迁，不影响服务。

删除节点是否需要数据迁移？

删除 Master 节点必须先将其 slot 迁移到其他 Master，否则无法删除；删除 Slave 节点则不需要迁移数据。

主从数据不一致问题

主从不一致本质是 Redis 的主从复制是异步的，导致读从时可能读到旧数据。

一般从三个层面处理：

业务层避免跨主从读写：强一致场景全部读写走主节点，读从仅用于弱一致需求。

使用 WAIT 命令增强一致性：写入后等待从节点确认，可实现更强的一致性保障。

使用 Redis Cluster：默认读主，自动故障切换，减少人为架构处理一致性问题。

常见真实做法是“强一致读主、弱一致读从”。

各种方案的整体对比

方案	高可用	数据一致性	扩展性	使用场景
主从复制	中	弱一致性	不支持横向扩容	单节点读扩展
Sentinel	高	弱一致性	不扩容，只 HA	高可用读写场景
Cluster	高	弱一致性	可横向扩容（分片）	超大规模集群、云原生
第三方 Proxy（Codis/Twemproxy）	中	改善一致性，但依赖 proxy	可扩容	大规模缓存（简化客户端）

Redis-大key问题

Loading...

Catalog

Last update: 2023-12-30

Article List

如果去做，还有一丝希望；但是不去做，就毫无希望

个人总结

🎭 读「阿里巴巴管理三板斧」

🔇 2025年终总结

🏐 我的MBTI

🎯 2024年终总结

技术分享

🧲 GLM 系列音频模型总结：输入、输出与文件格式全解析

⛓️ 阿里云核心服务概念梳理： FC / ECS /ECI / ACK /ACS

🧵 prometheus为代表的监控构建

📹 限流、熔断与降级：微服务高可用性的核心保障机制

🏹 kubebuilder 总结

🌚 版本控制规范

🕹️ kafka学习笔记

📽️ 如何构建一个短链系统

🎤 mac VMware Fusion 虚拟机安装

💈 MongoDB 总结

🎯 深入理解 IO 多路复用：从 select、poll 到 epoll 的演进

🎰 常见的网络设备

🚍 高可用的常见手段

🌇 基于Casbin的RBAC权限认证｜权限管理

🪩 从0到1，利用kubevirt构建ubuntu虚拟机

🧩 iptables in linux

🏓 在mac中，如何将标准输出保存到剪切板中

🌦️ nvidia驱动和cuda安装记录

🌞 正则表达式

🧮 内存对齐

👨‍💻 go中常见的内存泄露场景

🐒 常用限流组件及其实现

⛺ pprof的使用

🏁 sqlite内存模式下的性能测试

🌐 全局唯一ID生成方案

🌑 linux笔记

LLM

🔐 超大规模MaaS System Design

🎉 OpenAI API格式

🔇 读「大模型训练与推理加速实战：基于CUDA计算平台（python版）」

📔 读「大模型时代的基础架构：大模型算力中心建设指南」

🚡 深度学习模型架构解析：以Encoder-Decoder为核心的分类体系

k8s

🏞️ 初探 Volcano Scheduler

🧭 AI 时代下的 Kubernetes 调度器：架构、挑战与演进路径

🛑 Kubelet → CRI → containerd/CRI-O → runc/kata：Kubernetes 容器运行时完整调用链

🎎 CloudEvents

🏪 深入解析 Kubernetes Informer 架构

♠️ K8s网络深度解析：CNI、VXLAN与主流插件的实现差异

♦️ Kube-proxy 机制深度解析：API Server 交互与 iptables 规则生成

☄️ openEBS lvm_localpv

📱 CNI In k8s

🛻 k8s架构简介

🚓 Kind相关操作

knative

🌑 Knative Service 多版本管理指南

🌑 Knative + Istio 环境下的会话亲和性实现方案

🛻 Knative Architecture

🎻 Knative Hands-on

🎎 Knative-Overview

agentic

🎣 从模型视角看上下文工程

🚪 Function Calling、MCP、Skill 三者本质区别与适用场景

⚱️ Prompt Engineering

🥌 vLLM 初体验

istio

🩻 服务网格 | istio

HAMI

♦️ 在k8s环境中使用vgpu | HAMI

Golang

🎗️ Golang map

🔒 如何避免channel重复关闭

🪝 Golang channel

🔒 golang的单机锁

🔂 sync/atomic包

📂 Golang 内存分配与管理机制

转发

🧿 【转】如何阅读源码

计算机网络

📌 计算机网络-网络层

📌 计算机网络-传输层

📌 计算机网络-应用层

Redis

📌 Redis-内存过期和内存淘汰策略

🥎 Redis-大key问题

🛩️ Redis-高可用

📅 Redis-缓存

✨ Redis-持久化

⛑️ Redis-基础数据类型

MySQL

☃️ MySQL-日志

✂️ MySQL-事务

Mysql

⌚ MySQL-索引

⌚ MySQL-存储引擎