博客 - TiDB 跨数据中心高可用设计技术解析

一、两地三中心架构下的故障域隔离设计

在两地三中心架构中（如北京AZ1/AZ2与西安AZ3），TiKV节点需通过多级标签体系实现物理隔离。典型配置包含三级标签：region（城市级）、zone（数据中心级）、rack（机柜级）。通过Placement Rules in SQL功能可定义数据分布策略：

CREATE PLACEMENT POLICY dc_policy 
PRIMARY_REGION="北京" 
REGIONS="北京,西安" 
FOLLOWERS=4;

该策略将主副本固定在北京区域，5 副本分布在两地三中心（北京 2+2，西安 1）。关键配置要点包括：

通过 PD 调度器限制 Region Leader 仅在同城 AZ 分布：

pd-ctl config set label-property reject-leader dc=西安

此配置确保西安 AZ 仅承载 follower 副本，消除跨区域写入延迟对事务处理的影响。实际生产数据显示，该策略可使跨城延迟 20ms 场景下的写入性能提升 40%。

Raft 选举超时需满足公式：election_timeout > 2*RTT + processing_delay。在跨机房场景中：

实际参数配置需通过公式推导：

election_timeout = 3*(max_network_jitter + RTT) + heartbeat_interval

其中网络抖动建议按 RTT 的 30% 估算。

采用动态心跳间隔调整策略：

raftstore.heartbeat-ticks = 5  # 基础心跳周期
raftstore.max-heartbeat-duration = "500ms"  # 最大容忍延迟

当 PD 检测到跨域通信时，自动将heartbeat-interval从默认 2s 延长至 5s，避免因网络波动触发误判。

该方案已在实际金融级两地三中心部署中验证，实现 RPO=0 且 RTO<30 秒的容灾能力。建议根据实际网络条件进行参数微调，并通过 Prometheus 持续监控raft_heartbeat_latency指标优化配置。