PD GRPC Service
PD GRPC 接口图解
目前 PD 对外暴露的接口主要分为两类:
- GRPC
- HTTP restful API
本文主要介绍 PD 6.0.0 对外暴露的 GRPC 接口信息,通过本文,你可以:
- 通过接口,全面了解 PD 提供的服务内容
- 可以作为一个导读入口,开始源码阅读,深入了解某个部分或开启 PD developer 之旅。
概览
详细接口分类
GetMemebers
-
接口说明: 该接口主要用于获取当前 PD 的实例信息,包括PD 的 leader 信息、子服务信息。
-
请求参数:无
-
请求返回:
- Member:当前集群中所有实例的基本信息
- etcd_leader: 当前 etcd 集群所在 leader 节点信息。
- Leader: 当前 PD 集群的 leader 节点信息。 pd 选 leader 时,只有 etcd 的 leader 参会参与 leader 的竞选,因此该理论上与 pd leader 节点保持一致,但存在极端情况。
- tso_allocator_leaders: tso 各个 location 对应的 tso 分配器的 leader 信息
TSO
TSO (Get)
-
接口说明: 按数据中心获取全局唯一递增时间戳
-
请求参数:
- dc_location 数据中心位置
- count 当前想要获取的时间戳个数
-
请求返回
-
count 当前给出的时间戳个数
-
timestamp 时间戳信息
- physical 逻辑时间戳
- logical 逻辑时间戳
- suffix_bits 用于计算 logical 的后缀长度, 主要用作全局区分。
-
SyncMaxTs
-
请求说明:同步所有 DC 之间的 MaxTS. 主要实现两个需求:
- 获取当前系统中最大 localTSO
- 确保当前系统中的 localTSO 都大于 req.MaxTS
-
请求参数:
- MaxTs 当前要设置的 maxts 值
- Skip-check: 是否跳过检查,若为 false, 会
-
请求返回:
-
maxLocalTS
-
如果 skip-check = false, 则尝试获取当前系统最大 TS
- 如果发现当前系统的 max-ts 大于 req.max-ts, 则不做更新,并获取当前系统最大的 local-max-ts.
- 否则,尝试将所有 DC 的时间更新到 req.max-ts,若 dc.current-ts > req.max-ts , 则无需更新。
-
-
SyncdDcs 数据中心列表
-
GetDCLocationInfo
-
请求说明:获取指定 dc-location 的 信息
-
请求参数: string dc-location
-
请求返回:dc-location 基本信息
- Suffix int
- max_ts timestamp
集群管理
启动
Bootstrap
-
接口说明:启动当前集群
-
请求参数:
- store:集群中 store 基本信息
- region: 集群中 region 基本信息
-
请求返回
IsBootstrapped
接口说明:咨询当前集群是否启动成功
请求参数:
请求返回:当前集群是否已启动成功
Raft Cluster
ClusterConfig
GetClusterConfig
-
请求说明:获取集群基本信息
-
请求返回:cluster 信息,主要包括
- Id 集群唯一 ID
- MaxpeerCount 每个 region 最多的 peer 数,不足时会自动 balance
PutClusterConfig
-
请求说明:配置 cluster 的副本数
-
请求参数:cluster 信息,同 Get 请求的返回值
-
Question:
- 这里副本数这个参数看起来外面 tikv 在用?PD 未找到具体使用的地方
- 处理请求时只对 cluster ID 做了校验,是否需要检查 maxpeercount 是否合理?
Stores
PutStore
接口说明: 创建 store。关键检查条件:
- 如果当前集群中存在相同 ID 的 store 且状态为已删除,返回失败
- 如果 placementrule 未打开,但 store 为 tiflash node 失败(使用 tiflash 需要 placement-rule 启用)
- 如果存在相同 address 但 ID 不同的 store, 返回失败
- 集群中定义的 location - label 未配置全,返回失败。
请求参数:store 基本信息
请求返回:告知 tikv 当前集群的 replication-mode,目前支持两种模式:
- 标准模式:MAJORITY
- DR_AUTO_SYNC:Replicate logs among 2 DCs.
GetStore
-
接口说明:根据 ID 获取集群中对应 store 的信息
-
请求参数:store_id
-
请求返回:
- 当前 store 基本信息
- 当前 store 统计信息, 如容量,region 个数,SendingSnapCount,KeysWritten,CpuUsages 等基本信息
GetAllStores
- 接口说明:获取当前系统中的 store 列表
- 请求参数:exclude_tombstone_stores 是否包含 tombstone 的 store
- 请求返回: store 的原信息列表,同 GetStore
StoreHeartbeat
-
接口说明:store 日常心跳上报,确保 store 处于活跃状态
-
请求参数:
- StoreStats stats 基本状态,基本信息如 capacity,Available,region_count,sending_snap_count,receiving_snap_count, start_time ...
- StoreReport store_report store 当前的副本列表及状态,只有在 unsafe recovery 才会有此项内容
- replication_modepb.StoreDRAutoSyncStatus dr_autosync_status 当前系统恢复的状态
-
请求返回:
- replication_status: 当前集群的 replication-mode
- cluster_version: 当前集群版本号
- require_detailed_report unsafecovery 时返回
- recovery_plan,unsaferecovery 时返回
ReportMinResolvedTS
-
请求说明:上报 store 的最小 resolvedTS, 会落到 store 的属性里
-
请求参数:
- storeID
- minResolvedTS
Cluster
RegionHeartbeat
-
接口说明:Region 心跳上报, 同步 region 基本信息(只有 region leader 会上报心跳, stream req, 一次可能上报多个 region 的心跳)
-
请求参数: Region 基本信息,如:
-
Region: 基本信息,ID,start_key,end_key,epoch,peers
-
Leader: region 的 leader 基本信息(ID,storeID,role)
-
Peer 基本信息,主要分两类
-
Pending peers 还没到 follower 状态的 peer
-
DownPeers: leader 认为挂掉的 peer 信息,包括:
- Peer 基本信息(ID,storeID,role)
- downSeconds
-
-
Region 本身的数据写入情况,如
- bytes_written/read 当前时间窗口
- keys_wrritted/read 当前时间窗口
- Approximate size/keys 总
-
term 当前 raft group 的 term
-
Replication-status
-
Cpu-usage
-
...
-
-
请求返回:如果发现当前 region 需要调度,返回对应调度指令, 每个 region 一次只会下发一个 operator
- ChangePeer: RemovePeer/AddNode/AddLearnerNode
- TransferLeader
- Merge
- Split-region
- ChangePeerV2: replacing peers/demoting voter directly
Region 基本信息读请求
GetRegion/GetPrevRegion
-
接口说明: 获取当前/前一个 region 基本信息、状态、负载情况
-
请求参数: region-key, 是否需要 buckets 信息
-
请求返回
- Region: 基本信息
- Leader
- down_peers/pending_peers
- buckets(if needed): 按 bucket 为最小单位的负载情况信息(write/read-key/size)
GetRegionByID
- 接口说明:同 GetRegion,区别是通过 region-id 获取
ScanRegions
-
接口说明:根据指定的 key 返回获取 region 列表
-
请求参数:
- start-key/end-key
- Limit, 为空时,返回所有
-
请求返回
- Region-metas
- Region-leaders
- Regions
说明:这里请求返回的组织形式有点奇怪
ReportBuckets
-
请求说明:上报 bucket 基本信息
-
请求参数(stream):buckets 基本信息
- region_id
- Keys []string
- BucketStats []stat
- period_in_ms: 数据采集的间隔
Split Region
AskBatchSplit
请求说明:发起将 region 切成指定份数的请求,请求返回成功后,最终 split 不一定成功。
请求参数:region 基本信息,split-count
请求返回:预切分好的 region ID 及peer ID 列表:split-ID (peers-ids,region-id) list
ReportBatchSplit
请求说明:tikv 汇报 split region 成功,PD 这边打印日志,方便查询 split region 请求是否已经生效成功。
请求参数:regions 被切分的 regions 信息
请求返回:基本认证 header.
SplitRegion
-
请求说明:根据指定 key 列表分裂相关 regions,请求返回时,split 已经物理完成。
-
请求参数:
- splitkeys: 指定 key 列表
- retry_limit: 重试次数
-
请求返回:
- regions_id: 新生成的 region 列表
- finished_percentage: 完成率
ScatterRegion
-
请求说明:打散 region
-
请求参数:
- Group 组名,如果非空,则会在 group 级别进行打散,不存在,则整个集群级别打散。
- regions_id 需要打散的 region 编号
- Retry-limit 每个 region 重试次数
- Region-id 历史参数,当 regions-id 为空时,当前 region 为需要打散的 region
- region,leader :需要打散的 regiion 信息,当 PD 找不到需要打散的 regiion 时(region-id) 使用。举例:PD 尚未收到 regiion 的心跳上报。处理逻辑如下:当 regions-id 为空,region-id 为空时,当前信息组织成新的 region 进行打散。
-
请求返回:finished-percentage: 请求完成率,成功的 regions 个数/总 regions 个数
SplitAndScatterRegions
-
请求说明:根据指定的 key 切分 region 且打散 SplitRegions+ScatterRegion
-
请求参数:
- splitkeys: 指定需要切分的 key 列表
- Group 组名,如果非空,则会在 group 级别进行打散,不存在,则整个集群级别打散。
- Retry-limit 重试次数
-
请求返回
- regions_id: 新生成的 region 列表
- split_finished-percentage: 请求完成率
- scatter_finished-percentage: 请求完成率
SyncRegions(stream)
请求说明:向 PD 发起同步 region 信息的请求,一般用于大集群处理, 以及当 pd 中使用 levelDB 替代 ETCD 存储 region 信息时,PD 间 region 信息的同步。无法保证强一致性。
请求返回:各个 region 信息。。同步 region 基本信息
GetOperatorRequest
-
请求说明:获取指定 region 正在执行的 operator 状态
-
请求参数:region_id
-
请求返回:当前 operator 的基本信息和状态
- region_id
- Desc
- status(success,timeout,cancel,replace,running)
- kind(是否是 admin 发起的,优先级等)
GC
GetGCSafePoint
- 请求说明: 获取当前系统的 gc safepoint, 该值通过接口 UpdateGCSafePoint 接口设置
- 请求返回:safe-point
UpdateGCSafePoint
-
请求说明:设置 gc safepoint 信息,只有当需要设置的 safepoint 大于当前系统中的 safepoint 时,才会设置成功。
-
请求参数:
- safe_point 当前要设置的 safepoint.
-
请求返回:
- new_safe_point 当前系统中的 safepoint
UpdateServiceGCSafePoint
-
请求说明:为指定 service 存储可安全 gc 的 safepoint. 成功的条件是当前要设置的 safepoint 大于等于 service 中最小的 safepoint
-
请求参数:
- service_id
- TTL,TTL 为负数表示删除对应的 safepoint.
- safe_point, 表示对 service 来说,当前 safepoint 之前的数据可以 GC 掉
-
请求返回:当前系统中 safepoint 最小的那个 service 信息, 该 minsafepoint 会永远向前滑动不会回退
- service_id
- ttl
- MinSafepoint
GlobalConfig
看起来这里是对 ETCD 的简单封装,将需要的配置项放在 /global/config 下面,通过下面三个接口来实现查询、更新及服务发现的功能。
StoreGlobalConfig
-
接口定义:存储 key-value 配置项到 PD
-
参数:items []items,items 内容包括
- Key
- Value
- error(没有使用)
LoadGlobalConfig
-
接口定义:获取 /global/config 下指定 keys 对应 的 values
-
请求参数:
- Names []string 需要的 key 的名称
-
请求返回:当前需要的 keys 对应信息
- Key
- Value
- error(查询该 key 过程中遇到的错误或 NOT found)
WatchGlobalConfig
请求说明:监听 /global/config 目录
请求返回:当前目录下发生变化的 key-value 信息