使用br备份到ceph,具体的命令是怎么指定的? 可以贴出来分享下吗? 我最近也在学习,但好像要是配置不对。感谢
Starting component ctl: /home/tidb/.tiup/components/ctl/v4.0.9/ctl pd -u
http://ip:2379 operator show
[
“replace-rule-offline-peer {mv peer: store [2] to [1]} (kind:region,replica, region:314588(1332,42), createAt:2021-12-23 17:41:55.15718673 +0800 CST m=+11086211.014696148, startAt:2021-12-23 17:…
[2021/12/23 09:18:57.467 +08:00] [INFO] [apply.rs:1187] [“execute admin command”] [command=“cmd_type: ChangePeer change_peer { change_type: AddLearnerNode peer { id: 1629124 store_id: 1 is_learner: true } }”] [index=94] [term=15] [peer_id=1322904] [region_id=1322901]
[2021/12/23 09:18:57.467 +08:00…
不光是1,其他的所有节点都是这样,就是从2上调度到其他节点 也是这样
[2021/12/23 09:18:57.465 +08:00] [INFO] [operator_controller.go:424] [“add operator”] [region-id=1322901] [operator="“replace-rule-offline-peer {mv peer: store [2] to [1]} (kind:region,replica, region:1322901(25531,82), createAt:2021-12-23 09:18:57.465084102 +0800 CST m=+11056033.322593522, startAt:…
pending状态的 是新增加的peer ,它本意应该是从下线节点上迁移peer过来,但是过了十分钟 ,就超时自动删除了
down 和pending的这个 应该算正常了,
现在有两根问题:
1 下线的那个节点上peer不迁移
2 扩容的新节点不增加peer 只有3千个leader
[2021/12/23 09:18:57.465 +08:00] [INFO] [operator_controller.go:424] [“add operator”] [region-id=1322901] [operator="“replace-rule-offline-peer {mv peer: store [2] to [1]} (kind:region,replica, region:1322901(25531,82), createAt:2021-12-23 09:18:57.465084102 +0800 CST m=+11056033.322593522, startAt:…
现在的情况是这样:
我们要缩容的那个节点2上现在只剩下副本,没有leader了,但现在副本迁不走。从pd上的调度日志看,是有在调度的,但是过了十分钟之后就超时了。节点2上的副本也没任何变化,然后前面我们新增的那个节点上,就只有leader的副本,没有非leader的副本,好像也不太正常??
具体日志如下(很多这样的日志):
[2021/12/23 09:24:34.742 +08:00] [INFO] [operator_controller.go:620] [“send schedule command”] [region-id=1385813] [step=“add learner …
tikv节点全部重启过一次了,现在这台是下线状态的tikv节点上的leader region 每天也是在减少的。每天大概减少1000个leader。都迁移到另外的节点上去了。
网络都没问题的,端口也都是通的
[image]
新增加的那个tikv节点上 tikv的日志里有这个警告。
[2021/12/21 09:08:36.316 +08:00] [INFO] [operator_controller.go:424] [“add operator”] [region-id=33132] [operator="“remove-orphan-peer {rm peer: store [3]} (kind:region, region:33132(418,23), createAt:2021-12-21 09:08:36.31680021 +0800 CST m=+10882612.174309628, startAt:0001-01-01 00:00:00 +0000 UTC…
现在我们想stop 那台有问题的store,如果直接执行 systemctl stop tikv-20160.service ,那么它上面的leader region会不会同步到其他store上去? 会不会对数据有啥影响?比如丢数据之类的?