需要关闭多有的tidb server,然后在重启?可以每一个tidb server进行restart吗?
目前查看mysql.tidb_mdl_view这个表,没有阻塞的线程
查看mysql.tidb_mdl_view,没有看到有阻塞的线程
现在region 9783357已经查不到了
» region 9783357
null
» region store 8009881
{
“count”: 0,
“regions”: []
}
» region store 8009882
{
“count”: 0,
“regions”: []
}
通过pd-clt和监控看的,8009882 8009881 这两个缩容的节点上,都是leader=0,region=1
这个问题已经解决了,最终的方法是,清理掉了pd中的region信息之后,pd中不存在了,tikv节点的状态就变成Tombstone了;多谢大佬辛苦指导
好的,多谢,我在试试吧,之前缩容过好几次,也没遇到过这种清不掉的情况
8009881这个节点就是强制下线其中一个tikv节点,tiup cluster scale-in xxxx -N 10.30.xx.xx:20160 --force后的,
8009882这个节点上的tikv进程是没有的,状态是Pending Offline
1和6是两个在线的tikv节点
我下午就是全部停止了(实际上只有8009882和1,6这是哪个节点,8009881这个已经强制删除了),unsafe-recover没有效果的
» store 8009882
{
“store”: {
“id”: 8009882,
“address”: “10.30.xx.xx:20160”,
“state”: 1,
“version”: “5.0.3”,
“status_address”: “10.30.xx.xx:20180”,
“git_hash”: “63b63edfbb9bbf8aeb875aad28c59f082eeb55d4”,
“start_timestamp”: 1678953424,
“deploy_path”: “/data/tidb-deploy/tikv-20160/bin”,
“las…
还是和之前一样
» region 9783357
{
“id”: 9783357,
“start_key”: “7480000000000000FF375F698000000000FF0000040380000000FF0D2F659003800000FF0000000002038000FF00009043FDAD0000FD”,
“end_key”: “7480000000000008FF875F72FC00000019FF18E0020000000000FA”,
“epoch”: {
“conf_ver”: 8028,
“version”: 15791
},
“peer…
执行是成功的,但是pt-ctl还是可以看到region的信息
./tikv-ctl --db /data/tidb-data/tikv-20160/db unsafe-recover remove-fail-stores -s 8009881,1,6 -r 9783357
removing stores [8009881, 1, 6] from configurations…
success