[image]
找到了,根据这个ID,cluster_processlist里面能查到,但都没有具体的SQL命令 只有in transaction
, sleep状态,怎么定位到SQL呀?
这个connection ID 就是 ,processlist 中的ID 吗?
没有过滤到关键词:all_schema_by_job_versions
是的,卡住DDL后,有个tidb节点就一直在刷这些日志
我上面发的auto analyze的错误日志,是前面找到的错误日志,不知道跟这有没关系
[2025/04/03 10:31:28.711 +08:00] [INFO] [syncer.go:362] ["[ddl] syncer check all versions, someone is not synced"] [info="instance ip 192.168.241.85, port 4000, id 7437fbe2-6533-4d58-80ec-9028800c06c2"] ["ddl job id"=2462] [ve…
通过重启tidb server后,再次执行ddl 还是会卡住~我这问题好像是必现了
查看了下日志,好像有很多这种错误,不知道我这卡DDL跟这有什么关系?
还有auto analyze 这个能关了吗
[2025/04/03 09:56:10.208 +08:00] [INFO] [server.go:855] [kill] [conn=991431833788874755] [query=true]
[2025/04/03 09:56:10.308 +08:00] [WARN] [expensivequery.go:77] ["auto analyze timeout, kill it"]…
这个问题只能通过重启tidb server解决吗有没有其他办法?
这是个BUG吗 在哪个版本中得到了修复?
这俩问题谁了解呀
重启这个tidb server就好了~ 那个ddl 没了~
抽查了下,好像只有1个tidb server报这些异常,一直在刷这些日志信息。
刚开始这个异常是在另一个tidb server上,我重启了后,异常跳到这个tidb server上了。
[2025/04/01 11:36:29.267 +08:00] [INFO] [syncer.go:362] ["[ddl] syncer check all versions, someone is not synced"] [info="instance ip 192.168.241.85, port 4000, id 7aa68da4-4a9b-464d-8ac8-79eed371e10f"] ["d…
tidb上的日志就我上面发的那些, 还需要看什么的日志?
admin show ddl jobs 在运行的事务就这一个,这个事务表就很少的数据理论上应该很快能完成的,
ROW_COUNT也一直是0
只重启 当于ddl运行的tidb节点就行是吧?我们有5个tidb-server节点
刚看了下 还在 cancelling 状态,还有TIDB负载变高了,不知道跟这有没关系~
[image]
只能重启一下看看了
不行 kill 不掉
kill id ; kill tidb id; 都不行
还没重启呢?想着先能定位问题
重启的话是所有tidb节点都要重启吗