个人资料 - caiyfc

2026 平凯数据库新品分享会议程官宣！转发议程海报/推文，抽限量款 2026 新年登山运动礼盒！

私信

caiyfc

V10

努力学习中

于 2021-06-23 加入

获赞

543

回答

802

文章

徽章

34/94

点亮更多徽章

回答 802 提问 7 文章 10

全部

8.5 版本的 cdc 同步延迟问题

建议先排查下外在因素，比如上游的qps，v6.5.9和v8.5.3这两个集群的qps是否相近；v8.5.3同步到 v8.1.1 的时候是否遇到了冲突，检查一下日志；v8.1.1的集群是否达到的瓶颈，或cdc的机器是否有瓶颈

2 个月前

TiDB & PingCAP 十周年，感谢有你们。十载共筑，远见新生！

Ti 赞了，相约下一个十年！

10 个月前

【抽福气，送大礼】2024 TiDB 社区年度总结报告新鲜出炉！又携手共进了一年，2025年，一起迎接变化，挑战变化！

买彩票去

1 年前

从 PD 取事务开始时间戳步骤的耗时和Coprocessor 执行耗时过长

取事务 ts时间长就看pd leader和tidb的资源是不是被占满了，主要是cpu和网络资源。 sql Coprocessor 执行耗时，可能是有读取热点，可以看看tikv的读线程cpu高不高，均不均衡。这种大概率是优化sql来解决问题

1 年前

br执行PITR的时候出现日志相关报错

你在哪个时间点完成了全备的？ pitr应该是只能恢复全备以后的增量数据，所以你恢复的时间点应该设置为全备以后且有增量日志的时间点

1 年前

TiDB集群可靠性测试

没办法这么测试

1 年前

TiDB集群可靠性测试

你说的整个集群突然断电的情况没测试过，不过就算出问题也有解决方法。毕竟只要三个组件：tidb，tikv，pd都正常就能正常使用。而tikv和pd都有故障恢复的方案。我在poc的时候测试过给某个tidb和tikv断网和断电，都问题不大。

1 年前

TiDB 社区第四届 1024 程序员心愿节来啦！没有 Bug ，只有 Luck！参与留言活动，许愿你想要的 TiDB 产品功能、周边、TiDB 课程 & 考证优惠，一起庆祝 1024 吧！

【你最想实现的 TiDB 功能需求】针对pitr，增加监控及告警。主要是保证有异常，马上能收到反馈【你最喜欢的 TiDB 新特性 + 理由】向量功能，紧跟技术前沿【你最想要周边心愿池里的哪个周边】键盘+鼠标垫【你考过哪些 TiDB 证书？】所有【你身边有多少位朋友在用 TiDB？】 10+

1 年前

升级 tidb-operator 出现问题，报rbac.authorization.k8s.io/v1beta1不存在是为啥

问了一下ai，他说 Kubernetes 1.28 中 rbac.authorization.k8s.io/v1beta1 已经被移除，所以你需要将 ClusterRole 和 ClusterRoleBinding 的 API 版本更新为 rbac.authorization.k8s.io/v1。可以试试

1 年前

在国产麒麟系统安装TiDB，在启动时报错

看报错是因为：a terminal is required to read the password ; 这个报错通常是由于使用了需要输入密码的命令（例如 sudo），但命令在没有终端的环境下运行，无法通过终端提示用户输入密码。你应该是没有给main配置无密码 sudo。可以尝试使用tidb用户进行部署，或者给main用户配置无密码登录。类似下图：

1 年前

集群启动失败timed out waiting for port 20161 to be started after 2m0s

这种一般就是看启动时候的组件的日志，或者系统操作日志。根据你发的日志信息，应该就是numactl 没有安装，安装了可以不使用，没啥影响的，下面是官方的安装方法：安装 numactl 工具 | TiDB 文档中心 (pingcap.com)

1 年前

部署tidb集群的时候，会关闭swap吗

生产环境肯定是要关闭的，一开始采购机器的时候就应该采购足够的内存，而不是到最后用swap来续命。oom的本质还是sql的问题，尽量优化sql或者改写sql，就可以避免大多数oom的情况

1 年前

tikv节点如何快速彻底踢出集群？新加的节点怎么快速平衡leader-region？

如果leader region在offline的节点上，应该是会影响查询的

1 年前

tikv节点如何快速彻底踢出集群？新加的节点怎么快速平衡leader-region？

还是要先加速region的迁移，把store limit调大一些，测试集群可以调到百万级别，生产集群就调整小一点，万级就行了。删除的store，看看region count是不是在减少，如果是的话就不用管，等待region count变成0就行。如果没有减少，可能需要手动去删除对应的region