类似的问题看下。他那个排查下来是dumpling备份msyql5.7兼容性有问题。
没有部署k8s的数据库系统,以后也不会用。
1、数据库性能要求较高,k8s的数据库集群会多一层网络开销,响应性能会损失能大
2、k8s系统需要一个成熟的运维团队维护,复杂度高,排查问题繁琐,不然出问题根本解决不了,数据库出问题不是等着领大礼包么。
ng-mintitoring采集数据存储在tsdb中,tsdb中数据量非常大,
修改/data/tidb/tidb-deploy/prometheus-9090/conf/ngmonitoring.toml增加retention-period = “15d” 没有生效
删除tsdb目录后,重启了下ng-monitoring-server ,空间释放,内存就降下来了。
tikv的cpu高,大部分原因是慢sql造成的,dashboard中看下topsql 情况,优化下慢sql
不是cpu消耗高,是磁盘读写高。删完了,没出现问题。
下次删除超百亿的数据再观察下
端口映射了吗?
kubectl port-forward --address 0.0.0.0 svc/demo-tidb 20160:20160–namespace=tidb
看下granafa监控的tikv-detail-Thread CPU-Unified read pool CPU 高不高
我是limit 10000 ,使用的主键id删除的
[image]
这个dashboard中sql语句平均ru是怎么计算的,怎么那么大的数
公有云使用简单方便,阿里云的本地盘性能不输物理机。
我猜是指的环境问题,比如阿里云不支持浮动的虚拟ip,必须开通 高可用虚拟IP(HaVip)
监控tsp-prod-tidb-cluster /tsp-prod-tidb-cluster-Overview
看下region有没有变化,参考我这个扩容kv节点
[image]是有在缩节点?监控tsp-prod-tidb-cluster /tsp-prod-tidb-cluster-Overview看下regin趋势