0
0
0
1
专栏/.../

【TUG 话题探讨 005】TiDB 生态工具(DM、TiCDC等)使用场景及常见问题

 luzizhuo  发表于  2021-11-03
原创

10 月 28 日晚上 8 点,第五期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“TiDB 生态工具(DM,TiCDC等)使用场景及常见问题” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。

想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通

监控工具

何傲(神州数码):
有没有考虑在Dashboard中集成一下DM和TiCDC的可视化管理?

王贤净(PingCAP):
暂时还没考虑集成 DM 和 TiCDC,有详细使用需求可以在 Asktug 提交产品需求贴。

田朋(同程旅游):
我感觉 我之前用的数据同步工具挺好用的

田朋(同程旅游):
之前用dm 判断主从 dm tidb的延迟不太好判断

田朋(同程旅游):
之前用的是1.0 在就没用

王贤净(PingCAP):
在改了在改了,可以期待一下 DM 2.1 ~ 延迟监控增加了一些更细节的监控项,预计十一月中下旬发版,感兴趣可以关注 release node

江坤(神州数码):
Dashboard 里面能增加一个参数视图嘛,最好能有默认参数和集群设置参数的对比?

王贤净(PingCAP):
默认参数和集群参数设置对比,这个有在考虑,TiUP 有一个小工具 clinic checker 已经在做了。Clinic 诊断工具套件是 Autopilot 组提供的一组 TiDB 集群诊断工具,包括数据采集以及问题诊断,感兴趣的话可以联系我们内部人员优先试用。

迁移工具

代晓磊(360):
我来抛个砖:应用场景1:TiDB 集群多机房互备(经常听人讲2地3中心);2:数仓团队凌晨ETL ;3:MySQL迁移tidb后,替换之前的canal/maxwell等同步工具。

王天宜:
cdc 工具考虑直接将数据同步到 hdfs 的方案吗?

代晓磊(360):
考虑的,做增量备份可以用到

王天宜:
目前 canal 是有对接 hdfs 的接口,cdc 现在还没有吧。TiDB 拥有优秀的 TP 能力,目前 TiFlash 还没有 PB 级别的存储能力,是否可以考虑 cdc 工具落盘到 hdfs。

赵一霖(PingCAP):
目前短期内不会考虑 cdc 工具落盘到 hdfs,有详细使用需求可以在 Asktug 提交产品需求贴。

DM(Data Migration)

代晓磊(360):
DM对MySQL分库分表的主键冲突解决不太友好,1000张表需要配置1000个匹配规则。另外就是DM同步的上下游不太好做数据校验。

田朋(同程旅游):
MySQL的主键+分片键=tidb,联合唯一索引

王贤净(PingCAP):
我记得早期 需要用 column mapping 比较复杂, DM 1.0 后续版本以及 2.0 的话主键冲突问题解决选择性会多一些,比如 联合唯一索引,或者 2.0 下游新增一个主键列 auto_random 都可行~

代晓磊(360):
DM1.0跟2.0的变化还是挺大,之前就有人反馈过,从1.0升级到2.0出现问题又回滚的。

王贤净(PingCAP):
确实,因为内部结构变化比较大, 所以运维起来和 1.0 差距有点多,大家可以看下 PE 的 TiDB 数据同步与复制相关课程了解下。

田朋(同程旅游):
如果 是mycat 或者shard的分库 分表 中间件 咋校对数据,就是 TiDB 和 MySQL的表结构不一样了 这时候校对数据挺麻烦的

王贤净(PingCAP):
这个 sync diff 也在重做呢,预计会添加实时校验功能,不仅是 DM 同步的数据,TiCDC/drainer 这些都可以~

闫颖颖(瑞幸):
TiDB 那个一致性校验工具也可以用于 MySQL 吧?

王贤净(PingCAP):
Sync-diff 当前版本可以校验 MySQL/TiDB 中两份数据是否一致

又回到监控

代晓磊(360):
Tidb推进自有TiDB cloud后希望能在tidb operator上还要继续更新迭代,因为不少公司使用私有云,对该“工具”还是比较依赖的。

田朋(同程旅游):
全量 可以增加一些监控 比如 总量多少 同步多少 还有多少没同步完。增量 能展示出 完成多少gtid 上游gtid的位置 手动调整gtid啥的

王贤净(PingCAP):
这个的话,目前是有一个监控,load unit 导入过程的进度百分比的,不过需求收到,看看能不能更细粒度的展示~

陈加持(哗啦啦):
增量可以计算差距多少 binlog 文件数。

田朋(同程旅游):
用dm比较少 我还是感觉 我们dbrep好用

代晓磊(360):
Tidb dashboard 希望能像之前东旭那篇可观测性的文章那样,把一些能够定位问题的核心指标加入其中(用好的话,可以费了grafana),以后grafana就只是排查更细节的问题时使用了。其实dashboard 中像热点可视化等这种功能点多一些就好了。

王贤净(PingCAP):
需求已接收,感谢晓磊老师建议,目前也在逐步完善 dashboard 的相关指标中。

备份工具

陈臣:
之前用mydumper备份tidb的时候,会有个select min (id),max(id) from t的操作,走的是全表扫描,即使id是自增主键,不知道这个修了嘛?

房晓乐(PingCAP):
这个早修复了,但不知道版本

王贤净(PingCAP):
dumpling 不香嘛!强烈推荐 dumpling ~

田朋(同程旅游):
dumping真的香,我用dumping搞过超大的库,单表备份出来 都1t 2t多,大概有99个表吧,用 Tidb Lightning 恢复的 有时候还会异常 在重新拉起就行。

王贤净(PingCAP):
tidb-lightning 配置不同后端 工作原理不太一样,不过都支持断点续传,重新拉起来就可以

王贤净(PingCAP):
各位老师觉得 lightning local 模式导入快么 ?未来会把 lightning 集合在 DM 里,全量阶段导入就快很多了

田朋(同程旅游):
嗯 MySQL 和tidb 表结构不一定一致,而且 多个MySQL 导进去 可以嘛 local 不是 不能有数据嘛

王贤净(PingCAP):
lightning local 模式支持并行导入啦,从并行角度理解可以是非空表,但是注意还不能增量导入

田朋(同程旅游):
表结构不一致也可以嘛

王贤净(PingCAP):
哪种场景呢?下游多列是可以的,传送一波官方文档 https://docs.pingcap.com/zh/tidb/dev/tidb-lightning-distributed-import#tidb-lightning-分布式并行导入

田朋(同程旅游):
MySQl 的备份 用light 恢复 恢复到tidb 用local模式,但tidb列比MySQL多

王贤净(PingCAP):
亲测可行,之前也有用户这样用过,下游 tidb 列比上游 mysql 多

王贤净(PingCAP):
还有各位老师 觉得 DM 同步延迟慢的问题,也在优化啦~~ 感兴趣的记得参加 360 企业行

王贤净(PingCAP):
话说大家觉得 生态工具类 troubleshooting 的文档 各位老师需要嘛 ,好像目前比较少

陈臣:
这个需要,确实有点少

往期技术探讨回顾

【TUG 话题探讨001】TiDB 的应用场景有哪些?看看 TUG 的技术专家怎么说 TUG 技术探讨

技术话题探讨 8 月 19 日,TUG 群里进行了第一次技术话题探讨会活动,本次探讨会主题为“TiDB 应用场景”,TUG 社群中多位技术专家参与了讨论,以下为讨论分享(为方便大家阅读,顺序有调整): 首先,来自 58 同城的刘春雷分享了 58 对 TiDB 的应用场景 58 同城-刘春雷: MySQL大表: 对于不涉及交易业务的大单表:超过100G的,条数大于1亿的,全部迁移到…

【TUG 话题探讨002】看看 TUG 的技术专家都在用哪些数据库? TUG 技术探讨

9 月 2 日晚上 8 点,第二期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕大家都在用哪些数据库,核心数据库是哪个,以下为讨论分享(为方便大家阅读,顺序有调整): ps: 由于部分信息不适合外放,以下是节选信息,你也可以申请加入 TUG 群参与每期技术话题沟通 大家都在用哪些数据库? 肖飞-嘉里大通物流: sql, oracle , apache ignite , tidb。…

【TUG 话题探讨003】TUG 专家们如何做 TiDB 性能调优 TUG 技术探讨

9 月 16 日晚上 8 点,第三期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕系统经过什么方式调优之后,性能能有较多提升 ,以下为讨论节选。 想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通 调优之硬件配置 万强-云腾未来-数据库运维工程师: 硬件设备足够好 李欧 上海文广dba: 加内存,升级新的ssd 肖飞-嘉里大通物流-架构师: 先…

【TUG 话题探讨004】对 TiDB 的爱恨之情! TUG 技术探讨

10 月 14 日晚上 8 点,第四期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“对 TiDB 的爱恨之情” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。 想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通 讨论节选 春雷(58同城): 对 TiDB 最爱的是:官方服务完美;最恨的是手…

话题征集,参与奖励 100 分,采纳奖励 300 分

【TUG 群】技术话题征集,参与奖励100分,采用奖励300分 关于 TUG

TUG 介绍 TUG 是什么? TUG 是汇聚全球数据库、大数据技术从业者的社区,是一个独立、自发、不以盈利为目的的组织。 TUG 做什么? 探索最前沿的数据库、大数据技术; 沉淀优质内容进行赋能; 搭建人才平台,共建社区; 加入TUG ,你能获得什么? 让数据库、大数据从业者找到自己的圈子; 发表技术见解,收获前沿知识,提升个人影响力。 探索技术问题,随时随地交流成长,解决问题; 有奖…

加入 TUG

如果你也对数据库、大数据感兴趣,想与业界大咖们一起交流最前沿的数据库与大数据知识,欢迎加入 TUG,和 TUG 一起成长!

扫码报名或者点击链接跳转报名

%E4%BA%8C%E7%BB%B4%E7%A0%81%E7%BE%8E%E5%8C%96%20(4)

0
0
0
1

版权声明:本文为 TiDB 社区用户原创文章,遵循 CC BY-NC-SA 4.0 版权协议,转载请附上原文出处链接和本声明。

评论
暂无评论