写在前面:感谢社区小伙伴在该问题上的协助和支持,同时感谢社区伙伴计划;得益于社区支持,回馈社区用户;
问答链接:https://asktug.com/t/topic/1020182
本文主要针对TiCDC同步数据到kafka,关于kafka认证和非认证问题这里经过测试,分享TiCDC在5.0.3版本和6.5.1版本的差异;供大家使用过程中如果遇到类似问题可以作为参考;
一、问题背景
我们TiDB目前的版本主要是5.0.3和6.5.1,之前在5.0.3版本集群的时候,已经有使用过TiCDC同步数据到kafka的实践案例;按道理6.5.1版本集群,在使用TiCDC同步数据到kafka的时候应该很丝滑才对,可结果却不怎么顺利;
二、测试验证
kafka集群环境说明:
kafka版本:2.7.1
kafka认证⽅式:SASL/PLAIN
kafka集群即支持认证方式【端口:9092】,也支持非认证方式(即匿名用户方式)【端口:9093】
2.1 kafka集群有认证
创建同步任务命令:
tiup ctl:v6.5.1 cdc changefeed create --pd=http://xx.xx.xx.xx:2379
--sink-uri="kafka://xx.xx.xx.xx:9092,xx.xx.xx.xx:9092,xx.xx.xx.xx:9092,xx.xx.xx.xx:9092/HB002_tidb_cdc_test?
kafka-version=2.7.1&sasl-user=tidb_cdc&sasl-password=XXXXXXXX&saslmechanism=plain" --changefeed-id="test-kafka-task" --sortengine="unified" --config=./test_changefeed.toml
6.5.1版本
报错日志如下:
[2024/01/05 14:38:31.349 +08:00] [INFO] [middleware.go:48]
[/api/v2/changefeeds] [status=500] [method=POST] [path=/api/v2/changefeeds]
[query=] [ip=10.xx.xx.xx] [user-agent=Go-http-client/1.1] [clientversion=v6.5.1] [error="[CDC:ErrKafkaNewSaramaProducer]new sarama producer:
Cluster authorization failed."] [errorVerbose="
[CDC:ErrKafkaNewSaramaProducer]new sarama producer: Cluster authorization
failed.\ngithub.com/pingcap/errors.AddStack\n\tgithub.com/pingcap/errors@v0.11.
5-0.20221009092201-b66cddb77c32/errors.go:174\ngithub.com/pingcap/errors.
(*Error).GenWithStackByArgs\n\tgithub.com/pingcap/errors@v0.11.5-
0.20221009092201
kafka集群日志:
[2024-01-05 14:38:32,295] INFO get right password from cache: xxxxxxxx (org.apache.kafka.common.security.plain.internals.PlainSaslServer)
[2024-01-05 14:38:32,295] INFO tidb_cdc:xxxxxxxxx auth success! (org.apache.kafka.common.security.plain.internals.PlainSaslServer)
从kafka集群日志看,账号密码认证成功的,但是TiCDC日志报错:Cluster authorization failed
5.0.3版本 报错日志如下:
Unsupported sasl-mechanism, should be SCRAM-SHA-256 or SCRAM-SHA-512
TiCDC从5.0.3版本开始为 kafka 下游增加 SASL/SCRAM 支持,但是仅支持SCRAM-SHA-256 or SCRAM-SHA-512,不支持PLAIN,所以针对SASL/PLAIN认证方式,5.0.3版本不支持,所以只能使用非认证方式,针对非认证方式,见下文;
2.2 Kafka集群无认证
创建同步任务命令:
tiup ctl:v6.5.1 cdc changefeed create --pd=http://xx.xx.xx.xx:2379
--sink-uri="kafka://xx.xx.xx.xx:9093,xx.xx.xx.xx:9093,xx.xx.xx.xx:9093,xx.xx.xx.xx:9093/HB002_tidb_cdc_test?
kafka-version=2.7.1" --changefeed-id="test-kafka-task" --sortengine="unified" --config=./test_changefeed.toml
6.5.1版本
报错日志如下:
[2024/01/05 14:43:23.312 +08:00] [INFO] [middleware.go:48] [/api/v2/changefeeds] [status=500] [method=POST] [path=/api/v2/changefeeds] [query=] [ip=xx.xx.xx.xx] [user-agent=Go-http-client/1.1] [client-version=v6.5.1] [error="[CDC:ErrKafkaNewSaramaProducer]new sarama producer: Cluster authorization failed."] [errorVerbose="[CDC:ErrKafkaNewSaramaProducer]new sarama producer: Cluster authorization failed.
kafka集群此时没有错误日志输出,但是TiCDC日志报错:Cluster authorization failed
5.0.3版本
同步任务创建成功
Create changefeed successfully!
ID: tgp-task-test
查看任务状态,正常:
$ tiup ctl:v5.0.3 cdc changefeed list --pd=http://xx.xx.xx.xx:2379
Starting component `ctl`: /home/tidb/.tiup/components/ctl/v5.0.3/ctl cdc changefeed list --pd=http://xx.xx.xx.xx:2379
[
{
"id": "test-task-test",
"summary": {
"state": "normal",
"tso": 446877370562117635,
"checkpoint": "2024-01-05 14:46:03.553",
"error": null
}
}
]
从上述结论看,同一个集群的topic,5.0.3集群的CDC同步任务可以创建成功,而6.5.1集群的CDC同步任务创建失败;
三、测试结论
经过社区的支持,TiCDC 能够正常工作所需的最小权限集合,
Kafka ACL授权对 Topic 级别Create
、Write
和 Describe
权限。
对 Cluster 资源类型的 DescribeConfigs
权限;
在6.5.1版本,上述4个权限缺一不可,缺少权限在创建同步任务的时候就会出现Cluster authorization failed的报错;但是在5.0.3版本,针对非认证kafka,不需要Cluster级别的DescribeConfigs
权限
最后,给TiCDC工具和文档提两个小建议:
1、文档上,“TiCDC从5.0.3版本开始为 kafka 下游增加 SASL/SCRAM 支持,但是仅支持SCRAM-SHA-256 or SCRAM-SHA-512,不支持SASL/PLAIN”,可以添加到5.0.3的TiCDC工具使用文档中;
2、针对TiCDC需求的kafka 的ACL权限,可以文档重点说明一下;
3、TiCDC工具上,如果是权限的问题,报错信息可以提示的更加明确一些,而不是笼统的报错:Cluster authorization failed
(笔者能力有限,文章中如果存在技术性或描述性等错误,请大家及时指正,非常感谢!)