1
3
0
0
专栏/.../

TiDB V6.0.0体验 -- TiEM

 G7尹裕皓  发表于  2022-05-09

4月22日咱P社开启了TiDB6.0的试用活动,随即我就报了名,毕竟6.0刚发布我就对两个管理平台产生了比较大的兴趣(TiEM,DM webUI)。

DM webUI在6.0刚发布后就体验了一把,整体试用还是很方便的,只是功能还处于实验阶段,官方也不建议上到生产环境,所以浅尝一下也就告一段落了。

TiEM看介绍是企业版独有的功能,咱公司使用的社区版就没办法了,这次体验活动也给到了TiEM的体验,自然需要参与一下,也幸运的得到了体验机会。

image_9dB1HTFu9o.png

现在开始我的体验过程:

安装

先将官方提供的TiEM安装包传到我的测试服务器

因为我这是自己的测试服务器,外网流量只有1M,这个上传的过程就耗了我20个小时,真是漫长的等待呀

随后按照官方提供的《TiEM v1.0.0 安装手册.pdf》步骤进行安装,因为文档要求不得传播,这里就不做详细的按照流程了。

image_z6Iv6E39K2.png

下面就贴一下我在安装过程中遇到的报错,虽然用处不是很大,但如果能帮到后面的人排错也是好的

  • 安装完成后启动服务,发现遇到了第一个错误。本身的错误日志还不是很容易看出错误在哪,这是我辗转几个地方后在系统日志中看到的image_Wbz2FyQLv-.png这里的解决方案是: yum install openssl
  • 修复上面呢的问题后,现在又遇到了第二个问题,这次在错误日志中找到了问题image_XFjIIukGkb.png这里排查到是信任关系的问题,因为现在TiEM服务只安装在一个节点,所以只需要把自己的公钥复制到自己的authorized_keys中,并且做一次ssh跳转以完成信任关系即可
  • 解决后随后再次启动,这次遇到了第三个问题,也是我的安装过程中遇到的最后一个问题image_bKsuGeEqTY.png提示是内存至少需要4G,而我的测试机剩余内存连512M都不够,这就没办法了,所以我按照官方文档的要求购买了一台8G内存的新实例,又花出去一笔巨款😂。image_SLw29wr1cn.pngimage_qbjnIgZ-bT.png

使用

解决上面一系列问题后,我终于成功启动了TiEM服务,现在就开始正式体验这个功能。

初始配置

启动后就可以登录TiEM管理平台了

默认账号:admin,默认密码:admin

image__qBC52xMss.png

第一次登录有一个欢迎界面,看第一个页面应该是初始的配置引导image_ZVAj0Uthl8.png

第一步看起来是配置数据中心以及各节点配置的,这里的区域配置需要保证和tidb集群一致,不然后续会报错。如果现有tidb集群没有配置labels信息,也需要加上才行。image_dGnV-2znr7.pngimage_bIfnAlM48p.pngimage_RYkdGvz3jC.pngimage_ouu3AAz-AB.png

第二部是配置各个组件的信息,页面上也只有组件名称和端口可以调整,我这里就选默认的直接下一步了image_DDUwJkSO5c.png

第三步是选产品版本,看起来目前还不支持6.0的管理,所以我暂时将自己的6.0回退到了5.4版本,因为可以多选我这里就选5.3以上的image_vkDkus-689.png

经过了引导页面我终于进到了正式页面,一眼就是tidb的风格,使用dashboard比较多看起来这个界面还是挺亲切的image_3u_6hh-36H.png

接管集群

我扫了一眼各个面板,可以发现第一步就是需要做上图右上角的两个按钮,选择其中一个生成第一个需要管理的集群,既然我已经有集群了(相信打大多数人也是这样),我这里选择接管集群来开始接入我的第一个需要管理的集群

刚进来我就遇到了第一个问题,集群名必须达到4~64个字符,而我的集群名只有3个字符。image_v0w_6Hvz4s.png这可怎么办呢,最快的方法就是改集群名,我这个是自己的测试机还是随便改的,下面我就开始了集群改名tiup cluster rename yyh tidb-yyh ,就在这时我想到如果是正在运行的生产库,并且恰好集群名小于4个字符,这种该怎么处理呢。我想这还需要官方给一个比较合适的方案才好。image_hChmCWYw7N.png

现在所有选项配置好了,点击提交,看起来顺利开始接管了image_3H3TA2qVDy.pngimage_tlAXdM5bFa.png

谁知在这里就遇到了第2个问题,提示 host not found 172.24.74.67 ,我开始怀疑是TiEM需要和TiDB集群中控机做互信,于是配置了互信,但还是这个结果。一筹莫展之际,于是我考虑到万能的asktug上去问问大佬image_9e22SY-qK_.png

经过大佬的帮助,终于解决了问题,解决思路已经在帖子里了(https://asktug.com/t/topic/664972 ),我这里总结一下注意点

 1. 一定要导入主机,可以通过主机模板修改好自己的主机信息
 2. tidb集群要配置label信息,并且要在tiem的想到中吧zoneid等信息配置对
 3. 在tiem的中控机执行 install -Dm755 /home/tidb/.tiup/bin/tiup /usr/local/bin -- 这里最后的路径参考帖子的第10楼
 4. rsa文件的复制操作一定不要漏掉

管理集群

最后我终于顺利的接管了现有集群,可喜可贺

image_w4qO2TmI7d.pngimage_e-SFlEfo2v.png

停止和重启

我先来试一下一眼可见的停止和重启功能,嗯。。。很实用一键搞定

image_utzFituLhG.pngimage_ekpzx5UBZa.png

这里我试了一下用tiem关闭,执行命令启动;以及直接执行命令关闭。这两种情况下tiem都是没法检测到tidb集群的最新状态的,不知道是我等的时间不够(大约等了10分钟)还是这里没有定时的检测机制 image_UmgpkBBrzo.png  ​

重新把tiem显示的服务搞起来,进入集群详情看一下。看这布局和功能,只能说不错的,啥操作都可以一键搞定  image_CmhLSjA6iB.png  ​

现在简单的体验一把这里面的功能:

缩容

tiem显示是没有了,但是任务报错了,在中控机上看删除的节点也是Down,但是无法再次启动。这个可能是我哪里没有配置对,也可能是tiem的bug。这里就先不管他了image_RssUFgdCOi.pngimage_JjpiUDlVa5.png ​我通过命令行吧68节点下掉,然后加入了69节点,不过加入后tiem还是没有识别到新节点的加入。我在tiem做了一下重启,重启后也没有识别到新节点的加入,我感觉是设计的有问题,没有做底层变更的识别。image_-klWDGrKeL.png

扩容

扩容里能选的就是资源分配方式,自动就是系统选择可用的主机加入然后给到合适节点配置;手动是自己选择怎么加新节点,于是我新搞了个没有部署tidb的服务器,结果还是没有,这里应该有充分的理由确定是tiem的问题了😂image_BLH-OaTf3d.pngimage_dq9TaKACgO.png

克隆集群、数据同步

这个我现在没有多的机器来做了,就忽略了

image_kGsA0H1cK5.png image_kUvHLxgcWF.png  ​

手动备份

点了以后就可以在备份管理中看到备份进度了,另外也可以在备份管理中设置定时备份

最后我的任务失败了,看备份信息是备份到tiem节点的共享存储,这个应该需要单独配置image_l-NtJj5gAJ.pngimage_6ksCbxvC87.png  ​​

性能分析、集群监控、告警管理

这3个功能的面板都还是空的,只有等后续版本再看了

image_m-AgFRR3DC.pngimage_1pvHkPPQy9.pngimage_DwZf7bJK7X.png

日志管理

可以看到各组件的日志,挺实用

image_FSe-ZTZTQc.png  ​

升级

因为我之前装的是5.4,现在tiem最高只支持5.4,所以我重装一个5.3再来操作

我的重装是命令行重装的,tiem上面也识别不到集群已经没有了,点删除报了个错然后集群状态变成了异常,只能先不管了。但是新接管的集群还是报错了,旧集群相关的主机也没法删除

image_qfQ8kgKDEo.png

无奈呀,我还是重装一下tiem吧。当我打开tiem中控机的时候,聪明的我想到重启一下不就好了吗,毕竟重启可以解决99%的问题。结果可想而知,我还是老实的重装了tiem

image_9A8kQumK48.png

 ​现在我点开了升级,结果仍然没有办法操作,我想这个功能应该还没有做好吧

image_kpSqjgbWJS.png

删除集群

现在把我刚重建的集群删掉,这次直接操作还是很顺利的。值得注意的是删除集群不会把主机删掉,这样下次接管是不是就不用再导入主机信息了

image_yQv6g3IK0C.pngimage_x_BQAox-7x.pngimage_ZcE3rhyn8s.png

但是我到中控机上查看,集群并没有真正的被删除,只是状态变成了down,命令行操作没有再次启动以及其他操作。这可能是防止误操作做的保护措施,保留一下原始信息?

image_7czBZC2PqI.pngimage_HBE0stXJME.png

最后是通过强制参数卸载了集群:tiup cluster destroy tidb-yyh2 --force

创建集群

从按钮来看目前只能选择轻松创建的选项

image_CmwEC1tD-u.png  ​资源分配中手动分配需要提前导入主机,我先尝试自动分配

image_-Sww9COqss.png  ​填写好集群信息,因为我是混布的测试机,我把独占部署去掉了

image_F6RTpCoKxh.png  ​点提交后提示库存不足,没有选独占部署也无法识别到需要的机器,这对混部确实不友好呀。

image_8d0fXB1ErL.png  ​选手动部署是什么效果呢。。。。变成了啥都不能选

image_jWyboKy0qj.png

导入导出

先来看下导出吧,毕竟只有一个集群

看起来导出也只能导到共享存储上面

image_osOQGPmUfk.png第一次报错了,报错信息是我没有装dumpling,于是我把dumpling装上再试一次

image_XedFPGdwB6.png结果还是一样的报错,我分别用了tiup安装和直接下载安装包,两种方法都没有效果。因为时间关系我就暂时不体验了,应该就是dumpling和lightling的功能做了包装,这个能可视化的操作还是很爽的

系统管理功能 ​

最后我看了下系统管理中的 系统监控、系统日志、系统追踪。这三个功能目前都监控不到信息,也只有等后续版本了

-- 在我提交本文后我翻到了 @小明sqlboy 的文章 https://tidb.net/blog/a51f9e05 ,发现他的这些面板是可以正常查看的,我初步怀疑是需要调整监控相关的参数,但是这周又忙起来了我也暂时没法去研究了,就等后续有时间再看吧

最后做个总结:

目前来说TiEM部署起来还是比较简单的,但也有些小问题。

使用方面:界面还是很清爽,各个功能一眼可见,也基本包含了我们日常运维的所有功能。只是呢,很多功能都还有问题,用的不太顺心。

当然,毕竟这还只是第一版,也还没有正式推广,有瑕疵很正常。

最后的最后,其实我对TiEM还是蛮期待的,这些功能全部都完善以后,如果能用在日常工作中,那绝对是解放双手的利器。

1
3
0
0

版权声明:本文为 TiDB 社区用户原创文章,遵循 CC BY-NC-SA 4.0 版权协议,转载请附上原文出处链接和本声明。

评论
暂无评论