博客 - 本地Kind体验TiDB Operator最小实践

本地Kind体验TiDB Operator最小实践

一、背景

本地TiDB测试环境（基于k8s）按照说明文档操作了几次都没有成功安装TiDB集群，对我这样的新新手还是有些难度，今天把部署成功的路径记录下来！

二、准备环境

系统：基于 centos7.3 pure的虚拟机配置：2c,4G IP：192.168.31.236 （虚拟机IP ） k8s:kind本地模拟k8s集群 TiDB:v5.4.0

2.1 使用 kind 创建 Kubernetes 集群

目前比较通用的方式是使用 [kind](https://kind.sigs.k8s.io/) 部署本地测试 Kubernetes 集群。kind 适用于使用 Docker 容器作为集群节点运行本地 Kubernetes 集群。

2.1.1 部署前准备环境

请确保满足以下要求

docker：版本 >= 17.03
kubectl：版本 >= 1.12
kind：版本 >= 0.8.0
若使用 Linux, net.ipv4.ip_forward 需要被设置为 1


# 1、安装docker
yum remove docker  docker-common docker-selinux docker-engine
yum install -y yum-utils device-mapper-persistent-data lvm2
yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
yum install docker-ce

# # 开机启动  
systemctl start docker
systemctl enable docker
# # 查看版本
docker version

[root@tidb-k3s .kube]# docker version
Client: Docker Engine - Community
 Version:           20.10.14
 API version:       1.41
 Go version:        go1.16.15

# # 安装docker-compose指定版本2.2.2
curl -L "https://github.com/docker/compose/releases/download/v2.2.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose && chmod +x /usr/local/bin/docker-compose 
docker-compose --version

[root@tidb-k3s .kube]# docker-compose --version
Docker Compose version v2.2.2

# 2、安装kubectl
curl -L "https://dl.k8s.io/release/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl" -o /usr/local/bin/kubectl
chmod +x /usr/local/bin/kubectl

[root@tidb-k3s .kube]# kubectl version
Client Version: version.Info{Major:"1", Minor:"23", GitVersion:"v1.23.5", GitCommit:"c285e781331a3785a7f436042c65c5641ce8a9e9", GitTreeState:"clean", BuildDate:"2022-03-16T15:58:47Z", GoVersion:"go1.17.8", Compiler:"gc", Platform:"linux/amd64"}

# 3、安装kind v0.12.0版本
curl -L "https://github.com/kubernetes-sigs/kind/releases/download/v0.12.0/kind-linux-amd64" -o /usr/local/bin/kind && chmod +x /usr/local/bin/kind

[root@tidb-k3s .kube]# kind version
kind v0.12.0 go1.17.8 linux/amd64

# 4、设置net.ipv4.ip_forward 为 1
vim /proc/sys/net/ipv4/ip_forward

cat /proc/sys/net/ipv4/ip_forward
1

2.1.2 创建集群

kind create cluster

这个过程有点慢（需要下载1个多G的镜像）

检查集群是否创建成功：

[root@tidb-k3s bin]# kubectl cluster-info
Kubernetes control plane is running at https://127.0.0.1:44141
CoreDNS is running at https://127.0.0.1:44141/api/v1/namespaces/kube-system/services/kube-dns:dns/proxy

To further debug and diagnose cluster problems, use 'kubectl cluster-info dump'.

Kubernetes 集群部署完成，现在就可以开始部署 TiDB Operator 了！

2.2 部署 TiDB Operator

2.2.1 安装 TiDB Operator CRDs

1、raw.githubusercontent.com 国内不能直接访问，需要设置host

https://ipaddress.com/website/raw.githubusercontent.com#通过这个链接查看服务器ip

vim /etc/hosts

185.199.108.133 raw.githubusercontent.com
185.199.109.133 raw.githubusercontent.com
185.199.110.133 raw.githubusercontent.com
185.199.111.133 raw.githubusercontent.com

2、安装 CRD 到集群中

# 下载crd.yaml
curl -L https://raw.githubusercontent.com/pingcap/tidb-operator/v1.3.2/manifests/crd.yaml -o crd.yaml
# 创建 crd
kubectl create -f crd.yaml
# 删除 crd
# kubectl delete  -f crd.yaml


# 查看crd
kubectl get crd

[root@tidb-k3s k8s]# kubectl get crd
NAME                                 CREATED AT
backups.pingcap.com                  2022-04-06T23:15:51Z
backupschedules.pingcap.com          2022-04-06T23:15:51Z
dmclusters.pingcap.com               2022-04-06T23:15:51Z
restores.pingcap.com                 2022-04-06T23:15:52Z
tidbclusterautoscalers.pingcap.com   2022-04-06T23:15:52Z
tidbclusters.pingcap.com             2022-04-06T23:15:54Z
tidbinitializers.pingcap.com         2022-04-06T23:15:58Z
tidbmonitors.pingcap.com             2022-04-06T23:15:59Z
tidbngmonitorings.pingcap.com        2022-04-06T23:16:01Z

2.2.2 安装 TiDB Operator

1、安装helm

# helm
curl -L https://get.helm.sh/helm-v3.8.0-linux-amd64.tar.gz -o helm-v3.8.0-linux-amd64.tar.gz
tar -zxvf helm-v3.8.0-linux-amd64.tar.gz
mv ./linux-amd64/helm /usr/local/bin/helm
chmod +x /usr/local/bin/helm

# helm version
[root@tidb-k3s k8s]# helm version
version.BuildInfo{Version:"v3.8.0", GitCommit:"d14138609b01886f544b2025f5000351c9eb092e", GitTreeState:"clean", GoVersion:"go1.17.5"}

2、添加 PingCAP 仓库

helm repo add pingcap https://charts.pingcap.org/

#helm repo list
[root@tidb-k3s k8s]# helm repo list
NAME    URL                        
pingcap https://charts.pingcap.org/

3、为 TiDB Operator 创建一个命名空间

kubectl create namespace tidb-admin

4、安装 TiDB Operator

helm install --namespace tidb-admin tidb-operator pingcap/tidb-operator --version v1.3.2

注意：安装tidb-operator 如果出现下面的提示：

Error: INSTALLATION FAILED: cannot re-use a name that is still in use

# 重新创建namespace
helm ls --all-namespaces
kubectl delete namespace tidb-admin
kubectl create namespace tidb-admin

5、检查 TiDB Operator 组件是否正常运行

watch  kubectl get pods --namespace tidb-admin -l app.kubernetes.io/instance=tidb-operator

当所有的 pods 都处于 Running 状态时，继续下一步部署tidb集群。

注意：如果所有的pod都一直处于pending，需要检查虚拟机的cpu和内存是不是够用 2核4G以上即可。

三、部署tidb cluster和监控

3.1 部署tidb-cluster集群

3.1.1 下载tidb-cluster.yaml

# 下载tidb-cluster.yaml
curl -L https://raw.githubusercontent.com/pingcap/tidb-operator/master/examples/basic/tidb-cluster.yaml -o tidb-cluster-basic.yaml

3.1.2 创建tidb集群命名空间

kubectl create namespace tidb-cluster

3.1.3 部署tidb-cluster集群

# 使用上面下载的集群拓扑tidb-cluster-basic.yaml
kubectl -n tidb-cluster apply -f ./tidb-cluster-basic.yaml

# 立即提示 created
[root@tidb-k3s k8s]# kubectl -n tidb-cluster apply -f ./tidb-cluster-basic.yaml
tidbcluster.pingcap.com/basic created

3.1.4 观察pod创建

# 观察pod创建
watch kubectl get pod -n tidb-cluster

1、先创建discoery和pd

2、创建完pd才开始创建tikv

3、tikv创建完之后开始创建tidb-server

3.1.5 对外暴露端口14000

# 获取 tidb-cluster 命名空间中的服务列表 4000端口是否准备完毕
kubectl get svc -n tidb-cluster

# 使用端口转发 监听0.0.0.0:14000  转发到tidb-server的4000
kubectl port-forward --address 0.0.0.0 -n tidb-cluster svc/basic-tidb 14000:4000 > pf14000.out &

# 查看监听端口
netstat -tpln

# 如果端口 14000 已经被占用，可以更换一个空闲端口。命令会在后台运行，并将输出转发到文件 pf14000.out。

3.1.6 连接 TiDB-server

1、使用mysql 客户端连接（其他client也可以）

# 此处的 192.168.31.236 为虚拟机的ip，如果要使用127.0.0.1可以设置本机端口转发到虚拟机
# 保留注释，以便使用hint
mysql --comments -h 192.168.31.236 -P 14000 -u root

#提示
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 179
Server version: 5.7.25-TiDB-v5.4.0 TiDB Server (Apache License 2.0) Community Edition, MySQL 5.7 compatible
mysql>

2、使用测试sql

mysql> use test;
mysql> create table hello_world (id int unsigned not null auto_increment primary key, v varchar(32));

mysql> select * from information_schema.tikv_region_status where db_name=database() and table_name='hello_world'\G

# 查看版本号
mysql> select tidb_version()\G

# 查询 TiKV 存储状态
mysql> select * from information_schema.tikv_store_status\G

# 查看集群基本信息
mysql> select * from information_schema.cluster_info\G

3.2 部署监控

3.2.1 下载tidb-monitor.yaml

curl -L https://raw.githubusercontent.com/pingcap/tidb-operator/master/examples/basic/tidb-monitor.yaml -o tidb-monitor-basic.yaml

3.2.2 部署监控节点

kubectl -n tidb-cluster apply -f ./tidb-monitor-basic.yaml

3.2.3 观察监控pod创建

watch kubectl get pod -n tidb-cluster

获取服务列表 kubectl get svc -n tidb-cluster

# 获取 tidb-cluster 命名空间中的服务列表 3
[root@tidb-k3s k8s]# kubectl get svc -n tidb-cluster
NAME                     TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)               AGE
basic-discovery          ClusterIP   10.96.206.145   <none>        10261/TCP,10262/TCP   61m
basic-grafana            ClusterIP   10.96.190.13    <none>        3000/TCP              22m
basic-monitor-reloader   ClusterIP   10.96.16.223    <none>        9089/TCP              22m
basic-pd                 ClusterIP   10.96.19.73     <none>        2379/TCP              61m
basic-pd-peer            ClusterIP   None            <none>        2380/TCP,2379/TCP     61m
basic-prometheus         ClusterIP   10.96.109.172   <none>        9090/TCP              22m
basic-tidb               ClusterIP   10.96.37.140    <none>        4000/TCP,10080/TCP    47m
basic-tidb-peer          ClusterIP   None            <none>        10080/TCP             47m
basic-tikv-peer          ClusterIP   None            <none>        20160/TCP             58m

3.2.4 对外暴露端口2379，3000

kubectl port-forward --address 0.0.0.0 -n tidb-cluster svc/basic-grafana 3000:3000 > pf3000.out &
kubectl port-forward --address 0.0.0.0 -n tidb-cluster svc/basic-pd 2379:2379 > pf2379.out &

#注意：这里要加上 --address 0.0.0.0,否则 外网无法访问

3.2.5 测试Dashboard

http://192.168.31.236:2379/dashboard/ root=

3.2.5.1 概况

3.2.5.2 TopSql

1、安装NgMonitoring

cat << EOF | kubectl apply -n tidb-cluster -f -
apiVersion: pingcap.com/v1alpha1
kind: TidbNGMonitoring
metadata:
  name: main-cluster-monitoring
spec:
  clusters:
  - name: basic
    namespace: tidb-cluster

  ngMonitoring:
    requests:
      storage: 1Gi
    version: v5.4.0
    # storageClassName: default
    baseImage: pingcap/ng-monitoring
	
EOF

# 提示
# tidbngmonitoring.pingcap.com/main-cluster-monitoring created

2、等待pod安装成功进入running状态

3、安装成功后，刷新dashboard。

1)、打开设置（topSQL） http://192.168.31.236:2379/dashboard/#/topsql

4、点击保存后，过几分钟 topsql将会有数据。

3.2.6 测试grafana

http://192.168.31.236:3000/ admin=admin

四、扩容与缩容

1、进行扩容操作，可将某个组件的 replicas 值调大。扩容操作会按照 Pod 编号由小到大增加组件 Pod，直到 Pod 数量与 replicas 值相等。 2、进行缩容操作，可将某个组件的 replicas 值调小。缩容操作会按照 Pod 编号由大到小删除组件 Pod，直到 Pod 数量与 replicas 值相等。

3、查看集群水平扩缩容状态

watch kubectl -n ${namespace} get pod -o wide

提示： 1、PD 和 TiDB 通常需要 10 到 30 秒左右的时间进行扩容或者缩容。 2、TiKV 组件由于涉及到数据搬迁，通常需要 3 到 5 分钟来进行扩容或者缩容。

4.1 水平扩容 2个tidb，最终实现3个tidb

按需修改 TiDB 集群组件的 replicas 值。例如，执行以下命令可将 PD 的 replicas 值设置为 3：

# kubectl get tidbcluster ${cluster_name} -n ${namespace} -oyaml
# # 查看
kubectl get tidbcluster basic -n tidb-cluster -o yaml

# kubectl patch -n ${namespace} tc ${cluster_name} --type merge --patch '{"spec":{"pd":{"replicas":3}}}'
# 设置 replicas为3 （即扩容2个tidb）
kubectl patch -n tidb-cluster tc basic --type merge --patch '{"spec":{"tidb":{"replicas":3}}}'

4.2 水平扩容2个pd，2个tikv 最终实现 333

kubectl patch -n tidb-cluster tc basic --type merge --patch '{"spec":{"pd":{"replicas":3}}}'
kubectl patch -n tidb-cluster tc basic --type merge --patch '{"spec":{"tikv":{"replicas":3}}}'

# 查看pod创建情况
kubectl get pod -n tidb-cluster

[root@tidb-k3s k8s]# kubectl get pod -n tidb-cluster 
NAME                                      READY   STATUS    RESTARTS        AGE
basic-discovery-55fd6db97f-k48xf          1/1     Running   0               147m
basic-monitor-0                           4/4     Running   0               108m
basic-pd-0                                1/1     Running   0               147m
basic-pd-1                                1/1     Running   2               15m
basic-pd-2                                1/1     Running   0               14m
basic-tidb-0                              2/2     Running   0               133m
basic-tidb-1                              2/2     Running   0               23m
basic-tidb-2                              2/2     Running   0               23m
basic-tikv-0                              1/1     Running   0               144m
basic-tikv-1                              1/1     Running   1 (3m12s ago)   12m
main-cluster-monitoring-ng-monitoring-0   1/1     Running   0               75m

我这里在创建basci-tikv-2的时候较慢（受限于内存和cpu）。

4.3 水平缩容 2个tidb、2个tikv,2个pd

# 缩容
kubectl patch -n tidb-cluster tc basic --type merge --patch '{"spec":{"pd":{"replicas":1}}}'
kubectl patch -n tidb-cluster tc basic --type merge --patch '{"spec":{"tikv":{"replicas":1}}}'
kubectl patch -n tidb-cluster tc basic --type merge --patch '{"spec":{"tidb":{"replicas":1}}}'

# 查看pod创建情况
watch kubectl get pod -n tidb-cluster

4.4 垂直扩缩容

通过增加或减少 Pod 的资源限制，来达到集群扩缩容的目的。 垂直扩缩容本质上是 Pod 滚动升级的过程。

提示：垂直扩缩容和扩缩容其他组件整理不做演示，请参考 https://docs.pingcap.com/zh/tidb-in-kubernetes/stable/scale-a-tidb-cluster

五、升级集群

5.1 升级TiDB集群

5.1.1 在 TidbCluster CR 中，修改待升级集群的各组件的镜像配置：

# kubectl edit tc ${cluster_name} -n ${namespace}

kubectl edit tc basic -n tidb-cluster
#一般修改 `spec.version` 即可。

5.1.2 查看升级进度

watch kubectl -n tidb-cluster get pod -o wide

当所有 Pod 都重建完毕进入 Running 状态后，升级完成。

总结与思考

总结

1、安装完成不易，在此记录心路历程。感谢tidb官网、感谢tidber！

2、TiDB Operator的其他功能需要更多的探索学习！

思考

未来ALL in TIdb，使用k8s还是裸机tiup的方式，这个疑问后续继续探索。

本地Kind体验TiDB Operator最小实践

本地Kind体验TiDB Operator最小实践

一、背景

二、准备环境

2.1 使用 kind 创建 Kubernetes 集群

2.1.1 部署前准备环境

2.1.2 创建集群

2.2 部署 TiDB Operator

2.2.1 安装 TiDB Operator CRDs

2.2.2 安装 TiDB Operator

1、安装helm

2、添加 PingCAP 仓库

3、为 TiDB Operator 创建一个命名空间

4、安装 TiDB Operator

5、检查 TiDB Operator 组件是否正常运行

三、部署tidb cluster和监控

3.1 部署tidb-cluster集群

3.1.1 下载tidb-cluster.yaml

3.1.2 创建tidb集群命名空间

3.1.3 部署tidb-cluster集群

3.1.4 观察pod创建

1、先创建discoery和pd

2、创建完pd才开始创建tikv

3、tikv创建完之后开始创建tidb-server

3.1.5 对外暴露端口14000

3.1.6 连接 TiDB-server

1、使用mysql 客户端连接（其他client也可以）

2、使用测试sql

3.2 部署监控

3.2.1 下载tidb-monitor.yaml

3.2.2 部署监控节点

3.2.3 观察监控pod创建

3.2.4 对外暴露端口2379，3000

3.2.5 测试Dashboard

3.2.5.1 概况

3.2.5.2 TopSql

3.2.6 测试grafana

四、扩容与缩容

4.1 水平扩容 2个tidb，最终实现3个tidb

4.2 水平扩容2个pd，2个tikv 最终实现 333

4.3 水平缩容 2个tidb、2个tikv,2个pd

4.4 垂直扩缩容

五、升级集群

总结与思考

总结

思考

谢谢！