TEM(TiDB Enterprise Manager)是专为 TiDB 打造的企业级全生命周期运维管理平台,帮助用户轻松应对分布式数据库在资源管理、监控告警、备份恢复、性能诊断等方面的复杂挑战。通过统一管控、智能调度、可视化操作与自动化流程,TEM 显著提升运维效率,保障数据库稳定运行。
核心架构:任务系统 + 核心服务,统一管控更省心
TEM v3.3 采用“任务子系统 + TEM 核心服务”双核架构,通过 TiUP、Agent(TCM)与 SSH 实现对物理机/虚拟机上的 TiDB 集群的统一纳管。

- 任务子系统:支持周期性、一次性任务调度,确保运维动作有序执行。
- 核心服务模块:涵盖集群管理、备份恢复、告警中心、主机管理等,提供一站式图形化操作界面,告别繁琐命令行。

登录与首页:全局概览,关键信息一目了然

登录 TEM 后,首页即为运维驾驶舱,清晰展示:
- 集群、主机、备份统计:实时掌握资源状态与任务执行情况。
- 前 5 SQL 性能分析:从 Transaction OPS、QPS、Duration 等多维度呈现性能趋势,助力快速定位瓶颈。

集群管理:灵活创建与纳管,轻松上手
TEM 支持多种集群部署方式:
- 套餐式创建:预定义主机规格与组件配置,一键部署标准化集群。
- 手动/文件导入节点:灵活应对个性化部署需求。
- 纳管现有集群:无缝接管通过 TiUP 部署的集群,实现图形化统一管理,降低运维门槛。
创建集群

创建集群有以下几种方式:
- 使用套餐创建。套餐可以在 主机->集群套餐 中查看或新建,比如一个基础套餐包括 2 tidb, 3 pd, 3 tikv, 1 grafana, 1 prometheus, 1 alertmanager 组件。TEM 会根据内部的算法将组件分配到相应的主机节点上。
- 手动添加节点。自定义添加 pd、tikv、tidb 等组件及部署信息。
- 通过导入 xlsb 添加节点。上传已编辑的 .xlsb 文件,文件中已经配置好需要安装的组件及部署信息。
纳管集群

纳管集群是在已经使用 tiup 命令行部署好集群后,通过 TEM 接管 tiup 中控机,间接以图形化的方式来管理集群。所有纳管的集群都会在集群列表中显示。
主机管理:资源可视化,告警提前感知
- 主机概览:CPU、内存、磁盘使用情况一目了然,支持阈值告警,防患于未然。
- 主机详情:支持共享/专用主机分类,位置管理更清晰。
- 中控机管理:支持多中控机统一维护,提升管理弹性。
- 规格与套餐预设:标准化资源配置,加速集群部署流程。
主机概览
此页面展示主机的概览信息,包括:主机使用情况(空闲主机)、CPU 使用率、内存使用率、空闲磁盘情况、磁盘使用率。同时,也可以根据 告警设置 中配置的阈值显示主机告警事件,例如告警设置主机 CPU 使用率 50% 为阈值,当有主机实际 CPU 使用超过 50% 时即会产生告警事件。

主机详情
此页面显示所有已经添加的主机列表信息,包括 IP地址、主机名称、主机规格、位置、关联集群、主机类型、CPU、内存、存储、主机状态。主机分为共享主机和专用主机两种,选择 共享 或 专用 可以添加共享主机或专用主机,也可以管理主机的位置。

集群管理中控机
此页面显示 TEM 已经导入的中控机(TiUP),可以通过 添加中控机 按钮在 TEM 中管理并维护多个中控机。列表显示中控机的IP地址、名称、服务端口、TiUP镜像仓库、管理的集群、创建时间和中控机状态。

主机规格
此页面可以配置一些不同规格的主机类型,包括 CPU 核数、内存大小、存储类型、磁盘容量等。

集群套餐
此页面可以预定义一些集群套餐,方便在部署时可以直接按套餐自动化部署,实现快速部署。

告警管理:统一告警中心,智能规则模板
- 告警事件聚合:所有集群告警信息集中展示,支持活跃告警与历史记录查询。
- 规则与模板:支持自定义告警规则,或基于模板快速生成,提升告警配置效率。
告警事件
包括活跃告警和告警历史的显示,此处的告警模块为所有集群的告警信息集合。点击具体的事件名称可以查看告警事件详情。


告警规则
告警规则可以自己创建规则,也可以从现有集群中导入规则。

告警模板
告警规则可以自定义创建相应的规则模板,方便后续使用时直接根据模板生成告警规则。

备份恢复:策略化备份,一键恢复更安心
- 备份任务:支持全量、库级、表级备份,手动或立即备份灵活选择。
- 备份策略:可配置周期、保留时间、调度时区,实现自动化备份管理。
- 数据恢复:图形化操作,快速恢复数据,保障业务连续性。

备份任务
点击 立即备份 按钮,将弹出立即备份弹出框,手工设置备份名称、备份类型(全量备份/库级别备份/表级别备份)、租户、集群名称、目的地址等信息后即可开始一次手工备份。

此页面也可以进行手工恢复操作,点击 数据恢复 按钮,便可以通过弹出框输出想要恢复的信息开始数据恢复操作。

备份策略
备份策略页面,可以看到创建的备份策略列表。

如果没有相应的备份策略,我们也可以通过 创建备份策略 按钮创建,此时除了要设置备份的类型、地址等常规信息以外,还需要配置备份周期、保留时间、调度时区、调度时间等。

数据同步与主备集群:可视化链路,高可用无忧
- 数据同步:支持 TiCDC 同步链路导入与管理,主备复制状态清晰可见。
- 主备集群管理:白屏化查看主备关系与同步状态,支持新建或纳管现有集群。
数据同步
如果之前已经有 TiDB 主备集群并通过 TiCDC 实现主备复制,TEM 支持直接通过 TiCDC 导入同步链路(changefeed),并在界面中展示各同步链路的状态信息。如果已经有两套 TiDB 集群且上游已经部署 TiCDC,可以通过 TEM 新建数据同步链路(changefeed)并后续管理。在后续的版本中,TiDB 企业版本将支持物理复制功能,届时可以通过物理复制的方式来进行数据同步。

主备集群
主备集群页面可以方便运维同步通过白屏化的方式来查看主备集群的关联关系以及同步状态。可以直接纳管现有的主备集群,也可以新建主备关系。

巡检与安全:自动化巡检,防火墙护航
- 巡检策略:支持自定义巡检项与调度周期,主动发现潜在风险。
- 防火墙:集群级白名单管理,增强访问安全。
点击左侧的 巡检 标签,可以进入巡检页面,查看巡检策略列表,包括策略状态、巡检频率、巡检时间、适用集群等。

也可以新建巡检策略,配置策略名称、调度周期/时间、租户、适用集群以及巡检项目。

防火墙提供一种白名单的能力,可以定义哪套集群允许的白名单列表。


任务与审计:操作可追溯,运维更规范
- 任务中心:所有操作任务状态透明可见,支持进度跟踪。
- 审计日志:记录用户操作行为,满足安全审计与合规要求。
TEM 中所有的操作都对应一个或多个任务,此页面将显示每个子任务的执行状态及完成情况。

针对 TEM 中每个用户的操作,打开审计日志后都会记录相应的审计日志信息,用于后续安全审计的需求。

推荐理由:为什么选择 TEM?
- 统一管控:一个平台管理所有 TiDB 集群与主机资源。
- 自动化运维:从部署、备份到巡检,全流程自动化,减少人工干预。
- 可视化监控:性能、告警、备份状态一目了然,降低运维复杂度。
- 企业级可靠:支持高可用、数据恢复、安全审计,满足生产级要求。
如果需要进一步扩展集群管理的细节内容(如节点扩缩容、参数调优、版本升级等),我们将在后续文章中详细展开。您可联系 TiDB 官方获取 TEM 企业版,开启智能运维新体验!