作者:唐刘|TiDB 研发副总裁
现在是 AI 的时代,这一点已经毋庸置疑。我们也看到越来越多的公司,把 AI 的能力通过 SaaS 的方式交付 - 也就是 AI as a Service (AIaaS)。譬如像 Lovable 、 Manus 这样的公司,让用户通过使用他们的服务,就能受益于 AI,生成自己的应用、搭建自己的系统。
而对于数据库来说,在这个领域里,最大的变化在于:数据库的使用者,已经从人变成了 AI Agent。 这听起来像一句话的区别,但背后其实是从『确定性』到『不确定性』的巨大范式转变。
从『确定性』到『不确定性』
以前我们写代码、设计系统,讲究一个『可预测』。
- 我要建个电商网站?先搞一张 products 表,字段有 ID、名字、价格。
- 前端要展示列表?写个
SELECT * FROM products ORDER BY id,嗯,so easy。
程序员的脑子里,Schema、Query、页面逻辑,全是人提前设计好的 。这就是所谓的确定性范式 。
但 AI Agent 出现后,画风完全不一样了:
- 你对它说:“帮我建个网站。”
- 它转头就开始自己折腾,设计 Schema,设计 Query 等等。
- 如果一分钟后,它觉得不好,直接全部推翻重来。
不可预测性 ,成了新常态。对数据库来说,尤其是在可扩展性上面,这简直是噩梦。
数据库可扩展性的全新挑战
为了支撑这种 AI Agent 的『 自我创造型负载 』,数据库必须具备更高维度的可扩展性。传统意义上,可扩展性只意味着『数据量』的增长。而在 AIaaS 场景中,这只是冰山一角。实际对于可扩展性有非常多的挑战,譬如:
数据规模与并发的可扩展性的挑战
- 数百万 AI Agent 同时发起请求,生成 PB 级数据,产生极端并发压力。
- 这不是传统的几千几万用户的 OLTP ,而是百万级 Agent 并发操作。
这是我们熟悉的可扩展性,但 AIaaS 把它推到了前所未有的极限。
表结构(Schema)的可扩展性的挑战
- 传统系统里 Schema 是人设计的,可预测。AIaaS 中,每个 Agent 都可能生成独立 Schema。
- 一个系统中可能出现百万甚至千万张表 。问题不是『存不下』,而是传统数据库根本无法管理这么多元信息(metadata)。
这是一个很少被讨论、但极其致命的新维度:Schema 也需要可扩展。
SQL 执行与优化的可扩展性的挑战
- AI 生成的 SQL 是不可控的、不固定的、质量参差不齐的。
- 数据库不仅要『能执行』,还要『执行得高效』。这意味着数据库必须在 SQL 执行层面也具备扩展性 ,能在面对不可预测请求时依然保持稳定,并提供实时的性能与成本反馈,让 Agent 自我学习、自我优化。
当然,除此之外还有更多维度的挑战,比如成本的可扩展性 、安全隔离的可扩展性 、多租户管理的可扩展性 等。限于篇幅,这里不展开。
一次『误打误撞』的进化
老实说, TiDB 能在 AIaaS 场景下脱颖而出,也是一场『误打误撞』。我们一开始并没打算解决这个问题。
四年前 ,某大客户来问我们:『你们能支持百万张表吗?』 我们当时的反应是:『谁会干这么变态的事?』
两年前 , Atlassian 来了:『能不能支持千万张表?我们要搞一个第三方应用开发平台 - Forge 。』 我们再次愣住。但当他们解释:Forge 上有数以万计的开发者,每个开发的 App Schema 都不一样,却要共享同一个数据库,我们终于明白了 - 这不是『变态』,这是未来。
我们硬着头皮做了,最后还真做成了。也正是在那一刻我们发现:这个『奇葩』的需求,其实是 AIaaS 世界的预演。
- 每个开发者的 App,本质上就是一个独立的 Agent;
- 每个 Agent 都有自己的 Schema、自己的 Query。
为什么是 TiDB
应对上面这些可扩展性的挑战,TiDB 的能力恰到好处地对齐:
- 数据与并发扩展性 :天生水平扩展架构,在线扩容、自动分片,在极端负载下依然保持稳定性能。
- Schema 扩展性 :经过 Atlassian 等真实客户的『千万表』场景打磨,TiDB 成为少数能在 Schema 数量维度上真正扩展 的数据库。
- SQL 执行扩展性 :高性能查询引擎 + 混合负载支持(OLTP + 轻量级 OLAP + 混合搜索等),再加上能通过 RU(Request Unit)清晰的知道每一条 Query 运行开销的机制,让每个 Agent 都能实时感知自己生成的 SQL 是快还是慢、贵还是便宜,从而完成自我优化。
写到最后
本文是我在拜访很多客户,跟客户聊 TiDB x AI 的时候,大家一起讨论的话题,就是在 AIaaS 领域,对于一个数据库到底意味着什么,以及为啥一些 AIaaS 公司选择了 TiDB,所以才有了这篇文章。
我一直坚信,AI agent 改变了软件的编写方式,也在重新定义数据库的边界。从『人设计系统』到『AI 生成系统』,从『确定性架构』到『不确定性范式』,每一次转变都伴随着一次基础设施的革新。
而 TiDB,恰好走在了这个转变的前面。它不是为了 AIaaS 而生,但它的架构演进与真实场景打磨 ,让它成为了 AIaaS 时代客户最自然的选择。
我在之前,一直有一个理想,就是希望『在未来,每一个程序员都能拥有自己的数据库』,现在,在这个基础上,我有了一个更大理想,就是希望『在未来,每一个 AI Agent 都能拥有自己的数据库』,而 TiDB,就是最好的选择。