本文作者:白鳝
引言
在信息技术飞速发展的当下,数据库国产化进程加速推进。在国产化替代浪潮下,数据库选型不仅是技术决策,更是涉及政策合规、业务适配与成本管控的系统工程。以下内容是白鳝老师在 TiDB 社区南京站的分享,结合他多年的数据库实践经验,将从政策框架、选型策略到技术落地,为企业信创数据库选型提供了完整的方法论。
国产化替代方针与策略
(一)数据库国产化替代大势所趋
近年来,全球科技竞争加剧,信息技术应用创新成为国家战略重点。数据库作为信息技术的核心基础软件,其国产化替代对于保障国家信息安全、推动产业自主发展意义重大。从宏观层面来看,无论是党政军、关基企业,还是非关基企业,都在不同程度上面临着数据库替换的需求。
党政军领域对数据库国产化要求严格,内网系统必须采用特定数据库强制替代,外网关键系统使用国产商用数据库,非关键系统可选用开源数据库,且优先考虑国产开源或可控开源数据库。关基企业同样肩负着必须替代的任务,依据行业监管要求的差异,制定了不同的替代策略,如银行需全面替代,证券应替尽替,运营商优先替代核心系统。
对于非关基企业,尽管没有明确的监管要求,但从长远发展和成本效益角度出发,数据库国产化也是大势所趋,企业应考虑适当开始准备工作,以应对未来变化。目前,越来越多的企业开始主动探索国产化路径,部分民营企业已在实践中收获良多,如某国内制造业企业成功用国产开源数据库替代 Oracle 数据库,降低了成本,提升了系统自主性。同时,外资企业也受到相关影响,在中国的德企、日企等纷纷开展数据库去“O”行动,选择国产或开源数据库,这充分表明国产化替代已成为企业适应市场变化、提升竞争力的必然选择。
(二)数据库替代方式的策略与应用场景
- 简单替代:适用于负载较低、数据量不大且业务逻辑相对简单的场景
在数据库国产化替代过程中,企业应根据自身业务特点和系统需求,选择合适的替代方式。比如简单替代适用于负载较低、数据量不大且业务逻辑相对简单的场景。在这种情况下,企业只需将数据迁移至国产数据库,并对原有的索引进行适当优化,即可完成替代,即使性能略有下降,也在可接受范围内。
- 优化后替代:业务逻辑复杂、数据量较大的系统
对于业务逻辑复杂、数据量较大的系统,简单替代往往难以满足需求,需要进行优化后替代。这要求企业对不兼容代码进行修改,优化接口,以确保国产数据库能够稳定运行。例如,在一些企业的业务系统中,涉及复杂的业务流程和大量的数据交互,需要对数据库的架构和代码进行调整,才能实现高效替代。
- 改造后替代:业务复杂且并发量极大,对兼容性和性能方面有较高要求
而对于像运营商、银行、保险公司等核心系统,业务复杂且并发量极大,兼容性和性能方面存在诸多挑战,此时改造后替代成为常用策略。企业可以通过架构优化,如将报表迁移至合适的页面,进行数据归纳以控制数据规模,利用历史归档控制数据量等方式,分散系统负担,降低性能风险。在架构优化的基础上,尽量减少代码大改,确保系统相对平稳地实现替换。
- 重建后替代:业务逻辑、数据量和并发量都非常大的复杂系统
最后,对于业务逻辑、数据量和并发量都非常大的复杂系统,可以考虑等待系统升级时开启重建后替代。例如,某大型企业的核心系统,采用从核心点逐步剥离功能模块的方式,先对小模块进行国产需求替代,积累经验后,再对剩余核心部分进行一次性替代,有效降低了风险。
(三)替代原则
在宏观层面,国产化替代应遵循“云为中心、成本最低、风险最小”的原则。
- 云为中心
以云为中心,要求企业坚持云战略,充分利用云平台的优势,将可上云的数据库迁移至云平台,实现资源的灵活调配和高效利用。对于无法上云的系统数据库,则应以成本最低、风险最小的方式进行国产化。这意味着企业要在云平台上建设国产数据库纳管能力,提高数据库管理的便捷性和安全性。
- 成本最低
成本最低原则,不仅仅关注软件采购成本,还需综合考虑硬件使用成本、适配开发成本、迁移成本、运维学习成本以及用户体验提升成本等。在实际案例中,某企业在数据库选型时,起初认为购买集中式数据库的单次费用较低,但在综合计算硬件、迁移、运维等成本后,发现采用分布式数据库的总成本更低。因此,企业在选型过程中,应制定科学的成本计算模型,全面评估各项成本,选择总成本最低的方案。
- 风险最小
风险最小原则至关重要。企业要避免选用自主率不高或不能满足业务需求的产品,防止因产品问题导致二次迁移改造,增加成本和风险。同时,要关注国产数据库与国产 CPU 的兼容性,确保系统稳定运行。例如,某些国产数据库与特定国产 CPU 搭配使用时,可能会出现性能问题,企业在选型时必须充分考虑这些因素,选择兼容性良好的产品组合。
信创数据库选型策略
除了上述宏观层面的总体性方针和原则,在具体的执行层面可以参考以下策略:
(一)关键因素解析策略
- 政策保障是信创数据库选型的重要依据。企业应选择国家重点支持、发展前景良好且有政策扶持的数据库产品。这不仅能确保产品的持续更新和技术支持,还能降低企业因厂商经营问题导致的使用风险。例如,一些数据库企业获得了国家专项资金支持,在技术研发和市场拓展方面具有更强的实力,更有可能成为“百年老店”,为企业提供长期稳定的服务。
- 代码自主率直接关系到软件供应链安全。优先选择全国产技术栈、组件代码自主研发且开源组件使用比例低的数据库,能够有效减少潜在的安全隐患。在当前网络安全形势严峻的背景下,数据库的代码安全至关重要。美国某理工大学团队曾在开源代码中植入后门,这一事件警示企业,必须高度重视代码安全,确保数据库的自主可控。
- 扩展能力是衡量数据库性能的重要指标。随着企业数字化业务的快速发展,数据量和业务负载不断增长,数据库需要具备强大的扩展能力,以满足业务需求。支持横向扩展的数据库,能够轻松应对业务增长带来的压力,确保系统的高可用性。同时,优秀的高可用架构也是保障数据库稳定运行的关键,能够实现自动故障切换,减少系统停机时间。
- 生态支持对于数据库的使用和维护至关重要。适配主流国产CPU、国产操作系统等信创环境的数据库,能够更好地与企业现有技术架构融合。完善的运维工具、丰富的技术资料以及良好的服务生态,能够为企业提供全方位的支持,降低运维难度和成本。例如,某些数据库提供了可视化的运维工具,方便管理员进行监控和管理,提高了运维效率。
(二)成本分析与优化策略
在数据库选型过程中,成本是不可忽视的重要因素。替代成本可从采购成本、适配开发迁移成本、性能优化成本和运营维护成本四个维度进行分析。
- 采购成本方面,核心系统和非核心系统应区别对待。核心系统通常对性能和稳定性要求较高,可选用国产商业数据库,但需关注 License 采购价格;非核心系统则可选择同品牌社区版,以降低采购成本。
- 适配开发迁移的成本是企业在选型时需要考虑的重要环节。如果将数据库仅仅视为存储数据的容器,将大量功能转移至应用程序,会增加开发工作的负担。例如 SQL 语句与国产 CPU 指令不兼容可能需要进行改造,这会增加开发成本。因此,企业应选择功能丰富、易于适配开发的数据库,减少不必要的开发工作。此外,应用与数据迁移成本虽然是一次性成本,但如果需要迁移的系统较多,也会成为较大的负担。企业在选型时,应充分评估迁移成本,选择迁移难度低、工具完备的数据库产品。
- 性能优化成本同样不容忽视。数据量较大、负载较高的系统迁移到国产数据库后,往往会出现性能问题。企业需要投入大量资源进行性能优化,以提升用户体验。不同数据库特性和开发质量也会导致性能差异,企业应选择性能稳定、优化潜力大的数据库。
- 运行维护成本是长期成本,企业必须高度重视。运维专家稀缺会导致运维支撑成本大幅上升,因此企业应选择易于维护、拥有完善运维生态的数据库。借助商业版服务体系降低同品牌社区版的维护成本,也是企业控制成本的有效手段。
(三)选型建议总结 & TiDB 优势
为了确保选型的科学性和合理性,以下一系列选型建议可供参考。
- 选择通过信创国测的数据库产品,这些产品经过严格检测,安全性和可靠性有保障。例如,中国信息安全评测中心发布的信创数据库清单,为企业选型提供了重要参考。经过大量用户验证打磨的数据库,其稳定性和性能经过了实际检验,更值得信赖。企业应优先选择这类数据库,降低使用风险。
- 同时,选择同时有商用版和开源版的数据库,在成本控制和使用灵活性上更具优势。企业可以根据自身资金状况和业务需求,灵活选择商用版或开源版,必要时进行切换。
- 原厂服务质量至关重要,优质的原厂服务能够及时解决企业在使用过程中遇到的问题。
- 迁移成本低的数据库,能够减少企业在迁移过程中的投入和风险。企业还应考虑自身技术积累,选择与企业现有技术体系契合度高的数据库,便于技术人员快速上手。例如,第三方服务生态好的数据库,能够为企业提供更多的技术支持和资源。
- 文档质量高的数据库,方便技术人员学习和使用。
- 生态工具丰富的数据库,能够提高开发和运维效率。
企业在选型时,应综合考虑这些因素,选择最适合自身需求的数据库产品。最后,在分布式数据库和集中式数据库选型过程中,应当考量具体的指标,进行科学评测。
以 TiDB 数据库为例,其自主开源特性保障了供应链安全,研发级前向立体式开源模式为技术发展提供了有力支撑。原生分布式架构具有 PB 级扩展性,能同时支持 OLTP 和 OLAP 业务负载,满足企业实时数据处理和复杂查询分析的需求。在异构数据库迁移方面,TiDB 拥有完善的工具和丰富的实践经验,能够帮助企业高效完成迁移工作。
AIOPS 智能化运维心得
(一)数据库智能化运维的演进路线
随着数据库规模和复杂度的不断增加,传统的运维方式已难以满足需求,这要求数据库转向智能化运维模式。实现数据库智能化运维需要经历不同的演技阶段。以数字化为基础,通过数字化采集、分析和运行,实现数据库运维数据的全面收集和整理。在数字化的基础上,进一步实现自动化监控、运维和部署,提高运维效率,减少人为错误。智能化则是数据库运维的核心目标,通过智能化分析、感知和调度,实现对数据库性能的优化和故障的智能诊断。例如,利用深度学习算法对数据库运行数据进行分析,自动识别故障模式,并提供相应的解决方案。与此同时,利用生态化的手段,可以借助外部资源,与产业单位、其他用户、运维服务提供商等构建技术、知识分享和服务协作生态,共同推动数据库运维的发展。
(二)数据库智能化运维的基础要素
在数据库智能化运维发展过程中,以下三大基础要素发挥着重要作用,并有助于提升数据管理效率和系统稳定性。
-
强大的可观测:除了数据库文档,还需要丰富的指标和系统统计信息、准确的等待事件、完善的日志和TRACE、宏观数据AWR和微观数据ASH等,全面反映数据库的运行状态,为智能化分析提供有力支持。
-
强大的推理大模型:例如 DeepSeek-r1 推理大模型在数据库运维中发挥着重要作用,能够对采集到的数据进行深度分析,挖掘数据背后的规律和趋势,为运维决策提供科学依据。
-
高质量的运维知识和丰富的运维经验:原厂提供的运维经验积累、大量的专家经验以及海量的用户案例,为运维人员提供了宝贵的参考,帮助他们更好地应对各种复杂的运维场景。
数据库国产化替代是企业顺应时代发展的必然选择,在这一过程中,企业需要积极探索,勇于实践,不断优化数据库选型和运维策略,为自身的数字化转型和可持续发展奠定坚实基础。在国产化替换浪潮中, TiDB 具备独特优势,满足企业的多场景应用需求,未来也将在数据库智能化运维道路上稳步前行。
希望本文内容有助于企业充分了解自身需求,综合考虑政策保障、技术实力、成本效益、风险控制等多方面因素,选择最适合的国产数据库产品。