本文作者:徐驰|恺恩泰(南京)科技有限公司
引言
在中国医疗行业的信息化进程中,恺恩泰公司深耕医疗数据领域,见证了从单一电子医嘱系统到智能化数据交易的跨越式发展。在 TiDB 社区南京站的交流活动中,来自恺恩泰的徐驰老师为大家分享了当前医疗数据库转型的核心挑战与机遇,以及恺恩泰如何基于 TiDB 助力 40 +医院的数据平台实现转型升级。本文将基于徐驰老师的分享内容,为正在面临数据库迁移抉择难题的医疗团队提供选型思路和实践参考。
一、医疗信息化演进:从系统割裂到数据价值释放
医疗信息化建设发展脉络
早期阶段:手工到电子化系统演变
- 核心特征:以收费挂号和电子处方为核心,实现手工业务电子化。早期医院通过单机版管理软件(如挂号系统、收费系统、医嘱系统)提升基础业务效率。
- 技术局限:依赖 DOS+FoxBase 等单机数据库,数据存储分散,难以支撑跨部门协同。
系统集成阶段:打破信息孤岛
- 核心需求:随着 HIS、LIS、EMR、PACS 等系统普及,医院面临异构数据交互难题。集成平台(ESB)成为关键,通过标准化接口实现系统间数据互通。
- 技术突破:Windows + 大型关系型数据库(如 SQL Server、Oracle 等)逐步替代单机系统,支持全院级业务流程整合。
数据治理阶段:从 “可用” 到 “好用”
- 行业痛点:多源数据标准不统一,临床科研数据可用率不足 30%。医院开始构建临床数据仓库(CDR),通过数据清洗、去重、结构化等工序提升数据质量。
- 技术升级:分布式技术(如 Hadoop)和大数据平台兴起,支持 PB 级数据存储与复杂分析。
数智化阶段:释放数据要素价值
- 政策驱动:《“数据要素 ×” 三年行动计划》明确医疗健康为重点领域,推动数据合规流通与 AI 应用。上海一院等机构率先开展医疗数据交易,标志行业进入深水区。
- 技术融合:云计算、AI 大模型与医疗场景深度结合,催生智能辅助诊断、患者全景视图等创新应用。
医院在数据处理和管理方面的四大困境
医院在数据运用和管理方面存在一些不足影响着业务发展:
- 临床数据质量不高
医院虽然积累了海量数据,但由于数据来源多样,涉及多个系统,且标准和数据指标不尽相同,大量数据处理工作靠人工导出,在未进行有效转化之前,真正能够投入使用的数据占比较少,数据质量普遍有待提高。
- 运营指标不统一
在运营管理过程中,缺少统一指标系统,各类运营、质量指标考核难细化;另一方面在移动端盛行的时代,数据分析和展现也未能与移动办公结合,科室主任和院领导难掌握实时运营信息。
- 管理决策支持弱
无论是临床决策还是管理决策,都高度依赖大量的数据支撑,因此,构建一个稳定可靠的数据库及数据平台,对于保障数据决策和管理工作的顺利开展至关重要。然而,医院的信息化技术人员和信息科,可能往往将主要精力集中在基础运维、网络维护以及系统日常维护等工作上,在数据本身的管理与挖掘方面投入的精力相对有限。
- 数据管理成本高
大部分医院没有集中的交互系统引擎,生产系统集成多为网状,业务耦合太复杂,集成成本过高,一旦业务流程改变,厂商难以升级。同时,没有统一数据资产和分层管理,无法支撑所有场景的主题库。
二、从集中式到分布式:TiDB 重构医疗数据平台架构
湖仓一体的数据中台技术架构设计
在实际应用场景中, 恺恩泰面向医院提供完整的、基于数据平台的智慧医院建设方案。
经过前期大量的论证分析、测试验证以及广泛的行业咨询,恺恩泰选择与 TiDB 开展合作。作出这一决策,一方面是基于 TiDB 数据库所具备的显著性能优势,另一方面则是考虑到其运营特性能够契合医院未来发展的多样化需求。对于医院而言,构建数据中台具有重要意义。在实时交互以及非实时数据应用等各类场景下,医院均需要实现数据的零延迟供应,这无疑会产生大量的并发请求。在各项对比之下,目前 TiDB 对医疗业务场景适配度高,能够有效应对此类高并发场景,成功解决以往在面向人工操作模式下所出现的性能瓶颈问题。
鉴于不同的数据治理需求,团队需从原始业务层数据中抽取相关数据,并进行后续的评估分析。然而,由于中国医疗信息化在二三十年的发展演变中,不同医院以及同一系统的不同厂家所采用的数据库种类繁多。例如,常见的 Oracle 数据库,以及在医疗领域应用相对较少的 Sybase 数据库等。恺恩泰可将这些多元混合的数据通过 ETL 工具进行有效整合,并借助独立的 CDC 技术进行实时数据采集。但无论采用何种具体方式,最终都是以 TiDB 为基础构建实时数据湖,将数据转化为能够满足不同数据应用需求的产品形态,进而有力地推动相关应用的深入发展。
TiDB 支持历史数据/ 实时数据采集
在数据处理工作中,恺恩泰运用 TiDB 数据库执行相应的批量历史数据处理任务。当前,医院所使用的电子病历等系统正处于实时运行状态,但在此之前,必然存在不同厂家所提供的历史数据。无论先前采用的是何种系统,通过这种形式均能够对历史数据库进行全面收集,其中亦涵盖当前用户数据。通常情况下采用从备份数据中进行抽取的方式,在确保医院正常工作不受影响的前提下,将数据抽取至数据仓库之中,以满足后续多样化的应用需求。
打破集中式数据的性能瓶颈:从 Oracle、SQL Server 到 TiDB
在 TiDB 数据库与传统数据库展开了对比分析后发现:当 Oracle 数据库面向单个系统处理医院业务时,凭借其特定的存储方式对信息予以存储,在应用端无需应对过多复杂问题,在这一特定情境下具有一定可行性。然而在构建数据平台与数据中台的过程中,面临的是各种复杂且多样的运营标准。因此,必然需要选用一款在并发处理能力、负载承受能力、运维便捷性等各个维度,均能充分契合医疗数据运营需求的数据库。经对比评估,TiDB 数据库相对而言更具优势,更适宜应用于医疗数据运营场景。
三、结语
在医疗行业数字化转型的关键时期,TiDB 希望能够凭借自身独特优势,助力医疗数据管理变革。TiDB 的分布式架构、强大的扩展性与高可用性,使其在处理医院复杂业务和海量数据时游刃有余。恺恩泰借助 TiDB 为多家不同类型医院搭建数据治理平台的实践,充分验证了其在医疗场景中的卓越性能。这些成功案例涵盖临床科研、运营管理等多个方面,有力证明了 TiDB 能切实提升医疗数据管理效率,进而提高医疗服务质量。
随着国家数据要素战略的深化,医疗行业正在转向“数据驱动价值化”。能否建立高可用数据库、挖掘数据创新应用场景,将成为医疗机构与企业在数字化转型中的分水岭。在此背景下,选择国产数据库 TiDB 是对当下业务需求的高效满足,亦是对未来发展的长远投资,希望未来能助力更多医疗企业能够在数字化道路上稳步前行!