主页 > 洞察 > 设计沙龙 > 技术调研
  • 数据中台,能在医疗信息化建设上发挥什么作用?

    adinnet / 2020-08-07 16:17 /技术调研

       自从出现了“大中台,小前台”概念之后,迅速掀起了一波建造数据中台的热潮,无论是互联网企业还是传统企业,都纷纷搭建起了自家的数据中台。

       若是问起数据中台究竟有何魅力,能让互联网巨头们如此重视,想必许多朋友还不是特别清楚。

       与大多数新概念刚诞生时一样,数据中台目前处于探索中的“定义混乱期”:有人认为它的本质就是数据共享,有人认为它只是云平台的一部分...

       上海艾艺特地写下此文,将从“是什么/为什么/怎么做“三方面,阐述清楚“数据中台”,以及它能为医院带来什么。

    数据中台全景图.jpg

    (数据中台全景图)

    本文目录:

    • ▷ 什么是数据中台?

    • ▷ 数据中台,数据仓库的区别

    • ▷ 数据中台解决了哪些问题?

    • ▷ 如何搭建最适合的数据中台?

    一、什么是数据中台?

       ThoughtWorks智能服务总监史凯是这样总结的:“数据中台是聚合和治理跨域数据,将数据抽象封装成服务,提供给前台以业务价值的逻辑概念”。

    如下图所示:       

    什么是数据中台.jpg

       Data API是数据中台的核心,也是连接前台和后台的桥梁,通过 API 的方式提供数据服务,而不是直接把数据库给开发使用。至于过程中,如何让 DataAPI 产生得更快,更清晰,数据质量更好,这些都是要围绕数据中台去构建的能力。

    数据中台的核心.png

       看完是不是感觉还有点迷糊?没关系,作者准备了白话版本的定义。

       白话理解更容易:

       肯德基,大家肯定都不陌生。

    肯德基.png

       客人(业务部门)走进肯德基,点上一份巨无霸/原味鸡/奥尔良烤翅(业务应用)。

    奥尔良烤翅.png

       后台的厨师(IT开发部门)收到订单后,就得把鸡肉(数据)做成客人想要的套餐内容(各种业务应用)。

    业务应用.png

    厨师.png

       套餐的种类繁多,门店的人流量也不小,如何保证出餐速度呢?

       其诀窍就是——背后有一套标准化制作流程(ETL/BI等数据工具),厨师们只需要按照配方,控制好油炸的温度/撒放调味料的比例(数据算法)。之后无论客人点了的是哪一种套餐,都能迅速出餐。

    数据工具.jpg

       如果某一位客人想把小孩的生日派对安排在这里,几十位客人都有各自想品尝的美味(需求量变大)。那就需要致电给店长,告知大概的人数。店内就会提前备好更多肉类/饮料/调味包,还得存进冰箱(数据仓库),这就解决了随用随跳(实时取数)的效率瓶颈。

    数据仓库.png

       整个过程就相当于构建了一个数据中台,在做数据中台之前,要先考虑这三个问题:

       有没有需求?需求频率高不高?需求量大不大?

       数据中台作为所有业务的数据需求的提供方,随着业务对数据服务的不断滋养,将会形成稳健的数据服务,当我们需要构建新的前台应用时,它可以无差别的供给数据服务,点亮创新的火种。

    二、数据中台,数据仓库

       一提到“数据”,很多人就会联想到数据仓库。乍一看数据中台的概念,你可能会觉得,它跟数据仓库没啥区别。

       其实不然,为了方便大家理解两者的差异,作者做了一张图,来阐述两者的区别: 

      数据中台,数据仓库.jpg

       如图所示,差异主要体现以下四方面:   

    ● 计算存储

       数据仓库基于OLAP类型的数据库,后续发展为MPP等混合架构。而数据中台从诞生起,就使用Hadoop、Flink等混合架构,随需搭配,满足了各类数据计算的要求。

    ● 应用场景与价值体系

       与传统数据仓库相比,数据中台的应用场景要广泛得多。传统数仓中存储的数据大多是结构化数据,这些数据只是根据需求针对性抽取的(并不全面),因此对业务支持有限;而数据中台起家于互联网企业,业务需求更繁杂,包含诸多不确定性的应用场景,传统报表很难满足需求,而中台能够提供随需应变的数据服务。

    数据仓库常用系统架构.jpg

    (数据仓库常用系统架构)

    ● 体系架构

       除了大数据存储和计算平台外,数据中台还包含数据开发IDE、敏捷BI报表开发等多个组件,由众多组件汇集成一整套方案,这一点是传统数据仓库望尘莫及的。

       但两者也有一些相似之处,比如建模方法,数据中台同样采用数仓维度建模法,按照事实表、维表来构建数据模型。

       数据平台的出现,解决了数据仓库不能处理非结构化数据和报表开发周期长的弊端。

    三、数据中台解决了哪些问题?

       在数据开发中,核心数据模型的变化是相对缓慢的,但业务创新的速度是非常快的。数据中台的出现,就是为了弥补数据开发和应用开发之间,速度不匹配/响应力跟不上等缺陷。

       数据中台解决的问题可以总结为以下三点:

    1、效率问题

    ● 数据研发效率

       项目初期业务模式不固定,烟囱式开发模式占据主导。随着业务复杂度的不断攀升,重复性开发制约了数据需求交付效率。需求响应速度被业务部门诟病,也就成为了家常便饭。

    ● 数据发现效率

       面对动辄上万张表,每张表有上百个字段,准确理解每张表的含义非常困难。

       开发数据和使用数据的往往是不同的部门,需要大量的沟通成本,对于数据开发,每天都在回答重复的问题;对于分析师,找所需的数据很麻烦。

    ● 数据分析效率

       传统分析中,指标有异常波动,需要从哪些维度去剖析,完全靠分析师的经验。数据中台搭建完成后,能够将经验沉淀到产品中,通过系统自动进行全维度的钻取分析,降低数据分析的门槛。

    2、质量问题

    ● 数仓设计

       主要看这三方面—完善度、复用性和规范性。

       完善度就是“要啥有啥”。如果其他汇总层要使用相同的数据,都需要从ODS层去引用(跨层引用),就存在重复清洗的问题。

       复用性强调的是一个表被多表征用的情况,复用性越高,说明数仓设计越合理;

       规范性指的是数仓中的表、字段的命名规范统一,相同指标、维度、度量的标识是一致的。

    ● 指标一致性

       如果遇到不同数据产品中相同的指标,结果不一致,可能是口径不一致/数据来源不一致导致的。

       指标是数据加工的结果,指标管理的核心在于确保指标的业务口径、计算逻辑和数据来源的一致,消除指标的二义性。

    3、成本问题

       包括计算资源成本/存储资源成本

       数据就像电脑里面的文件,如果不定时清理,存储空间永远不够。如果出现数据成本比业务增长还要快,多半是烟囱式开发导致重复加工,浪费了计算和存储资源。

       以上三类问题都会导致开发进度缓慢。而数据中台的妙用就是——使前台开发团队的开发速度不受后台数据开发的影响。

       让我们把视线转回到HIT行业,目前的医疗信息化开展面临以下两大挑战:

    挑战一,如何利用数据赋能业务

       要利用数据,首先得实现数据的互联互通,集成标准化和结构化。采集到优质数据,才能迅速发现问题,并且根据问题,使用辅助决策系统改善医疗质量,提升临床效能。

    挑战二,如何应对专科个性化需求

       专科系统都有特定的专科知识/诊疗规范/服务环节/数据分析指标。

       系统都由不同厂家提供,硬件要求不同,都需要做接口,这给信息科造成了很大的困扰。更要命的是,系统之间是交叉的,一旦某种疾病的知识体系改变了,将会影响相关系统的使用(比如静脉血栓栓塞症的知识改变了,会影响抗凝药物的使用推荐)。

       面对医院海量数据难以利用的窘境,数据中台能够对症下药,完成数据集成/形成模型//数据决策/生成临床应用/业务重塑(场景化人机协同)。

    四、如何搭建最适合的数据中台

       建造数据中台的过程说起来很简单,大概是这样:明确需求/原型设计/需求评估/严格测试/成功上线/时刻跟进问题...

       建立初期,一定要搞明白业务对于数据的诉求,把数据和业务当成一体去看,而不是将数据仅仅当作支持工具。

       回到自身的业务流程,一步步拆解出各个指标数据,切勿在业务场景还没有明确、价值度量体系尚未建立起来的时候,就着急开工。这样的数据平台完工后,一堆功能看上去很厉害,但由于缺乏应用场景,做不到开箱即用。

       例如出行业务,业务流程大概是:用户提交订单——司机接单——乘客上车,订单开始——到达目的地,用户下车——用户支付(自行决定是否评价)——订单结束。

                         业务流程.jpg

    (业务流程)

       根据以上流程,我们可以挖掘出数据指标,例如:某区域1小时内订单发起数、订单取消率、订单平均响应时间、订单好评/差评率等等。

    那医院如何搭建数据中台呢?

       重构流程关键在于深入临床路径,这样才能发现更深层次的信息。首先要匹配业务需求,然后根据需求优化流程。梳理过程包括:收集指南/按照疾病主流程进行拆解/形成决策树。

    第一,实现数据标准化和结构化;

       通过自然语言处理(NLP)和本体映射的方式,实现数据标准化、结构化。

    自然语言处理(NLP)是指机器理解并解释人类写作、说话方式的能力。

       NLP的目标是让计算机/机器,在语言理解方面像人类一样智能。最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。

    第二,构建统一的数据质量和监控体系;

       最终的目的就是完成数据的一致性,标准化,合理性。体系完工后,对及时发现医疗质量问题和风险有非常大的帮助。

    第三,建立统一疾病数据模型,人工智能辅助临床诊疗决策;

       建立疾病模型的步骤大概是,罗列出疾病核心变量,临床研究表单收集内容,补充疾病变量,从而形成疾病数据模型。

       国外已有可供参考的案例,美国杜克医疗基于人工智能技术,建立起了脓毒症预警模型,对及时发现病症起了很大的帮助。比如败血症,败血症本身并无特殊临床表现,临床表现也可见于其他急性感染。而人工智能建模预警,能够及时检测出败血症。所以,非常期待这项技术能够在国内加快落地应用。

    总结

       中台的出现,从某种角度上来说,主要源自于数字化转型升级的需要。如火如荼的中台建设浪潮背后,是传统企业面临转型的东风。

       值得期待的是,中台的能力,已经蔓延出了互联网领域的边界,回望医疗信息化产业,在当今的大环境下,医院对数据中台的需求是呼之欲出的。

       无论数据中台是个方生方死的风口,还是孕育下一代BAT的黄金摇篮,每个相关方都需要尽快认知,并决定出是进是退。

       毋庸置疑的是,数据中台已走到了价值验证的关键路口。

       如果您有数据中台建设的打算,欢迎咨询「艾艺」,我们会根据你提供需求及商业模式,提供相应的数据中台建设解决方案。在开发完成后,会有专门的测试人员解决使用过程中出现的所有问题BUG。咨询热线:17702199087(同微信)。

    文章来源:HIT思想荟   作者:老罗

上一篇:App外包开发:上海APP外包公司哪家好? 下一篇:智能音箱APP如何开发?有哪些功能模块?