数据作为一种新型生产要素,其重要性早已不言而喻。
在医疗行业,数据流通是一件很困难的事情。在经过产、研、学多年的尝试,仍有很多难以解决的问题:医疗数据归谁?如何脱敏?如何保证安全?这都是医疗数据难以广泛应用的根本原因。
如果没有安全作为保障,数据的价值便只能停留在纸面上。医疗数据尤其需要慎重,事关人命和健康,更不可儿戏。
如何有效解决这个问题,一把名为“隐私安全计算”的金钥匙,或许会成为解决医疗数据隐私安全保护和开放共享矛盾的关键。
(注:本文主要内容源自上海市儿童医院于广军院长,其原文演讲已然非常通透,感兴趣的可以拜阅,也可以理解良医财经做了某种意义上的翻译。)
良医财经「产业观察」的第42篇。
演讲/于广军院长
文章架构师/ 花哥
出品/ 良医财经
01
为什么会成为一个个信息孤岛?
因为有风险,宁堵不敢疏
医疗数据流通,听上去晦涩,但理解起来并不难。
举个例子,罕见病涉及人体多个系统器官,临床症状复杂,很多临床医生难以及时诊断,小李在A地医院就诊,其症状和检查结果显示可能是罕见病,但是当地医生缺乏足够的临床经验,为了能更准确地诊断,传统做法只能建议他去大城市高水平医院。
那么能不能把高水平医院的罕见病的诊断治疗能力对外输出。答案当然是“能”,方法就是数据赋能,用高水平医院的诊疗数据通过一系列的“计算”,把数据的价值输出。因此需要有相关平台和技术,通过对罕见病的医疗数据进行处理,既能保证数据的安全,又能实现数据的价值利用。然而现实的答案是很难,在这背后的关键原因,在于医疗数据全面共享难。
当前不同的医院,都建立了自己的数据库。在同一家医院看病,医生可以根据患者过往数据的基础,辅导治疗、开药。但是这些数据只是作为一份档案保存着,没有发挥其内在的价值。因此需要找到一种很好的技术让这些数据既可以使用又不会泄露,符合法规制度的要求。
可以看见,医疗数据的使用已是刚需,并广泛分布其他场景中。比如在跨域远程医疗中,会诊方需要获得患者数据如影像、检查报告和病历;在商保审核结算中,保险公司需要获得患者数据如就医凭证、费用和病案首页;在药品的使用分析时,药企需要获得药品的疗效、不良反应;在多中心临床研究中,参与各方必须把病历数据进行汇总后再进行处理和分析......
“数据安全是第一位的,哪怕医院整体的信息化落后一点。”一位北京某三甲医院管理人员曾多次强调。
而这也恰好点出了医疗数据的尴尬所在:医院数据尤其私密,一旦外泄,医院及相关方会遭遇问责。
因此,在相当长的时间里,很多医院对于数字化和互联网化是保守的,将数据牢牢攥在手中,不用就不会出错,用这种方式来避免风险。
虽然各家都知道数据的价值,但从现实角度看,仍存在一些障碍,包括政策的、人性的、安全的、伦理的等。医疗数据流通是有风险的,很多医院都宁堵不敢疏,这也就造成两个孤岛的出现:
内部:信息孤岛
近几年,政府政策主导下,当前超过70%以上的医院实现了医疗信息化,基础设施建设层面已经初见成果。不过,仅有不到3%的医院实现了数据互联互通,并且地域性明显,这也限制了医疗数据信息的流通。
外部:价值孤岛
医疗数据的流通开放,可以极大提升效率和节省成本。通过更加开放的数据,基层医疗可以辅助三甲医院,对一些病例进行有效诊断;三甲医院可更快速完成病人问诊过程,节省时间;患者也可减少重复医疗的费用。但当前的医疗数据,只是一个个不开放的价值孤岛。
虽然医疗数据的流通和开放,存在大量的难题,不过好在并不是没有解决的办法。
当前一些AI企业的入局,正在通过技术的方式,解决这一敏感问题,试图打破医疗信息和价值的孤岛现象。
02
隐私安全计算技术
实现医疗数据全生命周期管理
释放数据价值
隐私安全计算技术就是解决矛盾的一个有益方案和路径,它可以实现原始数据不出平台,数据经授权后使用,通过计算释放数据的价值。
在医疗领域,因为刚需性太强,该技术的快速验证、迭代、成熟,已经远远超过了从业者的想象。
但我们要如何理解这一新技术,近日,由翼方健数在上海举办的首届Data X大会上,从上海市儿童医院于广军院长的演讲中,可窥见一斑。具体到这项技术的实际应用上,大致可以分为四个模块:数据流通、数据共享、数据安全、数据治理。
(注:略微有点理论,看不懂可以跳过,总之要知道有人思考很深很深了,各方的诉求各个环节的安全细节,都有设计了。)
1、从数据流通维度:
医疗信息隐私安全的标准
早在2017年,上海市儿童医院于广军院长就曾提出一个关键问题:“医疗数据到底归谁所有”?
细化来看,包括真实世界健康医疗大数据的产权归属,数据的采集、传输、存储、加工、使用等过程中的个人医疗健康信息的隐私保护;健康医疗大数据的分级分类体系、数据开放的范围、数据开放的条件与流程、数据保护的责任主体等内容,建立符合真实世界健康医疗大数据开放共享需求的,基于法律法规、管理机制和技术手段结合的数据安全与隐私保护体系。
数据分级
上海市儿童医院于广军院长介绍,在数据分级方面,又分为医生调阅/科研使用/患者查询三个一级指标,角色定义、权限分配、登录招呼账户、数据调阅/数据准备、数据申请、数据审批、数据脱敏、数据传递、数据使用、数据销毁/身份识别、查询信息、操作权限等14个二级指标以及26个三级指标。
上海市儿童医院于广军院长指出,识别三大典型情境下(医生调阅、患者查询、科研使用)潜在的医疗信息隐私安全风险点后,进而提出每个情境下的隐私保护目标及相应的控制措施,形成《医疗信息隐私风险防控指南》(目前已被国标《信息安全技术健康医疗数据安全指南》采用纳入)。
申请流程审核
不同隐私级别的数据申请流程不同,隐私级别越高,对申请者要求越严格,需提交的材料越多,审核者也越多。比如隐私级最高的RIF数据,只有在研究领域有相当经验的研究者才可以申请,且研究需经伦理委员会批准,再由医院数据中心、医疗数据委员会层层审核。
2、从数据共享维度:
在明确了健康医疗大数据内容、范围以及业务逻辑的基础上,运用层次分析法和因子分析法,通过对科研数据支持、政府统计监管、个人健康数据调阅以及第三方产业增值等不同用户的需求进行共性与差异性分析,形成健康医疗领域的基于需求与信息安全相结合的分类别、分层次的多元数据共享模式。
脱敏开放
可开放的数据资源池模式:面向已经脱敏处理后可完全对外开放的区域医疗数据资源,由数据所有方基于公益属性持续性的对外单向传播
分级管控
可管控的数据分级共享模式:面向一部分具有不同价值等级、涉密等级、保护等级的大数据资源由数据所有方借助信息化管控手段有条件的共享。
价值共享
可信的数据价值共享模式:面向专业化大数据资源,由数据所有方搭建一个和业务数据生产环境相隔离的共享环境,对资源进行加工,形成共享可用的价值知识。
3、从数据安全维度:
利益相关者分析
界定并深入分析各场景相关者的立场和相互关系,如微观数据、中观数据和宏观数据三个角度,确定数据共享机制内容。
共识机制形成
基于利益相关者分析形成真实世界数据共享策略后,进行可操作性、利益均衡性和可监管溯源,使得隐私计算技术研究为共识策略提供安全可信的执行环境。
隐私计算安全共享
在信息整合、分布式账本、智能合约、隐私安全计算后,最终落实真实世界多源健康医疗大数据安全共享应用实践。这就是基于共识机制的数据安全共享策略。
4、从数据治理维度:
通过研究盟主治理、共信第三方治理以及分布式治理三种联盟数据治理模式,根据不同耦合度的联盟类型,研究其临床数据的安全可信采集与科研分析方案。
有理论依据之外,已经有相关企业能够将理论落地。国内隐私安全计算领军企业,翼方健数CEO罗震曾指出,隐私安全计算未来的发展应该从解锁数据价值的角度来重新审视。
据公开信息显示,翼方健数致力于打造“数据和计算互联网”,以隐私安全计算、区块链等技术为核心,从安全、可信、高效等技术要求出发,正帮助行业中各数据参与方实现数据可用不可见,保障信息安全,挖掘数据价值。
从技术方案看,不同于传统方式中,原始数据离开数据平台,无法保证其隐私和安全。但翼方健数基于隐私安全计算技术的思路是,原始数据不离开数据平台,只输出数据的价值。目前,这一新技术在医疗、政务、营销等领域已有不少的落地案例。
如今翼方健数已经实现城市级别的隐私安全计算,实现了区域行业数据化、智能化的产业互联网,既立足于大数据治理,又服务于终端用户的大数据应用要求,并已经在多行业、多产业落地。
有人在做这个苦事难事,这就是一个好的开始。
03
事实上已经有非常多的案例
证明通过技术可以解锁数据的价值
没有落地的技术,只是镜花水月。
许多隐私安全计算技术服务商在拓展客户时听到最多的一句话就是:“我们想先看看有谁已经用了隐私安全计算再做决定。”
AI算法的学习,需要不断的锻炼,数据也是如此。只有落地到场景中,才能让技术跑得更快,运算得更加精准,从而通过技术释放数据的价值。
从技术到落地,道阻且长,好在隐私安全计算也在不断进化中,如今已经积累起了不少典型案例,下面以翼方健数公司和上海市儿童医院的项目为例,逐一拆解。
案例一:可信计算和价值分配
比如2017年,厦门启动了分级诊疗,当时,翼方健数将智能分诊临床辅助诊断决策系统引入基层医生工作站,让罕见病在社区基层就能被诊断,让危重症在诊断后实现优先转诊。
这种辅助,基于三甲医院医生大量病历、治疗方案的数据分析,总结出一般性经验模型,即便经验不足的年轻医生,也能借助辅助系统给出合适的诊治方案,基于数据进行AI能力输出,弥补基层医生经验和能力的不足的问题。
这就是典型的通过技术,解锁数据的价值。基层医生真正缺的其实是经验。经验的获取,除了依靠时间和病例积累,或许还有更快的路径,借助数据和技术,可以缩短这一过程。
而在这一过程中,数据是通过隐私安全计算技术得以进行计算结果的合理共享。除了可信外,在实际应用场景中,还有一些新的问题,比如如何解决数据管理,数据价值分配和数据确权的问题?
翼方健数通过结合隐私安全计算与区块链技术,开发Xledger为XDP联盟和IoDC提供不可篡改的数据存证与智能合约,对数据实现全生命周期管理,智能合约保障价值分配,保证数据所有者的权益。
此外,通过自主研发数据标注工具GoldFinger,不仅支持高效率的用户标注,还可以更好服务AI应用需求。GoldFinger可以保证数据在使用时严格隔离,预标注能力还可扩展为众包模式,兼顾效率与安全。
案例二:三医联动和病历共享
又比如,2019年5月上海科委的课题,就是基于区块链的医疗医保医药“三医联动”关键技术攻关及的应用示范。
从结果看,该课题基于区块链实现互联网医院在线诊疗中的电子病历数据的访问、授权和服务,实现了电子处方外配和处方流转服务、商保结算服务、电子病历共享、处方流转、商保核保服务的三医联动监管支撑服务。
简单理解,就是通过区块链技术,让医院内部的隐私数据,通过授权的方式在内部共享。医院可以有限度的自主开放部分数据授权,让第三方进行相应的数据计算,获取自己需要的结果,这里是指统计学意义上的结果,不涉及任何个人信息。而数据由一个“安全中枢”核验管理,保证数据需求方和数据拥有方的互信机制,最后提供对应的监管,确保数据的使用流程及输出结果合规。
上海市儿童医院于广军院长指出,在区块链技术的带动下,医联体电子病历信息可以安全共享,还可以实现院内和院间医疗信息共享,凭借隐私安全计算,数据需求方可以查询相关的情况,而不是获得原始数据本身。
结合翼方健数的应用场景去理解这一技术,翼方健数构建了一个传染病多点触发监测和智能预警解决方案,这一项目不仅使用到了医疗相关的数据,同时也有企业数据、舆情数据、地图数据、时空数据等,在整个环境里进行了一个数据的治理和模型的建立。
通过这一项目实现对已知传染病的智能防控以及未知传染病早期发现早期预警能力,通过多源数据的联合计算实现疫情预测、管控、防疫、研究等等。
因为技术,解锁安全;
因为安全,解锁数据;
因为数据,解锁流通;
因为流通,解锁价值。
04
良医财经的思考
未来,可信数据医联体的构建
几年前,大数据行业在资本的带动下风生水起,但很快业内发现,快速的发展,使得数据安全问题被忽视。一些相关企业的数据从哪来?到哪去?很难说清。
当前,想要把数据的价值发挥出来,让数据能够加速流通,仍然面临着很大的挑战。数据的安全问题,是行业能繁荣发展的基本生存问题。
如果通过隐私安全计算、区块链等相关技术将这一问题解决,那么我们可以畅享未来:在个人端、医保端、医院端、医药端、疾控端、科研端、体检端、基因检测端都能实现互通......将能够打造一个可信的、可控的、可通的医疗数据医联体。
图片来源:2021DataX 大会翼方健数CEO罗震演讲
这样一来,对患者而言,省时、省钱、省心;对三甲医院的医生而言,治疗数据更清晰、更精准;对于社区医院而言,既真正起到了分级诊疗的功效,也提高了基层医生的就诊能力。
如果将范围放得更大,患者的数据同步到药房,可直接帮助下单购药,直接送货上门,社保也可直接出发结算......
医疗真正实现自动化、数据化之前,第一件事,就是不断重提数据隐私的重要性,然后就是将这项隐私安全技术,逐步发挥到极致。
令人热血的是,医疗行业流通的不是一串串冰冷的数据,而是一个个有温度的、能研究的、可续命的解决方案。
破冰,才刚刚开始。