澳门新蒲京赌场2778 > 资讯 > 医疗大数据和数据分析

医疗大数据和数据分析

主持人:

大家下午好!很高兴担任今天下午的主持人,我是中国联通研究院的李建功,今天下午是最后一个下午了,会有很多嘉宾进行精彩的分享。下面,我们首先有请美国德睿医疗咨询(上海)有限公司总经理刘晓刘总发表演讲。大家掌声欢迎!

刘晓:

感谢大会的邀请,我想跟大家讨论以下几个问题,什么是医疗大数据?医疗大数据的潜在价值有哪些?如何实现医疗大数据等几个方面,我自己的经历,从数据划分来讲,也是有上上下下的变化。曾经做电子芯片的设计,本身从芯片设计出身的,后来有机会到美国去学习医院管理,使用数据来帮助医院提升它的运营效率还有医疗质量的水平。后来又有机会在一些咨询公司工作,当时服务的对象很巧,也是在数据库、商业智能、数据市场营销这些部门来为这些企业,包括大的健康管理公司来提供服务。做的工作基本都是对数据进行分析,有超过三千万的客户数据,通过过往数据的分析,去预测哪些客户可能会给这个公司带来更多的效益,哪些客户在未来一年内会进行再一次的采购,什么样的营销方式或者营销的渠道能够让这个客户更容易接受,促使他来再进行一个消费。但是到了09年的时候,回到国内,在医疗行业开始工作,大家看到数据分析的情况有一个比较大的落差。这也是我想表达的一个情况,我们现在有很多机会来做数据的应用。

回到这个主题,大数据的定义,可能很多人都看过,我不知道是不是已经有人讲过了,从统一的定义上,目前还没有看到很清晰的,大家普遍接受的。基本上三个V,从规模、多样性到数据的速度三个层面,这是被大多数人接受的特性的描述。规模从兆到TB的变化,多样性,能够覆盖的数据范围,就医疗来讲,从医疗机构内部产生的诊疗相关的数据扩大到消费数据,扩大到社会环境的数据,包括个人健康监测的数据,这个是可以在新的大数据范围下去统计抓取的。速度,数据的生成,一个是数据的生成和获取都更加实时了,除了这三个V之外,还有人提了第四、第五个V,第四个V真实性,跟前面的速度有关,更快的获取,能够让我们有机会去验证所获得的数据是真实有效的,相对以往,我列了一个例子,拿电商的例子来看,以往通过问卷调查,市场分析去看消费者到底想买什么,购买意愿如何,现在我们在网上即使你把东西放到购物车里,这个网站运营商电商已经能够看到你的这个动作了,所以这些数据更加真实。最后一个V就是价值。所以医疗行业的数据不管它怎么快,怎么规模大,怎么去爆炸增长,最终它能够产生价值的这块,这个条件是我们用这个数据来使用它做决策分析。

潜在的价值有哪些呢?更多的在讲医疗行业相比于其他行业来看,数据量还不是特别大,这个图是小孩画的,一个飞机飞6小时,能够有500G的数据,各种各样的数据,这个数据可能不足够找到马航。个人平均一年平均的数据是100兆,数据量有很大的增长。但其他行业已经在用这个数据来做很多分析了,所以这个数据范围的扩大,能够让我们能感受到,包括一些厂商,数据扩大的范围都对我们未来的健康,个人的健康情况会有一些影响。

这个数据范围刚才也提到了,传统的诊疗数据,其他的还有很多,包括基因的这些数据,包括社会,包括我们在网上的购药等等消费数据,日常的生活习惯的数据,都可以去进入到我们这个数据分析的过程中,包括管理个人的健康。举一个例子,类似大众点评网,美国一个网站,吃饭,回来做餐馆的评价这样一个网站,还有很多,包括医生的评价都可以。药品公司和美国纽约市政府和哥伦比亚大学做了一个合作,把这个评价里面涉及到一些关键词,呕吐、拉肚子、生病,发现三次食品安全事故。回溯,发现有问题的餐馆确实有过卫生监督审查不通过的情况,这是一个公共卫生领域里面一个案例。另外在药品用量安全监控这一块,通过推特,像微博一样,通过关联词的挖掘,发现很大量的4400个药物不良反应,同时FDA收到传统渠道不良反应的报告只有1400个,这里面这个数据是比较碎片化的。这里面的数据也不是很完全,并不能完全依赖于它来作为主要的数据来源,目前是把它作为一个补充的来源,帮助它进行上市后的药物不良反应的监控和管理。

这是列了一些方法,这些方法比数据本身还要重要,包括上市后的药物安全监测,治疗有效性的对比研究,在座可能有医疗机构,医院的,美国在医保新的政策,从医院出院的病人如果在六个月之内,如果出现复发再入院的情况,医保报销是不报的。医院的压力,他现在要在病人一入院进行分析,对病人再入院的风险,根据他以往就诊的情况,入院以后每天的情况进行风险的一个评估,他宁可不让他出院,也要尽量避免再入院的发生。还有临床诊疗新的诊断和治疗的算法,根据对某一个方案是否符合还是异常,进行一个追踪。不同的数据在整个病人方案治疗过程中的判断,包括数据质量问题的自动化更正。这里提到一个案例,贝勒大学使用IBM的wastson通过分析挖掘通过十万篇文献法下了在可能治疗癌症的基酶。

除了各种炒作,报道之外,我们坐下来能看到大数据还是有很大潜在价值的。这里又列了一些经济价值和临床价值,挑一个来说,讲一个案例,这是波士顿的partners他们跟熙康有点像,但不完全一样,他选择了慢病或者急重超重的人群,作为一个初步的切入点。做什么事呢?首先病人在家里面能够做自我的监测,特别慢病的病人,他选了一个血压和血糖,这些仪器给他安装了无线发射的设备,这个无线信号或数据会传送到partners电子病例系统之中,这意味着什么呢?意味着我们传统上医疗或者医院对病人生成的数据往往是不容易信任的,特别是很多医生也在讨论我敢不敢相信你给的这个数,这样一个尝试,基于信任基础上,对消费者产生的数据和病人电子数据整合以后,能够带来很多便利。慢病病人90%的身体状况,根据他自己的饮食、生活情况,正常用药来控制的,没有急性的情况,可能只有10%需要医院医生来给他进行干预,多数不需要去医院,传统要定期去医院检查,通过这样一个系统,会避免这样的情况。现在这个系统还有很多没有解决的问题,也有很多计划,包括扩大监控指标的范围,检验数据的范围。问题是财务上是否可行,谁来付费,谁来支付额外的设备和服务的费用。

医疗大数据的价值实现,整个大数据刚才提到了不同的案例,实际上它综合的把计算机科学还有我们医疗行业的经验结合到一起,才能实现这个价值。从两个维度,一会儿可以看一下,一个是数据能力的提升,一个是数据能力在不同场景下,不同医疗行业的问题上,应用的场景,都要去提升。从能力上,主要的一个变化,去发现了解我们过去发生了什么,现在在很多医院都在做报表,每日门诊量,过去一年的统计数据,这只是表示发生了什么。未来发生什么,这个是要通过新的数据,新的一些方法去预测的,这是从报表监测,包括在整个医疗行为过程中,流程中,进行一些数据分析工具,可以做一些监测。看到数据基础上,要深一步去挖,可能会在数据看上去没有什么特别的数据基础上,能看到一些特别的模式,这是属于挖掘要做的事情。还有预测和模拟,是一步一步的数据能力,讲的层面不一样,解决的问题也不一样。

另外一个维度就是讲应用场景,应用场景有医院内部的,有整个医疗行业和大健康行业的,从人群健康管理分析,这个可能更多是我们在讲区域和政府在做的事情,包括对医疗机构或者医生个体的绩效,床边的健康差异分析,健康决策支持,帮助医生给他来做更好的诊疗和判断,也可以给病人,通过门户,通过电子健康档案,来推送相应的数据。疾病管理或者我们讲的一些临床实践、临床规范的落实,以及规范和实践自身的改进,这些都需要很多数据手段和工具。从成本上,从绩效还有比较性分析,可以做很多应用。

这是可以借鉴的一个成熟度模型,这个模型也没有得到普遍的认同,这是美国一家做医疗行业的数据分析的公司开发的。他基本上把刚才讲的两个维度并在一起了,一个就是数据分析的能力,你是用哪种分析手段做的,做什么事,应用场景,都放在一起,从我们最基本的数据报表,到基本的报表生成到企业数据库,有自动化的内部报表,有外部报表,一直到人群健康、临床干预,一步一步上去,也是可以探讨的一个模型。

最后这个数据分析现状,我们要分开理想和现实的差距,刚才讲更多的是一些理想的东西。实际情况,目前大医院所存储的电子化历史数据是比较有限的,数据比较分散,分析使用这些数据的能力也不足。直到近几年,我们看到医院开始关注存储电子化的历史数据,祝愿比门诊好一些,很多医院实施了电子病例系统,市场上现存系统的设计还是有一定的提升空间,病人不管是结构化电子病例还是什么,医生需要录入很多,意见很大。门诊目前实施电子病例的医院比较少,如果有的话,是在专科,跟医生很忙有关。有一些门诊就诊的数据可以在系统里面可以看到,有一些医院启动了纸质病例的微缩照相或者扫描,这是对数据保留有很大帮助。如果出现系统替换,我们会观察到旧系统里的数据往往是不会被迁移到新系统,这意味着我们的数据使用,如果有人想用的话,要打很多折扣,如果没有人要用,现在的情况就可以了。即使是电子化的数据,也有很多挑战。刚才说到数据的分散,在不同系统中,格式也不一样,缺少统一性。

结构化和非结构化的数据都是共存的,尽管电子病例的企业会致力于它的软件能够提供结构化的病例数据,帮助进行后期的分析。但实际的情况,医院有大量的非结构化的数据,怎么去处理它们?有不同的方法,这是一个现实的情况。数据的定义不一样,统一口径不一,数据统计会主线由于定义和统计口径不一,导致的结果不一的情况。病人统一识别缺失,另外政府报表要求非常复杂,也会有变化,包括医保,包括医政部门的要求,所它的要求,让医院花很多精力。数据分析本身这个工作也没有一个专门的职责,往往不同部门都在做一些事情,也会导致差异化,数据不一致的情况,整个机构的能力相对比较弱。这个是最重要的东西,医生还是比较忙的,过去几十年里面变化不是很大,越来越忙。真正他们有机会去使用电子化数据,比较复杂的数据模型,去做一个临床也好,做研究也好,这是一个经验模,这个经验是过去很忙的时间,没有给他机会来做的。临床去做数据分析,这是一个循序渐进的过程,有的机构做临床数据中心做过了,驱动力不是在真正临床上。医院运营这块也面临很多压力,不管是医保还是医院之间的竞争等等这些压力越来越大,所以他们的需求是比较切实的。围绕它的需求,开展工作,感觉效果更好一点。

除了医院之外,我们也讲区域医疗,这部分有很大的愿景,目前项目开展的非常多,特别是数据平台,基本大家都要去做这个工作。整个项目的建设还是在比较早期的一个情况,实施的策略以数据收集为主,抓取为主,没有太关注分析。我就不再念了,时间也比较有限,大家可以看一看。我不知道有没有政府部门,可以关注一下。一些领先机构面临的问题可能在全国都有普遍性,国内跟国外的解决方式会有差异,像加拿大它的身份匹配,除了个人身份证号之外,名字、家庭住址等等来匹配。但是我们知道中国医疗机构收集到这些数据都不是很准确的,通过这些不准确的数据,用它同样的算法去匹配,这个也不是很好用。所以借鉴其他国家做法的时候,还是要注意的。我们建议在区域这块,能够开展一些分析工作,有一些数据收集起来了,数据收集工作量就非常大,如果看不到一个阶段性成果,可能投资方不一定愿意一直投下去。

最后就是关于数据分析能力提升的建议,数据分析有三个阶段,一个是数据获取,一个是规划供应,还有数据分析,在每个阶段应该做不同的事情。如果大家有兴趣,我可以把幻灯发给大家。数据获取,争取把数据获取过程和业务集中在一起,不是人手工录入。这里面讲的人、流程和设备都要去进行控制,这是产生我们电子数据进入系统的一个来源。有一个美国退伍军人的医疗机构,很多医院,他们做了很多数据,电子病例有三代的产品,数据挖掘数据分析有很多经验,他的经验可以作为一个结束,可以借鉴,可以确定的数据增加,不管在机构里面还是在区域层面。对分散的数据整合非常重要,数据产生,我们希望临床工作流程和数据分析能够结合起来,有所应用。数据治理模式,这是在很多医院里面缺失的,数据质量、数据获取相关的机制和流程是很重要的。以临床、研究和管理等数据分析需求来驱动,不管是大数据也好,还是数据分析,以需求驱动,这样整个规划设计,数据库的设计,都会跟你需求有关,你准备怎么分析,分析什么数据,做什么事,这会影响你的结构设计。同时要建立分析手段,分析手段分析的能力,下面也有一些可以参考的模型。这是我的邮箱,谢谢!

主持人:

刘总与我们分享了很多大数据在医疗行业的一些实际案例,包括后面也是给我们提了一些大数据在医疗或者在电子病例这方面的一些挖掘和分析的东西,还是蛮有干货的,包括这里面提到一个点,美国把病人居家的健康监测的数据和医院电子病例数据进行整合,可能会有更多有价值的分析的东西能够挖掘出来。我们再次感谢刘总给我们分享了医疗大数据的一些案例和经验,谢谢刘总。接下来发言的嘉宾是来自东软熙康科技有限公司的副总裁蔡鸿宇,蔡总给我们带来的主题是云时代的健康医疗,有请蔡总。

发表评论

您必须 [ 登录 ] 才能发表留言!

XML 地图 | Sitemap 地图