资源描述
1 / 41 2018-09-26进入价值输出时代2018医疗大数据产业报告Digital medical innovation industry trend report近年来,健康医疗大数据相关产业已经被列入国家大数据战略布局,和医疗健康大数据相关的政策频出。在众多健康医疗大数据相关政策中,其中比较著名的是2014 年国家卫计委制定“46312”工程,即建设国家级、省级、地级市、县级 4 级卫生信息平台,构建电子监控档案数据库、电子病历数据库、全员人口个案数据库 3 个数据库,建立一个安全的卫生网络,加强卫生标准体系和安全体系建设。2018 年 9 月 13 日,国家卫生健康委印发了国家健康医疗大数据标准、安全和服务管理办法(试行),对医疗健康大数据行业从规范管理和开发利用的角度出发进行规范。办法从医疗大数据标准、医疗大数据安全、医疗大数据服务、医疗大数据监督四个方面提出指导意见,直击目前医疗大数据领域的痛点,未来对数据的统筹标准管理、落实安全责任、规范数据服务和管理具有重要意义。本报告蛋壳研究院从医疗大数据行业的市场出发,收集了国内参与医疗健康大数据的 561 家企业的资料,从细分领域、大数据价值、大数据作用等维度进行梳理,分析医疗大数据的发展阶段和行业现状。前言FOREWORD目录第一章 汹涌而来的大数据洪流 . 4第二章 医疗大数据沙漏模型 . 7一、什么是医疗大数据 .7二、医疗大数据沙漏模型 .8三、医疗大数据的四大特征 .9四、顶层设计支持医疗大数据发展 .10第三章 医疗大数据的采集 .12一、医疗大数据的分类 .12二、医疗大数据来源详解 .141.电子病历数据 . 142.检验数据 . 143.影像数据 . 154.费用数据 . 155.基因测序数据 . 166.医药研发数据 . 167.药品流通数据 . 178.智能穿戴数据 . 179.移动问诊数据 . 1710.体检数据 . 17第四章 治理数据形成知识 .18一、医疗大数据应用的主要挑战 .18二、大数据的治理 .19图片来源:阿里云 .22第五章 行动医疗大数据的价值输出 .22一、临床诊断辅助系统 .23二、医生辅助工具 .25三、慢病管理 .27四、保险 .27五、医药研发 .28六、医院管理决策辅助 .28七、健康管理 .29八、智慧养老 .29九、药企市场营销 .30十、基因大数据 .30第六章 医疗大数据企业市场分析 .31一、医疗大数据企业市场布局 .32二、医疗大数据行业发展难点 .36三、医疗大数据产业目前处于发展的第二阶段 .37第一章 汹涌而来的大数据洪流人类的任何表现和行为都可以产生数据,只是之前这些体征和行为并没有被合适的设备数字化,并收集和存储起来。 21 世纪初,随着信息化技术的普及,人们已经关注到数据所能带来的价值。此时所产生的数据,局限于计算机平台和互联网。此时所能收集的,也只是人类在互 联网环境中所产生的部分数据。大数据,顾名思义就是数量非常庞大的数据。对这些数据进行合理的应用,同时挖掘出价值,也就形成了大数据产业。随着传感器技术的进步、数据处理能力的增强、计算和存储成本的降低、网络的扩大,使得数 据的收集、存储和分析能力不断提升。特别是进入万物智能互联的新时代之后,产生数据的终 端越来越多,也越来越智能。现在,数字化技术已经无处不在。同时,产生数据的主体也不再 仅仅是人,还有物体。各个细分行业、经济体、传感器、个人无时无刻不在产生数据,而且消费者也正在从这些数据中受益。因此,在 2010 年前后,互联网开始出现了汹涌而来的大数据洪流。从上世纪 80年代开始,每隔 40个月,世界上存储的数据容量就会翻倍( Hibert & Lopez, 2011)。IDC 在 2014 年的一份报告中提供了一份数据, 2013 年全球数据总量达到了 4.4ZB,而从 2013年发展到 2020 年,全球数据总量将会增长 10 倍,达到 44ZB。越来越多的数据产生设备通过互联网传至数据存储商。数据量的爆发增长,首先为数据存储商带来了商业机会,营收也大幅 度增加。其次,大数据在经过价值挖掘之后,还能为经济发展提供显著的动力。 1ZB=1024EB=10242PB=10243TB=10244GB数据来源: IDC这些数据来自哪里?每天有超过 9 亿的微信、 4 亿的微博、 20 亿的推特等社交软件的活跃用户在产生数据,每天还有 348 亿 RFID 设备、 60 亿台智能手机、数亿台支持 GPS 的设备在产生数据。数据的产生源和单一数据的量级都在无限扩大。移动电话、智能手表、摄像头、音频设 备、定位设备被大量使用后,它可以方便地对人体和环境进行感知,将数据收集起来在互联网 上传送。通过工具捕获、存储、加工、管理和分析大数据之后,形成了新的大数据产业。从大 数据中萃取洞见来辅助决策,已经在各行各业发挥着重要的经济价值。数据可以为各行各业的 行为提供指导,提高效率,创造经济价值。从产业层面来看,全球大数据领域的相关公司都在快速发展,中国信息通信研究院预估我国大 数据领域 2017 年的产业规模为 4700 亿元,增长率约 30%。其中,大数据软硬件的产值约为234 亿元人民币,增长率约为 39%。如此巨量的数据,里面存在着宝藏,也充斥着大量的垃圾。 IDC 的报告显示,有意义的数据只占全球数据量的 1.5%。大数据的价值还需要深入的挖掘,才能将其发挥出来。大数据就像是石油,没有经过开采的原油埋藏在地里,就不会产生价值。但是,数据原油在经过加工和提炼之 后,所产生的知识沉淀,将会对全球经济的发展提供巨大的助力。而如今,医疗大数据领域也 已经开始进入到价值输出时代,在诊疗、医院管理的过程中发挥着重要的价值。早期, IBM 定义了大数据的特性有 3 个:大量性( Volume)、多样性( Variety)、快速性( Velocity)。后来,对大数据的特点描述经过专家的进一步完善,总结为六个特征。动脉网蛋壳研究院制图高容量:数据的总容量大,单一数据集的数据总量在几十 GB,甚至几十 TB 之间。未来,随着采样率的提升,单一数据集的总量还会持续上升。多样性:数据种类丰富,文本、日志、图片、视频等等,数字化和模拟化,结构化和非结构化 数据都有。快速性:数据的创建速度快,更新频率快。很多数据的采样时间已经从周、月升级到分、秒,甚至是连续性数据。同时,数据的转移速度快,也需要快速实时处理。易变性:大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。相较传统的业务 数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。 准确性:大数据可利用的基础是数据的准确性,大数据分析的前提是准确性要得到保证。数据 质量不高,会造成数据分析质量低下。复杂性:数据量巨大,来源渠道多,数据的管理和操作复杂程度高。想要提炼出数据的有效价 值变得挑战性巨大。大数据从哪里来?到哪里去?本报告将从医疗大数据这个细分领域,去探讨医疗大数据的流向 和价值输出,了解医疗大数据从产生、挖掘、治理、价值利用的全过程,让我们对医疗大数据 行业产生全面的认识。第二章 医疗大数据沙漏模型一、什么是医疗大数据医疗大数据是指个人从出生到死亡的全生命周期过程中,因为免疫、体检、门诊、住院等健康 活动所产生的大数据。通过对医疗大数据的分析和加工,可以挖掘出和疾病诊断、治疗、公共卫生防治等方面的重要 价值。医疗大数据的应用并不仅仅是在信息化时代才出现。早在19 世纪,英国流行病学家、麻醉学家约翰斯诺(John Snow)博士运用近代早期的数据科学,记录每天的死亡人数和伤患人数,并将死亡者的地址标注在地图上,绘制了伦敦霍乱爆发的“群聚”地图。霍乱在过去被 普遍认为是由“有害”空气导致的,斯诺通过调查数据的汇总,确定了“霍乱”的元凶是被污 染的公共水井,并同时奠定了疾病细菌理论的基础。从最早的手工统计,到计算机的出现,再到各种传感器技术的普及。数据的收集和存储更加方 便,变成了自动化、数字化、密集化的方式,来源也越来越广。在过去的十年里,随着电子病 历的实施,数字化的实验室幻灯片,高分辨率的影像图片、视频,医疗保健数据量呈指数级增 长。再加上制药企业和学术研究机构档案,以及数万亿的数据流从智能化设备、可穿戴式设备 的传感器中得到,数据洪流已经滚滚而来。现阶段电子病历的广泛应用,使得有价值的医疗大数据实现了快速增长,可供医生、研究者和 患者使用的数据量极大地提升。EMC 和 IDC 发布的报告显示,2013 年全球医疗保健数据量为153 EB,预计年增长率为 48%。这意味着到 2020 年,这个数字将达到 2314EB(2.26ZB)。因此,我们计算出医疗数据的总量约占到全球所有数据容量的5.1%。大数据分析可以帮助医生确定治疗方案、药物种类和剂量、公共卫生防疫等临床指导。也可以 帮助医院的管理者制定更好的管理方式,帮助保险方制定更好的医疗保险支付模式。医疗服务 的提供者获取了更多的大数据信息之后,从经验医疗向循证医学进行转变。我们需要不断引入新技术、新概念,提升对这些数据的管理和分析能力,为管理者和临床医务人员做出准确的工 作决策提供依据。二、医疗大数据沙漏模型动脉网从医疗大数据的从数据采集、数据治理和数据应用三个方面描述了医疗大数据的发展流 向,绘制了医疗大数据的沙漏模型。数据的采集、治理和应用这三步,反映了大数据的状态变 化,从数据形成知识,从知识指导行动的过程。动脉网蛋壳研究院制图更细分一些,大数据领域可以分成数据采集、数据存储、数据治疗、数据分析、数据应用五个 方面。医疗大数据的输入端,是各种信息化系统、传感器、智能设备所产生的医疗健康数据。庞大的医疗大数据在收集完成后存储在数据中心,然后经过清洗加工之后,挖掘其内在有用的 数据。最后,通过大数据分析之后产生的知识来指导医疗行为,从而产生价值。通常,人们只认识到医疗大数据的数据来源越来越丰富,也认识到医疗大数据可以为医疗服务 提供有价值的参考意见。前面我们提到,大数据量虽大,但是垃圾数据居多,有价值的数据比 例不高。医疗大数据如果能够经过中间步骤的清洗和加工,那么医疗大数据所能发挥的价值会 越大。所以,医疗大数据从输入、加工到应用三个步骤缺一不可。我们所绘制的医疗大数据沙 漏模型,描绘了医疗大数据从数据形成知识,再形成行动指导的三个重要步骤。动脉网蛋壳研究院制图医疗大数据行业不是一开始就形成的,在大数据解决方案出现之前,医疗大数据所能发挥的价 值很低。随着信息化、物联网、云计算、人工智能等技术的发展,大数据的利用价值在增大。我们从数据获取时代,逐步向信息挖掘时代和价值输出时代过渡。而数据的价值,也从医疗行 为的总结,逐步升级为医疗决策的支持和全方位医疗辅助决策。三、医疗大数据的四大特征医疗大数据呈现以下四个特点:第一,数据量大。从TB到PB到EB,再到ZB,医疗大数据以48%的年增长率快速增长(IDC,2014)。这些数据早已超过了人力所能处理的极限。预计到2020年,全球医疗大数据将达到2314EB,已经达到了ZB级别。第二,数据种类多。医疗数据中既有结构化的数据,也有非结构化的数据。结构化数据包括Oracle、MySql 等数据库的数据,半结构化数据如 XML文档,非结构化数据包括 Word、PDF、音视频、影像等。多种类型的数据对数据的处理能力提出了更高的要求。第三,数据产生快,处理快。医疗信息服务中会存在大量在线或实时数据分析处理的需求。需 对数据进行实时或准实时的处理、秒级的查询需求响应。例如临床中的诊断和处方数据,健康 指标预警等。第四,数据缺乏标准。各个医生、各家医疗机构、各个地区的数据没有统一的规范标准,数据 的质量不佳。患者的基础信息和各种临床信息资源分散、重复、孤立,导致有效信息闲置、信 息重复或标准不一致,很难得到有效利用。健康医疗大数据是一种高附加值的信息资产,虽然个体健康医疗数据对于医疗技术革新的价值 有限,但通过对海量、来源分散、格式多样的数据进行采集、存储、深度学习和开发,可以从 中发现新知识、创造新价值、提升新能力,从而进一步反哺健康医疗服务产业。因此,健康医 疗大数据的发展关乎国计民生,具有重大的战略性意义。四、顶层设计支持医疗大数据发展当前,社会整体信息化程度不断加深,信息技术对健康医疗事业的影响日趋明显,以大数据、云计算、移动互联等新兴信息技术为核心的新一轮科技革命,推动了人口健康信息化和健康医 疗大数据应用发展,加速了健康医疗领域新模式、新业态、新技术的涌现。国家已陆续出台关 于扶持医疗大数据发展的相关政策,初步做好顶层设计并构建出医疗大数据发展的宏伟蓝图。2014年国家卫计委制定“46312”工程,即建设国家级、省级、地级市、县级4级卫生信息平台,依托于电子健康档案和电子病历,支撑公共卫生、医疗服务、医疗保障、药品管理、计划 生育、综合管理等6项业务应用,构建电子监控档案数据库、电子病历数据库、全员人口个案数据库3个数据库,建立一个安全的卫生网络,加强卫生标准体系和安全体系建设。人口数据库:主要包含人口信息,数据来源于各大部门(卫计委、公安、民政、统计、人力社 保、教育等)交互共享。
展开阅读全文