资源描述
医疗机构 医疗大数据平台 建设指南 20190506 征求 意见稿 中国医院协会 信息专业委员会 2019 年 5 月 6 日 医疗机构医疗大数据平台建设指南 编辑 委员会 主审:王才有 薛万国 主编 :衡反修、王力华 编者:(按姓氏笔画排序 ) 王力华 计 虹 田宗梅 包国峰 朱卫国 刘会 文 刘敏超 张 军 张琼瑶 袁 浩 夏洪斌 徐 浩 曹晓均 路 健 薛万国 衡反修 文字编辑 : 朱 小兵 王立军 黄 伊玮 序 言 2017年 12月,习近平总书记在中共中央政治局第二次集体学习时强调,大数 据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解 大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成 绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资 源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发 展和人民生活改善。 医学是数据密集型行业,无论是公共卫生、临床服务、医学研究都离不开数据 循证的支撑:一方面是医疗健康活动中产生大量数据;另一方面是这些数 据对于提 升医疗质量,有效控制费用,保障医疗安全具有潜在的价值。 医疗保健领域的大数 据 可广泛应用于疾病流行预测 , 临床治疗服务 ,改善 居民健康方式,对于提升人民 健康福祉,满足人民日益增长的健康需求,可发挥出重要作用。 围绕 健康中国发展 战略,国务院、国家卫生健康委发布了一系列政策法规,明 确了医疗健康大数据发展目标及 其 应用功能规范,极大地推动了大数据在医疗健康 行业中的应用 发展 。各医疗机构也根据自身发展 需要 , 开展 不同形式的大数据应用 实践 ,特别是以北京、上海、福建等发达地区为代表 ,已经初见成效 。 但是在 医疗健康大数据应用的发展 中 , 大家 也面临着诸多挑战,包括 : 数据标 准 开发和应用 、合理的数据技术、严格的数据安全、完善的数据治理、 适宜 的应用 场景 等 。 为了规范和指导我国医疗机构医疗大数据建设及应用工作,中国医院 协会 信息专业委员会( CHIMA)专门设立研究课题,组织专家撰写了医疗大数据建设 指南(简称建设指南)一书。本 指南 的编制目的是为医院、医院管理机构、医 疗大数据厂商提供医疗大数据建设、应用、运维工作 的参考方案 ,帮助医疗信息工 作者面对医疗大数据发展建设挑战、解决当前医疗大数据建设中的问题,推广医疗 大数据的建设 和应用。 建设指南共包括 四 个章节:第一章引言,介绍医疗大数据发展的政策背景、 现状和问题,以及医疗大数据及平台的概念、意义和作用;第二章总体设计,明确 医疗大数据平台的需求和建设目标,介绍医疗大数据平台的总体架构、技术路线和 功能范围;第三章建设要点,详细介绍了医疗大数据平台建设的安全体系、硬件部 署、数据接入以及数据治理策略;第四章应用场景,从临床应用、科研应用、医院 管理、患者管理和药物临床试验等方面介绍了医疗大数据的建设及应用 。 最后, 本 指南 还设有附录,包括:专门为 本指南 主题征集的专家观点,回应了业界关心的医 疗大数据的建设中存在的热点、难点问题,以及建设经验;医院大数据平台的建设 案例,大数据平台的数据管理制度等。 针对发展中遇到的挑战, 建设指南 收集 整理 了 医疗 信息 化业内专家 意见, 从 信息 安全、数据利用、平台建设、平台管理、 推广应用 和 厂商 选择等方面 讨论 了 大数据平台建设 与 应用的 重点与 难点。 此外 , 本指南针对性 选取 医疗 大数据 平台 建 设 成果 较为 显著 的 代表 单位 ,如:解放军 总医院 、北京 大学第三医院、 上海市 第十 医院、 福建 省立医院 和 北京大学肿瘤医院 ,分享其 建设 案例和 研究成果 ,供读者 参 考 。 建设指南力图根据当前医院信息技术应用水平、医院管理和技术能力,以 及国内医疗大数据建设现状,形成适合国内医院发展、可落地的建设方案。相关医 疗信息工作者可根据本单位实际加以借鉴参考。 本指南 的撰写也得到了医渡云( 北 京 ) 技术 有限公司、北大医疗信息技术有限公司 、 北京嘉和美康信息技术有限公司、 系联软件 (北京 )有限公司 等 医院信息产品供应商的积极支持。 在此 ,对所有参加讨 论、撰写的个人及单位表示衷心感谢!由于 我们 的水平有限,本指南如有不当之处, 恳请各位读者提出宝贵意见。 王才有 中国医院协会信息专业委员会 2019 年 5 月 目 录 第一章 引言 . 1 1.1 政策背景 . 1 1.2 编制目的 . 2 1.3 现状与问题 . 3 1.4 医疗机构的医疗大数据平台概念 . 7 1.5 医疗机构建设医疗大数据平台的意义及作用 . 9 1.6 标准与规范体系 . 10 1.7 建设指南主要内容 . 12 第二章 总体设计 . 13 2.1 需求和目标 . 13 2.2 总体架构 . 14 2.3 技术路线 . 15 2.4 功能范围 . 17 2.4.1 大数据采集汇聚 . 17 2.4.2 大数据治理 . 17 2.4.3 大数据挖掘分析 . 18 2.4.4 大数据利用 . 18 2.5 隐私保护和数据安全 . 18 第三章 建设要点 . 21 3.1 安全体系 . 21 3.1.1 平台部署安全 . 21 3.1.2 安全措施保障 . 24 3.2 硬件部署 . 28 3.3 数据接入范围 . 29 3.4 数据接入方式 . 30 3.4.1 备份恢复 . 32 3.4.2 数据同步 . 33 3.4.3 物化视图 . 34 3.4.4 ETL 抽取 . 35 3.4.5 数据增量抽取 . 36 3.4.6 集成平台数据提取 . 38 3.5 数据脱敏加密 . 39 3.5.1 数据脱敏 . 39 3.5.2 数据加密 . 41 3.6 数据处理 . 45 3.6.1 数据验收 . 45 3.6.2 数据生产 . 46 3.7 数据扩展 . 56 3.8 数据授权 . 56 3.9 数据验证 . 57 3.10 平台验收 . 58 3.10.1 速度、性能 . 59 3.10.2 功能验收 . 59 3.11 平台培训 . 60 3.12 数据管理 . 61 第四章 应用场景 . 62 4.1 临床应用场景 . 62 4.1.1 临 床大数据搜索 . 62 4.1.2 多学科诊疗 (MDT) . 65 4.1.3 患者全息视图 . 66 4.1.4 临 床决策支持 . 68 4.2 科研 应用场景 . 71 4.2.1 科研思路探索与发现 . 71 4.2.2 基于 时间 模型的科研分析 . 73 4.2.3 专科疾病数据库 . 74 4.3 管理应用场景 . 75 4.3.1 医院精 细 化管理 . 75 4.3.2 大数据病案管理 . 77 4.3.3 病 历评 分体系 . 78 4.3.4 VTE 风险评估 . 79 4.3.5 ICD 辅助编码 . 80 4.4 患者服务场景 . 80 4.4.1 智能导诊 . 81 4.4.2 智能候诊 . 82 4.5 药物研究场景 . 83 4.5.1 受试者智能招募 . 84 4.5.2 RBM 质控核查 . 84 4.5.3 AE/SAE 自动报警 . 85 4.5.4 试验数据辅助采集 . 85 4.6 教学应用场景 . 85 4.6.1 基于真实世界数据的疾病图谱 . 85 4.6.2 临床数据与知识库关联应用 . 85 4.7 应用展望 . 86 附录 A 专家论点 . 1医疗大数据平台如何在医院立项? . 2医 院上了临床数据中心,还需要上大数据平台吗? . 3如何判断大数据平台供应商? . 4是否能让临床科室直接从大数据平台导出数据? . 5数据申请和使用的管理,您认为主要由医院哪个职能科室管理? . 6为提高数据质量,而修改业务系统,如何操作? . 7大数据平台如何在院内推广使用? . 8如何进行大数据平台效益评价,大数据平台成果不显著,可能的原因是什么? . 9大数据平台管理的难点有哪些?为什么? . 10大数据技术依靠医院自我学习还是和厂商合作?如何保证持 续性和自主性? . 附录 B 医疗大数据管理制度示例 . 附录 C 医疗大数据平台建设案例 . 案例一:医疗大数据中心建设案例 -解放军总医院 . 案例二:基于大数据技术的全量数据中心建设与应用 -北京大学第三医院 . 案例三:基于人工智能的临床科研一体化平台建设 -上海市第十人民医院 . 案例四:医疗大数据应用 -福建省立医院 . 案例五:医院大数据平台建设及应用 -北京大学肿瘤医院 . 附录 D 术语定义 . 附录 E 参考文献 . 附录 F 编委会介绍 . 1 第一章 引言 医疗大数据是提升医疗服务质量、提高医疗服务效率、降低医疗费用的数据基 础,而医疗大数据平台则是管理、分析和应用医疗大 数据的强有力工具。在国家宏 观政策和行业需求的推动下,医疗大数据平台建设获得了长足的进步,但在建设过 程中仍面临着巨大的挑战。 本章节主要介绍医疗大数据发展相关的国家和行业政策法规,分析医疗大数据 发展的现状和问题,同时明确了医疗大数据平台的概念、建设意义及对行业发展的 作用。 1.1 政策背景 2015 年 9 月,国务院发布了国务院关于印发促进大数据发展行动纲要的通 知(国发 201550 号)(以下简称:通知)。通知指出,要构建以人为本、惠及 全民的民生服务新体系。围绕服务型政府建设,在健康医疗等领域全面推广大数据 应用。健康医疗大数据作为国家重要的基础性战略资源,它的应用发展将带来健康 医疗模式的深刻变化,有利于激发深化医药卫生体制改革的动力和活力,提升健康 医疗服务效率和质量,扩大资源供给,不断满足人民群众多层次、多样化的健康需 求,有利于培育新的业态和经济增长点。 为顺应新兴技术发展趋势,规范和推动健康医疗大数据融合共享、开放应用, 国务院办公厅于 2016 年发布了关于促进和规范健康医疗大数 据应用发展的指导 意见(国办法 201647 号)(以下 简称:指导意见)。指导意见提出,通过 “互联网 +健康医疗 ” 探索服务新模式培育发展新业态,努力建设人民满意的医疗 卫生事业,为打造健康中国提供有力支撑。 健康医疗大数据 以居民电子健康档案、 电子病历、电子处方等为核心 ,融合了可穿戴设备、智能健康电子产品等产生个人 健康数据资源,构建人口健康信息资源库。指导意见要求 以保障全体人民健康 为出发点,消除“信息孤岛”, 建设健康医疗大数据平台, 推进健康医疗大数据的 共享和应用。 医疗大数据作为健康医疗大数据的重要组成部 分,其主要目的是基于 临床医疗数据和医学专业知识分析患者疾病信息,为患者提供精准医疗服务。为了 推进医疗大数据的应用,有必要建设医疗大数据平台,为临床医疗、医学科研、个 人健康管理奠定坚实的技术基础。 2 2018 年 4 月,国家卫生健康委员会 规划与信息司发布了全国医院信息化建 设标准与规范(试行)(简称标准与规范)。它是在 2016 年医院信息平台应 用功能指引和 2017 年医院信息建设应用技术指引 (试行) 基础上,形成的较 为完整的医院信息系统体系框架。标准与规范 主要针对目前医院信息化建设现 状,对未来 5年 10年全国医院信息化应用发展提出建设要求。 标准与规范不 仅指导各级医院信息化建设,要求医院实现信息共享和业务交互,数据标准化、业 务规范化,同时也对大数据技术在医疗业务中的应用提出明确要求和基本功能描述。 标准与规范明确,医疗机构需要借助医疗大数据平台来管理、分析、利用医疗 大数据,以实现提升医学科研及应用效能,推动智慧医疗发展的目标。 为了从标准、服务、安全、监督等方面更好地指导医疗机构和管理部门加强 健 康医疗大数据服务管理, 2018 年 9 月 , 国家卫生健康委员会 出台了国家健康医 疗大数据标准、安全和服务管理办法(试行)(简称试行办法)。试行办法 明确健康医疗大数据的定义、内涵和外延,以及制定办法的目的依据、适用范围、 遵循原则和总体思路等,明确各级卫生健康行政部门的边界和权责,各级各类医疗 卫生机构及相应应用单位的责权利,并对三个方面进行了规范。 在标准管理方面, 明确开展健康医疗大数据标准管理工作的原则,以及各级卫生行政部门的工作职责, 提倡多方参与标准管理工作,完善健康医疗大数据标准管理平台,并对标准管理 流 程、激励约束机制、应用效果评估、开发与应用等作出规定;在安全管理方面,明 确健康医疗大数据安全管理的范畴,建立健全相关安全管理制度、操作规程和技术 规范,提出了数据分级分类分域的存储要求,对网络安全等级保护、关键信息基础 设施安全、数据安全保障措施等重点环节提出明确的要求;在服务管理方面,明确 相关方职责以及实施健康医疗大数据管理服务的原则和遵循,实行“统一分级授权、 分类应用管理、权责一致”的管理制度,强化对健康医疗大数据的共享和交换。 同 时,在管理监督方面 也 强调了卫生健康行政部门日常监督管理职责, 并提出大数据 应用的安全监测 、 评估 、 追究制度。 1.2 编制目的 医疗大数据平台的作用,是有针对性地采集、存储海量医疗数据,并且进行标 3 准化处理,让医疗数据在聚合、分析后,能够驱动临床医学、精准医学等实践应用。 迄今为止,我国尚没有医疗大数据平台的建设指南。因此,中国医院协会信息专业 委员会( CHIMA) 组织专家编写医疗大数据平台建设指南(简称建设指南), 旨在为医院建设医疗大数据平台提供规范和指导,推进我国医疗大数据的应用发展。 编制建设指南的目的是,在推进医院信息化和健康医疗大数据发展的背景 下,研究国内外医疗大数据平台发展趋势,并结合目前国内医疗大数据平台建设的 主要实践,为各级医疗 机构 建设医疗大数据平台提供行动指南,为医疗信息化服务 商的产品研发工作提供重要依据,为卫生健康相关行政管理部门推进医疗大数据相 关工作提供有力参考。 建设指南适用范围和对象包括: ( 1)各级 医疗机构 协助医院制定医疗大数据平台建设规划,并规范指导医疗大数据平台的建设 和运营,为其提供平台架构、技术路线、功能选型、数据安全等参考指南。 ( 2)各级 医疗管理机构 为各级医疗管理机构提供医疗大数据应用总体情况,综合分析本地区医疗大数 据发展及应用信息,同时监督医疗大数据安全保障情况。 ( 3) 医疗信息化建设服务商 面向医疗信息化企业,指导其开展医疗大数据建设方案规划、研发、实施以及 运营,为医疗机构提供适用的大数据平台和服务模式。 1.3 现状与问题 我国已经出台一系列有关医疗大数据的政策和法规,以加快推进医疗大数据的 发展。江苏、福建、山东、安徽、贵州等五个省率先开展了国家健康医疗大数据中 心试点。 医疗大数据正在成为医疗机构的重要资产,并且是医疗行业相关企业不可忽视 的 战略资源。医疗大数据相关工作在我国已开展多年,但尚处于行业发展初期。各 大医院的信息资源基本还是躺在数据库中“沉睡”。由于数据收集、存储、整合、 管理不规范,导致数据利用率不高,加之跨部门、跨机构之间数据共享机制缺失, 直接影响到大数据的有效利用。最终导致有数据的单位不愿共享,需要数据的单位 4 得不到数据,形成牢不可破的“信息孤岛”。对于医疗机构来说,数据“沉睡”的 成本颇高。很多临床诊疗和科研项目,在数据可以共享的情况下,完全能够大幅提 高效率。所以,建立衔接各方数据系统的医疗大数据平台,刻不容缓。 1.3.1 国内发展 现状 政策对医疗健康大数据的推动、医疗行业对大数据应用的需求、电子病历等 医疗数据的爆炸性增长、对公众健康管理数据的聚合、医疗数据分析技术和工具 的进步,这些主要因素促进了国内医疗大数据的发展。下文从几个层面来介绍国 内 医疗 大数据建设现状: ( 1) 政 策有力 促进 为推进和规范医疗健康大数据的应用发展, 2016年 10月,国家卫计委在京召 开医疗健康大数据中心与产业园建设国家试点工程启动推进电视电话会,会议围 绕贯彻落实全国卫生与健康大会精神和指导意见,明确试点思路,确定福建 省、江苏省及福州、厦门、南京、常州作为为第一批试点省市,启动第一批医疗 健康大数据中心与产业园建设国家试点工程。 与此同时,根据指导意见要求,各地也相继出台了地方医疗健康大数据 指导意见,例如, 2017年 3月,安徽出台关于促进和规范健康医疗大数据应用 发展的实施意见。这些政策的相继出台,从宏观层面指导医疗健康大数据应用规 范、有序地向前推进。 ( 2) 卫生 行业监管推动 各地卫生监管机构在国家鼓励医疗健康大数据发展的大背景下,相继构建地 方公共卫生、疾病预防、健康体检、卫生监督等数据中心,以便掌握地方整体的 医疗卫生资源、疾病预防控制、妇幼卫生系统、健康体检情况及卫生监督系统情 况。以北京市为例,完成 30家三级医院电子病历信息的互联互通,共享内容包括 门急诊的信息,住院病案首页、医疗机构的信息,以及患者的出院小结、用药情 况,以及检查放射等所有与患者相关的信息实现跨机构调阅查询。同时在慢病管 理监测过程中,开展了针对脑血管、心血管、糖尿病、高血压等疾病的监测。 ( 3) 医疗机构 内在需求 医疗机构通过大数据技术整合患者就诊数据,以患者为中心构建集成电子病 历,以便医务人员能够便捷地调阅患者就诊信息。利用大数据的搜索、处理和分 5 析能力,对医疗机构整体运营情况进行分析和监控。机器学习结合临床决策支持 系统,将临床多个维度的数据进行整合,为医生和患者提供精细化、个体化的诊 疗指导。对于医疗机构来说,大数据的价值在于能够提升医疗机构管理水平、服 务效率以及临床诊疗的效果。 ( 4) 患者健康层面 通过使用医疗可穿戴设备或社区健康体检设备等便携式医疗设备,患者将医 疗健康数据共享给医疗机构。医疗机构 可以监控患者健康状况,并且对患者医疗 健康数据进行分析,为患者提供更优质的医疗服务。 以上几个层面,也是目前医疗大数据平台的主要服务领域。针对不同领域的 应用需求,医疗大数据平台可以提供不同的服务主题,以便医疗大数据能够为各 领域提供合理、优质的大数据应用服务,逐步实现国家医疗健康大数据发展战 略。 1.3.2 国外发展现状 2012年 3月 29 日 , 白宫 宣布 启动 大数据研究 和 开发 。 2013 年 1月 15日 到 17 日 , 美国 国家标准与 技术 研究院 ( NIST)联合 各行业专业人士, 召开 了 “ 云和大数 据 论坛”会上 NIST 决定 创建 一个 公共 工作组 , 开发 大数据互操作 性 框架 。该 框架 应当 定义 并 区分 大 数据技术 需要 满足的需求, 包括 互操作行 、 可移植性、 可 重用性 、 可扩展性、 数据 使用 、 分析 及 技术架构 。 2013 年 6 月 19 日, NIST 大 数据 公共 工作组成立, 旨在 对大数据 的 定义、分 类 、 安全 参考 架构 、 安全 隐私需求和 技术路线图 形成 共识 ,最终 形成 一个 中立 于 供 应商 并 在技术 和 基础 设施方面 独立的 框架, 即 NIST 大 数据互操作 性框架 草案 。 草案 明确了大数据的安全、 隐私 、 架构、 标准等内容 。 2014 年 12 月, 美国 ONC(美国国家卫生信息技术协调办公室)发布了美国 联邦政府医疗信息化战略规划( 2015-2020),其总体目标是提高健康信息的安全 可及性和使用率,让公众在医疗服务提供者的帮助下有能力进行健康管理,提高生 命和健康质量。随后,美国大数据厂商积极开展医疗健康行业大数据建设布局。 IBM 公司组织医生和研究人员汇集数千份病人的病历,近 500 份医学期刊和教科书, 1500万页的医学文献,训练出 IBM Watson 系统。 IBM Watson通过认知计算为人们 创造一种全新方式,挖掘出隐藏于大量数据中的知识和模式。 IBM Watson 分析医 6 疗记录(结构化的数据和非结构化的数据),通过分析各种医疗数据,为患者提供 建议治疗方案,并给建议治疗方案排序,注明其医疗证据,医生可以根据患者病情 选择合适的治疗方案。 Dignity Health 是美国最大的医疗健康系统之一,致力于开发基于云的大数 据平台,带有临床数据库、社交和行为分析等功能。该平台将连接系统中 39 家医 院和超过 9000家相关机构并共享数据,通过 其大数据应用方向可以看到一些机会: 诸如,个人和群体医疗规划,包括预防性疾病管理;定义和应用最佳病例、减少再 入院率;预测败血症或肾衰竭风险,提早 进行干预减少负面结果;更好地管理医药 成本;创建工具来改进患者的就医体验。 英国积极发展个性化医疗,首个综合应用大数据技术的医药科研卫生机构“李 嘉诚卫生信息与发现中心”于 2013 年 在英国 牛津大学 正式揭牌。它包括“靶标研 究所”和“大数据研究所”两个机构,旨在利用大数据技术收集、存储和分析大量 医疗信息,确定新药物的研究方向,减少药物开发成本,同时为发现新的治疗手段 提供支持。 1.3.3 挑战与问题 虽然国内医疗机构为临床、科研、患者、药物研究等方面提供数据服务,也能 够借助医疗大数据平台形成一定范围的医疗大数据生态圈,但是目前我国医疗大数 据缺乏统一的标准规范。医疗机构建设医疗大数据平台的初衷也是为了满足自身医 疗信息化发展的需求,未能充分考虑医疗大数据的数据共享和数据应用,无法最大 限度地应用医疗大数据。为了构建完善的医疗大数据体系,构建成熟的医疗大数据 平台,需要解决以下几个主要问题: ( 1) 数据标准要统一 健康医疗大数据是国家重要基础性战略资源。国家卫生健康委员会 2018 年发 布国家健康医疗大数据标准、安 全和服务管理办法 (试行 )明确指出要加快推进 健康医疗大数据的标准制定工作, 鼓励医疗卫生机构、科研教育单位、相关企业或 行业协会、社会团体等参与健康医疗大数据标准制定工作。目前,医疗数据并不缺 乏标准,但汇集之后的健康医疗大数据尚缺乏统一的国家或者行业标准,各个医疗 大数据平台通常只是部分借鉴了成熟标准,大多 平台建设 还是采用各自的数据标准 规范。不仅医疗大数据厂商的标准不统一,各个地区甚至各个医院都未使用统一数 7 据标准, 影响 了健康医疗大数据平台的数据质量和数据治理效果。 目前,医疗信息 化行业内尚未有指导医疗机构大数据平台建设的具体、规范、适用性强的操作文件, 由于建设规范的缺乏, 一定程度 上制约了 数据标准、技术规范 和共享规范 的统一。 ( 2) 数据技术要适宜 大数据技术在各行各业都有所涉及,但是由于医疗业务不同于其他行业,构建 医疗大数据平台需要根据医疗大 数据特性来遴选相关技术,不能一味地照搬其他行 业大数据技术。特别是在数据采集、数据挖掘、数据治理等关键环节,要能够满足 医院实际情况,从作业、模型、物理资源等各方面综合评估,选择合适的大数据技 术和架构。 ( 3) 数据安全要保障 医疗信息已经从纸质文本时代迈向数据电子化时代,医疗数据和应用呈现指数 级增长趋势,这也给动态数据安全监控和隐私保护带来极大的挑战。医疗机构有必 要建立医疗大数据安全管理体系,保障数据存储,网络设备、基础设施等安全工作, 并提供数据安全保障相应措施,做到数据流转全程留痕、数据安全监测和预警、数 据泄 露事故可查询可追溯等数据安全保障工作。 ( 4) 数据治理要全面 医疗大数据平台给医疗机构带来的价值取决于医疗数据质量,医疗机构往往需 要通过全面完善的大数据治理来保 障数据质量。在传统数据平台阶段,数据治理的 目标主要是做数据管控,为数据部门建立一个的治理工作环境,包括标准、质量等。 在大数据平台阶段,用户对数据的需求持续增长,用户范围从数据部门扩展到整个 医疗机构,数据治理不仅要面向数据部门,还要面向所有医疗业务场景,使得数据 治理能够覆盖元数据、隐私、数据质量、业务流程整合、主数据整合和数据生命周 期管理等环境。 1.4 医疗 机构的医疗大数据平台概念 医疗大数据是健康医疗大数据的重要组成部分, 原卫计委将健康医疗大数据解 读为:健康医疗大数据涵盖人的全生命周期,既包括个人健康,又涉及医药服务、 疾病防控、健康保障和食品安全、养生保健等多方面数据的汇聚和聚合。但是,医 疗卫生相关部门还没有对 医疗大数据做出明确的解释和定义,目前关于什么是医疗 8 大数据,业内理解有所不同,不过普遍认为医疗大数据应具备“医疗”和“大数据” 双重特性。 本建设指南认为,医疗大 数据主要是指医生对患者诊疗和治疗过程中产生 的数据,包括患者的基本数据、电子病历、诊疗数据、医学影像报告数据、医学管 理、经济数据、医疗设备和仪器数据等。即以患者为中心,构成医疗大数据的主要 来源。医疗大数据不仅具有大数据的“ 4V” 特点外,还包括时序性、隐私性、不完 整性等医疗领域 固有的主要特征: a) 时序性:患者就诊、疾病发病过程在时间上有一个进度;医学检测的波形、 图像均为时间函数。 b) 隐私性:患者的医疗数据具有高度的隐私性,泄露信息将造成严重后果。 c) 不完整性:大量来源于人工记录,导致数据记录的残缺和偏差;医疗数据 的不 完整搜集和处理使医疗数据库无法全面反映疾病信息。 基于医疗大数据平台,医疗机构可以有效地聚合、分析、管理、利用医疗大数 据,实现医疗大数据的有效管理和应用。关于医疗大数据平台,原卫计委也给出医 疗大数据平台的范围和定义。 医院信息化建设应用技术指引(试行)中医疗大数据平台的标准解释为: 数据交换汇集。多种数据采集接入技术 (包括 ETL、爬虫等 ),实现医疗机构内部 数据、医疗相关科室数据、健康数据和互联网数据等多源异构数据的解析、汇集和 共享。数据存储。基于列数据库、文件数据库、分布式数据库、集群等多种文件 存储技 术,支持结构化、半结构化、非结构化文件的分布式存储。分布式计算。 基于分布式计算框架,利用集群资源,实现计算任务的分布式并行执行,提高多源 异构海量数据的计算效率。数据可视化。基于统一时空框架,利用可交互的可视 化界面方式,实现医疗卫生大数据综合展现。 医疗大数据平台管理的范围为:平台运维。支持可视化开发界面、计算任务 调度、智能部署、资源监控等能力。大数据平台加固。支持大数据平台组件的统 一配置,对其安全管理措施进行统一配置,规范平台安全配置管理。大数据平台 日志管理。通过 syslog 等方式,记录各组件的操 作和运行日志,记录身份验证信 息,统一存储,并支持检索和分析。 安全告警。支持自动化的异常行为分析、告 警及分析规则自定义。 访问控制。利用身份认证技术对组件操作权限进行管控。 9 数据权限管理。通过字段级别的访问控制措施,进行结构化数据访问权限、非结 构化数据访问权限的管理。 医疗大数据平台提供的大数据服务为:数据挖掘和建模。提供基于大数据架 构下海量数据读取、数据处理、数据计算服务,通过可视化的数据探索工具、数据 挖掘模型、简易模型训练支持数据挖掘与分析服务。数据应用服务。支持快速数 据集成、在线数据检索、多人协同 等工具,提供大数据的检索、归并等应用服务。 数据治理。通过规范流程和规则库,基于流程引擎构建统一的、可配置的数据转 换、清洗、比对、关联、融合等加工处理过程,对异构异源海量离散的数据资源加 工生产,生成易于分析利用的、可共享的数据。 1.5 医疗机构建设医疗大数据平台的意义及作用 1.5.1 医疗大数据平台的意义 建设医疗大 数据平台,运用大数据的分析和挖掘技术,可以在一定程度上帮助 医疗机构提高生产力,改进护理水平,增强竞争力。基于医疗大数据平台,实现历 史医疗资源的再利用,并借助大数据的思维和方法进行研究,完成过去传统思维、 方法、技术无法完成的任务,解决过去无法解决的问题,使得数据加以利用,形成 从量变到质变的过程,同时通过多维度的分析研究,实现对医疗数据的高效检索、 后结构化、分析计算。 同时,建设一个的高效、稳定运行医疗大数据平台,实现现有各种 医疗数据 库 的数据共享与交换,可让大数据处理更加便捷、快速、贴近用户,有效实现数据的 流通及使用价值的增值,为患者、医务人员、科研人员及管理人员提供服务和协助, 成为未来信息化工作的重要方向。 1.5.2 医疗大数据平台的作用 ( 1) 面向医务人员 建设医疗大数据平台,可以为医务人员提供基于大数据技术的医疗服务,可深 入洞察病症诊疗手段与成果,为相关病症研究提供数据支撑。利用医疗大数据平台, 可以为医务人员提供辅助诊疗服务,借助过往各类病例和各类数据源 ,深入分析相 关病症并需找、推荐最优治疗方案,为个性化诊疗提供基础。通过大数据技术完成 病历文档后结构化处理,在保证医生书写的原始病历数据可溯源的基础上,实现对 10 既往病历的结构化处理,满足科研数据采集需求。 同时,在临床科研领域,面对 海量数据 ,科研人员只需从中直接查找或挖掘所 需信息、知识和智慧,甚至无需直接接触需研究的对象。在科研过程中,大数据的 利用、开发和整理,可以颠覆以往很多研究结果,带来意想不到的发现。 ( 2) 面向患者 建设医疗大数据平台,可以使患者主动参与医疗过程,结合患者的健康数据、 既往病史,更有利于医 生做出正确的疾病诊断。基于医疗大数据的医疗服务,可以 创新医疗模式,减少医患矛盾。因为有效的数据整合模式,大数据医疗满足了以患 者为中心的个性化医疗,提升现有医疗技术平台的服务能力。医疗大数据的运用, 从医疗研究、临床决策、疾病管理、患者参与以及医疗卫生决策等方面,推动了医 疗模式的转变,尊重患者的价值观、个性化特征和需求,协调并整合不同专业的医 疗服务,保持医疗服务的连续性和可及性,提高医疗质量。 ( 3) 面向管理人员 建设医疗大 数据平台,提供统一可视化分析展示平台,为医院管理运营相关决 策提供数据依据,实现医院精细化管理。医院精细化管理是以规范化为前提,系统 化为保证,数据化为标准,信息化为手段,把服务者的焦点专注到满足被服务者需 求上,以获得更高效率、更多效益和更强竞争力。通过大数据分析平台对医院门诊 量、手术量、入 /出院病人数、床位使用率、床位周转率、设备使用率、 疾病图谱、 患者分布区域、费用支出等数据分析。将当前数据与同期数据、前期数据进行对比 分析。同时,可以对比本地区医院运营情况,找出不断提高医院经济运行质量的成 因和差距,抓住自身 工作的薄弱环节,切实采取改进措施。 1.6 标准与规范体系 医疗信息标准和规范体系医疗大数据采集、治理、共享和应用基石,脱离标准 规范体系的医疗大数据无法实现有效地融合、分析、应用和共享,也就无法将医疗 大数据价值最大化。但是,医疗大数据的融合、分析、应用和共享并非几个数据标 准就能完成,需要借助术语标准、内容标准、交换标准、技术标准、应用标准、安 全标准等各种标准规范构建的医疗大数据标准体系来体现医疗大数据价值。 大数据标准体系由五类标准构成:语义标准,包括术语、标识等标准;语 11 法标准,用于规范数据、信息的描述 格式;传输标准,用于支持跨系统数据信息 传输;安全标准,用于规范数据信息的安全访问和传输;服务标准,用于规范 数据共享、处理、分析服务。 医疗大数据具有多源、异构、非统一等数据特性,这使得医疗大数据标准体系 有别于以往国家和行业发布的数据标准,需要根据不同的医疗大数据服务需求,基 于用例驱动方法,利用更为宽泛、灵活的数据标准来构建大数据标准体系。因此, 医疗大数据标准体系要依据数据相关方利益、数据流通环节、平台服务协议等因素 来构建符合医疗大数据价值利用的标准体系,而非一个简单、统一、永恒不变的标 准体系,它需要在 实践中不断升级和完善。 医疗 大数据标准规范体系的升级和完善包含以下工作: ( 1)医疗大数据相关利益方梳理 梳理医疗大 数据平台中服务的提供者和消费者,以及数据流通环节其他的利益 方、责任方。提供者包括数据提供者、大数据应用提供者、大数据框架提供者,相 关利益方从数据、应用、技术不同层面对数据利用提供支持。通过对这些数据相关 利益方的梳理,就可以得到数据流通各个环节的业务需求和相关技术需求,这些需 求共同组成大数据平台需求,作为医疗大数据用例,用以评估和验证标准规范体系 是否合理、适用。 ( 2)医疗大数据环节服务协议 为保障大数据环节服务有效实施,需要从数据流维度和 IT 服务维度来构建标 准规范体系。从数据流维度来看,数据价值是通过数据采 集、集成、分析、使用结 果来实现的。从 IT 维度上分析,数据价值是通过平台 IT 服务来实现的。 IT 服务 既包括基础设施、存储设施、网络设施等硬件服务,也包括 IT 架构(云计算、分 布式等)、 IT工具( Hadoop、 Spark等)等软件服务。通过 IT服务来保证医疗大数 据平台数据的一致性、安全性、准确性,实现医疗大数据平台数据价值的有效利用。 ( 3)医疗大数据标准体系升级完善 现有医疗信息标准规范体系已经在医疗机构得到检验,建医疗大 数据标准体系 升级完善首先就需要与现有标准体系作差异分析,通过大数据用例来驱动新标准体 系的构建。新标准规范体系构建的宗旨是满足医疗大数据的独特需求。 12 1.7 建设指南主要内容 本建设指南从深化医院信息化改革和推广医疗大数据应用入手 ,结合大数 据时代下的国内外医疗现状 ,给出了医疗大数据平台的建设内容和建设要点,包括 总体架构、技术路线和功能范围;其次,针对不同医疗业务场景 ,介绍了基于医疗 大数据平台的临床、科研和公共卫生等各种大数据应用,并解析了医疗大 数据为医 疗机构提供何种数据服务的问题,同时,给出了一些详细介绍医疗大数据平台实际 建设和应用情况的案例;最后,行业专家围绕建设医疗大数据平台给出了一些具有 建设性的意见和建议,并展望了医疗大数据平台的后续发展。 13 第二章 总体设计 建设指南第一章明确了医疗大数据平台概念、意义和作用。本章将进一步 明确医疗大数据平台建设所需要满足的行业需求、平台的发展目标。同时,为了从 技术层面明确界定医疗大数据平台,本章还详细介绍了医疗大数据平台总体架构、 技术路线、功能范围以及安全与性能要求。 2.1 需求和目标 医疗大数据平台是医 院信息化建设重要组成部分。在促进和规范健康医疗大数 据应用发展的形势下,为了有效地聚合、分析、管理、利用医疗大数据资源,有必 要构建医疗大数据平台,为医院的管理、诊疗、科研和教学提供高效的服务。 ( 1)建设医疗大数据 平台的主要需求 稳定的大数据平台:基于大数据相关技术和框架,提供稳定、高效的数据 采集、数据融合、数据计算、数据挖掘、数据分析、数据治理的医疗大数 据平台。 多样的大数据采集:支持增量抽取、全表采集等各种数据采集方式;支持 日志管理和异常监控。 有效的大数据治理:支持结构化和非结构化数据、集中式和分布式数据的 统一建模;支持大数据清洗、脱敏的数据治理;以统一的数据标准对多源 异构数据进行归一化处理。 丰富的大数据应用:利用数据中心的大数据资源,对医疗服务、科研管理、 医院治理等的辅助决策支持应用。 灵活的大数据展示:提供大数据数据模型可视化配置,提供大数据分析结 果的可视化展示。 安全的大数据服务:支持大数据存储、传输、访问等服务的安全保障,对 数据进行安全评估和数据流转监 控,防止隐私数据泄露。 ( 2)建设医疗大数据 平台的主要目标 利用大数据平台,实现医疗数据共享开放,并且能够提高医疗数据利用率, 充分挖掘医疗数据潜藏的价值,使其最大限度地服务医疗业务。 以患者为中心,借助大数据技术整合患者医疗数据,为医生提供患者全生 14 命周期的数据服务。 为患者提供个性化医疗数据服务,保持医疗服务的连续性和可及性,提高 医疗质量。 为医院临床辅助决策和管理辅助决策、临床科研提供基础数据。 2.2 总体架构 根据医院信息化建设应用技术指引(试行)中 有关 医疗大数据平台建设的 标准,医疗大 数据平台总体架构 见 图 2.1 所示。 图 2.1 医疗 大数据平台总体架构 医疗 大数据平台总体架构 包括 四层架构 , 即数据源 层 、数据采集层、 大 数据中 心 、 应用 集市。 数据源层 :
展开阅读全文