资源描述
计算医学:数智时代的医学发展新范式 Computational Medicine: A Novel Paradigm of Medical Development in the Era of Digital Intelligence 数据的飞速积累和方法的加速更新换代预示着未来医学范式的转变方向:一种以数据和计算方 法为主的计算医学(Computational Medicine,CM)。通过计算模型、超算技术,数据之间的 相关关系被更好的体现出来,具有高通量高维度特征的海量数据,通过复杂系统的计算建模, 以更逼近真实的方式理解生命机理和疾病机制,提高疾病预测、临床诊疗和健康维护水平,使 个性化决策成为可能,有可能彻底改变从单个病人护理到政策制定的整个医学领域。 本期导读 浙江数字医疗卫生技术研究院浙江数字医疗卫生技术研究院浙江树人大学浙江树人大学媒体支持媒体支持 李莹莹 周佳卉 张建楠 朱烨琳 郑 杰 王力飞 叶芳芳 江 俊 动脉网 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 1 内容摘要 (一) 引言 与其他学科相比,医学实践具有相当大的不 确定性,而且这种不确定性一直存在,这也 是医学实践如此具有挑战性的原因。大数据 的发展,赋予了医生和临床科研人员更多、 更细致的维度去了解疾病发生发展过程,大 大拓展了医学研究的深度和广度。但是,生 物医学大数据的规模和产生速度已远远超出 了个人的处理能力,急需新的方式与手段帮 助医生从从多维、立体、融合的数据中摸索 出规律,从而更精确地进行疾病的诊断和治 疗。一种以数据和计算方法为主的计算医学 的出现与发展预示着未来医学发展范式的转 向。 (二) 计算医学概念与知识体系 计算医学的核心是通过应用数学、计算科学 来理解人类疾病的机理,为医学服务提供新 洞见,提高并改善疾病诊疗水平,广义上应 用计算机和计算模型来支持医疗保健服务的 医学研究的所有方面都可以被纳入到计算医 学范畴。作为一门较高难度的交叉学科,计 算医学需要综合来自计算机科学、数学、统 计学、生物化学、化学工程、生物医学工程、 生物物理学、分子生物学、遗传学、生态学、 解剖学等学科的知识。 (三) 计算医学研究进展 计算医学研究热度持续上升,最近几年在项 目研发投入与文献发布量上增速明显,但相 较于美国,中国在计算医学领域的研发投入 整体较少。研究内容上,模型研究、各类应 用模式(表达、模拟、算法、识别、预测、 分类)以及癌症、系统等为计算医学领域研 究的核心。研究内容变化上呈现:从原有的 理论、模型研究向应用领域研究发展;从数 理统计算法研究向基于人工智能技术发展; 从生物、解剖数学模型构建、到基于大数据 驱动的计算基因组学再到精准医疗等临床医 疗应用发展。国家比较来看,中美两国在计 算医学研究领域涉及面较广,各类研究主题 均有布局;中国在精准医疗应用、模型、机 器学习、个性化医疗、仿真模拟五个方面的 研究关注度与美国差距较大。 (四) 计算医学主要研究内容 本文结合技术与医学应用两个维度,并依据 时间发展顺序,归纳了计算医学的研究内容, 包括四个方面:以模型构建为核心的计算医 学基础研究、以海量基因组学数据驱动的计 算基因组学研究、基于人工智能技术的计算 医疗应用研究、面向精准医疗的计算医学研 究。并简要介绍了各个领域主要研究内容及 典型应用。 (五) 计算医学学科建设情况 为了应对医学范式向计算医学转变带来的挑 战,提高计算医学研究能力,世界各国的大 学和科研机构纷纷成立计算医学相关的研究 部门,这些机构多数前身为计算生物、生物 数学系、生物医学工程系等,学科建设仍在 持续发展过程中。在国外,这些高校院系也 成为了计算医学的主要研究中心。相较而言, 中国除中国科学院外,还没有形成比较集中 有影响力的计算医学领域研究中心。尽管各 个学校将建立的院系或开设的专业冠以“计 算医学”之名,但其研究的内容和侧重点各 不相同。 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 2 (六) 计算医学发展展望 计算医学的发展有望实现关于健康、疾病的 量化理解,带来医学发展范式的变革,但与 主流学术领域相比仍处于边缘的位置。现有 的模型对现实情况的模拟仍然是不充分的, 找到能够定义虚拟世界与经验世界之间联系 的工具,尤其是计算机仿真模型的有效性仍 然是困难。随着基因组学、医学成像、诊断 技术和转化医学方面的不断发展,人工智能 的深度融合,共性服务、共性平台、公共设 施的不断完善,将为我们开发癌症、遗传疾 病和传染性疾病的诊断工具和新疗法提供可 能性。计算医学作为关键的融合手段,将构 建人体“数字孪生”,实现精准健康维护, 让个性化医疗照进现实。 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 3 研究简介 (一) 研究背景 随着基因测序技术、可穿戴设备等新的检测 方法和检测工具的不断涌现,医疗健康相关 的数据正在指数级增长中。这些复杂数据的 处理已经远远超出个人的处理能力,亟需新 的方式与手段帮助医生从多维、立体、融合 的数据中摸索出规律,从而更精确地进行疾 病的诊断和治疗。一种以数据和计算方法为 主的计算医学,正受到越来越多的关注。 (二) 研究目标 了解计算医学的产生背景,明确计算医学的 基本定义。了解当前国内外计算医学的发展 现状以及主要研究内容的异同点,了解我国 在计算医学领域研究上与领先国家的主要差 距点。了解计算医学应用的主要方式。通过 本期白皮书,帮助读者形成对计算医学的初 步认知。 (三) 研究方法 本研究主要通过对国内外相关文献和资料进 行检索和整理归纳,并利用动态科学文献分 析工具CiteSpace(CiteSpace 5.8.R1)对 Web of Science 核心合集(1900-至今)中 的计算医学主题的文献数据进行可视化分析, 同时对国内有代表性的开展高校专家进行调 研,深入了解计算医学学科发展情况与主要 研究内容。 (四) 机构介绍 1. 浙江数字医疗卫生技术研究院 浙江数字医疗卫生技术研究院(简称“数研 院”,imit TM )是中国首家致力于数字与信息 化技术在医疗卫生健康服务领域研发与应用 的专业性非营利研究机构(NPO/NGO),院 长为杨胜利院士,理事长为李兰娟院士,常 务副院长为郑杰先生。 数研院聚集众多业内的资深院士和专家学者、 全球著名的医疗保健设备厂商、国内外领先 的行业软件企业来共同从事该领域的研究开 发、顾问咨询、认证评估、国际合作、成果 转化等工作,并引领政、产、学、研、用、 资六位一体的公益事业公共服务支撑平台, 进而营造出可生存可持续发展的数字医疗卫 生产业链生态环境。 2. 浙江树人大学 浙江树人学院(浙江树人大学)创办于1984 年,是一所由浙江省政协举办、省教育厅主 管的社会力量办学本科高校。学校现有杭州 拱宸桥与绍兴杨汛桥两个校区,教职工1200 人,在校生1.7万余人。设有院士领衔的树兰 国际医学院等12个二级学院,学科涵盖医学、 文学、经济学、管理学、理学、法学、工学、 艺术学等8大学科门类,共有4个省一流学科; 开设了50个本科专业,8个专科专业,其中 1个国家特色专业,4个省重点专业,1个省 优势专业,1个省优势建设专业,4个省新兴 特色建设专业,3个省特色建设专业。共有教 育部白俄罗斯国别与区域研究中心和省现代 服务业研究中心2个省部级研究基地,2个省 行业平台,1个省创新团队,25个校级研究 机构及平台。2015年学校被确定为浙江省首 批应用型试点示范建设学校,在中国民办本 科院校竞争力排行榜中连续多年荣获第一。 3. 动脉网 动脉网创立于2014年,是中国领先的医疗 健康产业研究机构和媒体平台,持续聚焦全 球技术变革下的医疗健康产业变迁,对行业 创新和创投进行长期的研究报道。动脉网拥 有中国最大的医疗健康创新创投资源库,提 供优质的媒体传播、产业研究、产业活动, IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 4 及投融资对接和产业合作资源对接等服务。7 年来,动脉网发布了14000多篇原创文章、 360多份原创产业报告、报道企业6000多家, 70%以上创新企业选择在动脉网首发。目前, 动脉网的微信公众号粉丝超过20万,40多 个自媒体渠道月均流量超过1200万。 (五) 版权说明 本白皮书版权属于浙江数字医疗卫生技术研 究院,并受法律保护。转载、摘编或利用其 它使用本白皮书文字或观点内容,请注明“来 源:浙江数字医疗卫生技术研究院”,若违 反上述声明者,本院将追究其相关法律责任。 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 5 一、引言 (一) 传统医学范式面临的挑战 一个多世纪前 Sir William Osler对医学的描述 “医学是一门不确定的科学,也是一门概率 的艺术”至今仍能引起我们的强烈共鸣。与 其他学科相比,医学实践具有相当大的不确 定性,而且这种不确定性一直存在,这也是 医学实践如此具有挑战性的原因。由于做出 决策的信息不完整以及偶然、随机或运气因 素,使得医疗决策不得不面临两个问题:既 没有完美的测试,也没有完美的治疗方法 1 。 传统医学模式中,面对这些决策中的不确定 性,通常的处理方式是通过从经验中积累的 专业知识进行判断,后发展为通过循证医学 的形式对研究进行系统的评估实现。但循证 医学主要以群体证据作为核心依据,往往无 法有效的解释个体差异。基因测序、检查检 验设备、可穿戴设备等新的检测方法和检测 工具的不断涌现,使得我们可以获取个人不 同尺度上的健康、疾病数据,医疗健康相关 的数据指数级增长。大数据赋予了医生和临 床科研人员更多、更细致的维度去了解疾病 发生发展过程,大大拓展了医学研究的深度 和广度。但人作为一个多层次非线性的复杂 系统,与健康相关的影响因素与数据维度异 常复杂,不同因素在不同尺度上相互作用影 响着健康,见图 1。例如,癌症、糖尿病、 心血管疾病和精神疾病等复杂疾病是由多种 遗传、表观遗传和环境因素引起的,可能是 DNA变异,也可能是由于生物网络中的多 个分子相互作用紊乱而发展起来的,一种复 杂疾病的临床特征是多尺度系统综合行为的 表型表现。这些复杂数据的处理已经远远超 出个人的处理能力,急需新的方式与手段帮 助医生从多维、立体、融合的数据中摸索出 规律,从而更精确地进行疾病的预测、预防、 诊断和治疗。 图1:“人”系统涉及的数据维度尺度 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 6 (二) 计算医学的诞生 早在80年代,如何在医学领域里应用计 算技术的研究就已经开始。1994年,首届 计算医学、公共卫生和生物科技大会在美 国奥斯汀举行,来自30个国家的超过500 名专家学者共同就计算模型在医学领域的 应用进行了交流。“Building a man in the machine”是本次会议的主题,围绕着这一 主题,会议议程中讨论了众多计算领域话题 包括:计算药理学与药物设计、计算免疫学、 计算基因组学、计算生物力学、计算和数学 生理学、计算机在精神医学计算、心脏病学、 肿瘤建模、人类大脑计划、多模态脑成像建 模等。时任美国环境保护局局长的William F.Raub博士在主旨演讲中提到计算医学在 当时还是一个非常小众的研究,只有一小部 分生物医学科学家在使用计算方法,开展数 学建模。 随着数据的飞速积累以及大数据的处理挖掘 方法不断成熟,以深度学习为代表的人工 智能方法在图像识别、自然语言处理等领域 取得了令人瞩目的成就。这些数据和技术领 域的革新也推动了计算医学进入快速发展周 期。在当下,计算医学通过高通量高维度特 征的海量数据计算建模,以更逼近真实的方 式理解生命机理和疾病机制,提高疾病预测、 临床诊疗和健康维护水平,使个性化决策成 为可能。 2012年10月,约翰霍普金斯大学生物医 学工程教授Raimond L.Winslow在科 学转化医学(Science Translational Medicine)发表了一篇名为计算医学:从 模型到临床(Computational Medicine: Translating Models to Clinical Care)的综 述性文章,指出计算医学已经从理论走向实 践,Winslow也被公认为计算医学新领域的 创始人。 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 7 (一) 概念 Winslow将通过计算建模理解疾病中生命系 统的扰动结构和功能,从建模中获得启发用 以改进疾病诊断和治疗的方法称之为“计算 医学”。这里的计算建模不仅包括分子网络 和生理过程的模型,也包括了生理功能分层 的解剖模型,其核心是使用定量模型来理解 疾病的结构和功能改变 2 。纽约大学将计算 医学描述为“计算医学是利用数据驱动的 分析来发现复杂动态生物系统的结构、功能 和进化” 3 。约翰霍普金斯大学的计算医学 所的定义则强调模型的构建:“计算医学是 计算机科学和医学交界的一个跨学科领域, 计算方法被开发来了解人类疾病。数学、信 息学和计算模型被应用于为疾病的机制、诊 断和治疗提供见解,并最终改善病人的护 理” 4 。虽然各自对计算医学的定义不尽相 同,但总体而言,作为一门新兴的学科,计 算医学的核心是通过应用数学、计算科学来 理解人类疾病的机理,为医学服务提供新洞 见,提高并改善疾病诊疗水平,广义上应用 计算机和计算模型来支持医疗保健服务的医 学研究的所有方面都可以被纳入到计算医学 范畴。 另一个与计算医学密切相关的学科为计算生 物学(Computational Biology)。根据美国 国家卫生研究院的定义,计算生物学是指开 发和应用数据分析及理论的方法、数学建模 和计算机仿真技术,用于生物学、行为学和 社会群体系统的研究的一门学科。计算生物 学重点以生命科学中的现象和规律作为研究 对象,以解决生物学问题为最终目标,研究 内容包括生物序列分析,基因鉴定,监管主 题发现,基因组组装,基因组复制和重排, 进化理论,聚类算法,无标度网络等 5 。从 研究内容上计算医学和计算生物学有部分交 叉,例如在计算基因组学领域,但计算生物 学作为生物学的一个分支,仍然偏向于基础 科学,为医学研究提供基础支撑。而计算医 学更偏向于应用科学,关注的是人体健康与 疾病相关问题的研究。 根据文献研究显示,计算医学的研究重点大 致经历了三个阶段的演变: 人体仿真与计算建模研究阶段 基因大数据驱动的计算医学应用 研究阶段 基于人工智能的计算医学与应用 研究阶段 具体到与医学的融合,计算医学与现代医学 的发展趋势保持着相对的一致性。现代医 学在研究层次上主要向着微观和宏观发展, 从分子医学的实验方法发展到系统医学的理 论与实验方法结合并进。学科体系上,既存 在学科分立和学科之间的交叉融合。现代医 学在向微观发展的过程中,是伴随着定量化 分析技术的提升得以实现,两个过程不可分 割,因此在计算机技术与医学紧密结合的领 域出现了计算医学较早的研究内容,包括计 算基因组学、计算神经遗传学建模、计算神 经科学等。在向宏观发展方面,一种是人们 认识到人本身是一个整体;二是把人作为一 个与自然环境和社会环境密切相互作用的整 体来研究,人体建模、数字人体、精准医学 等计算医学领域研究内容则是在这一趋势下 产生。 中国科学院计算技术研究所高性能计算机研 究中心主任谭光明从四个维度清晰的阐释了 计算医学的内涵 6 : 二、计算医学概念与知识体系 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 8 (二) 知识体系 计算医学是一门较高难度的交叉学科。需要综 合来自计算机科学、数学、统计学、生物化学、 化学工程、生物医学工程、生物物理学、分子 生物学、遗传学、生态学、解剖学等学科的知 识,见图2。 计算医学会涉及到使用近现代的数学工具来 对生物对象进行数学建模,所以对数学的要求 会比较高,尤其是动力系统和概率。而微积分 和线性代数又是动力系统和概率的基础。其他 基础必要的知识还包括生物学基础、医学基 础、计算机基础和工程基础领域知识,见表1。 来源:中国科学报,白皮书团队整理 来源:各高校计算医学课程信息,白皮书团队整理分析 图2:计算医学研究理论基础 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 9 表1:主要涉及学科及基础知识 理论基础 分类 学科主要内容 数学 相关基础 微积分 函数和极限;导数和微分,面(体)积和积分,微分和积分间的关系。微分方程,常 微分方程组。 微分方程 的计算 浮点运算、算法和收敛、求根(中点法、牛顿法和割线法)、数值微分和积分以及初 值问题的数值解(龙格-库塔法、多步法、外推法、稳定性、隐式法和刚度)。理论主题, 如初值问题解的存在性、唯一性和稳定性,高阶/非自治方程到系统的转换等。 线性代数 向量,向量空间(或称线性空间);线性空间里的线性相关与线性无关;线性空间的基; 矩阵和线性变换;矩阵的特征值和特征向量。 概率 微积分水平上的概率及其应用。概率,组合概率,随机变量,分布函数,重要概率分布, 独立性,条件概率,矩,协方差和相关性,极限定理。 统计有限总体抽样、近似方法、经典参数估计、假设检验、方差分析和回归。贝叶斯方法。 随机过程 随机过程的数学理论。重点是推导依赖关系、统计特性和样本路径行为,包括随机行走、 马尔可夫链(离散和连续时间)、泊松过程、鞅和布朗运动。 生物学 基础 生物化学蛋白质、核酸、脂肪、糖等生物大分子的结构、功能、代谢。 分子生物学 中心法则;基因、染色体与染色质、基因组;DNA复制、重组;转录、可变剪接、信 使RNA的稳定性,翻译;基因调控。 细胞生物学 细胞的形态结构、生理机能、细胞周期、细胞分裂、细胞自噬、细胞凋亡,以及各种 细胞器及信号传递通路。 医学 相关基础 人体生理学 血液与循环系统、肺与呼吸系统、消化系统、肾脏与排泄、神经系统、感觉器官、内分泌、 生殖、衰老。 人体解剖学研究正常人体各部分形态、结构、位置、毗邻及结构与功能关系。 诊断学诊断疾病步骤和临床思维方法、常见症状、病历内容、辅助检查。 计算机 相关基础 编程语言 熟悉一门编程语言(JAVA/PYTHON/Matlab)中变量、数组、函数以及控制结构(判 断结构和循环结构)的使用,并进一步熟悉指针、动态内存分配、多态性、重载、继承、 模板、集合、异常等概念(C+)。 数据结构 数据结构的设计和实现。相关数据结构包括数组、堆栈、队列、链表、二叉树、堆、 平衡树(如2-3树、AVL树)和图。 机器学习 统计机器学习方法、概率图模型。逻辑回归、广义线性回归、主成分分析、最近邻、 支持向量机、决策树、随机森林、K-均值聚类、高斯混合等,概率图的表示、推断、 参数和结构学习。 深度学习的常用体系结构、深度学习优化方法、深度学习编程系统以及在计算机视觉、 语音理解和机器人学中的应用。 计算机视觉 摄像机系统及其建模,双目立体、运动和光度立体计算三维几何;物体识别;边缘检 测和颜色感知;机器视觉和生物视觉。 工程类 相关基础 电气和 计算机工程 信号和系统、系统和控制、线性系统理论导论、非线性系统导论。 机械工程动力学系统,动力系统的设计和分析,运动动力学与控制。 化学和 生物分子工程 化学与生物过程分析导论、应用与化学工程的动力学建模与控制、药代和药效动力学。 来源:各高校计算医学课程信息,白皮书团队整理分析 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 10 三、计算医学研究进展 (一) 国内外研究投入情况 搜索知领全球科研项目库 7 最近10年题 名或关键词包含计算医学相关的项目,共 计3417条。(检索式:(KY=computational OR KY=计算 OR TI=computational OR TI=计算 OR KY=AI OR KY=artificial intelligence OR KY=machine learning OR KY=deep learning OR KY=人工 智能 OR KY=机器学习 OR KY=深度 学习) and (KY=medicine OR KY=医 疗 OR KY=healthcare OR KY=医学 OR TI=medicine or TI=医疗 OR TI=healthcare OR TI=医学 OR KY=gene OR KY=基因), KY=关键词,TI=项目名称)。 对有效数据进行统计结果显示,总体上,全 球近十年计算医学相关领域研究投入经费波 动较大,2019年在总研发投入经费和平均 项目研发投入经费均达到了历年最高值,见 图 3。国家分布上,研发经费投入最高的前 三位国家分别为美国、比利时和英国,平均 项目研发经费投入最高的国家分别为比利 时、斯洛伐克和澳大利亚,见图 4。 研发经费投入排名前10的项目的开始时间 主要集中在最近5年,重点投入在研究中心 建设、基础设施投入、人才培养、个性化治 疗等领域,见表2: 来源:知领全球科研项目库数据;白皮书团队分析 来源:知领全球科研项目库数据;白皮书团队分析 图3:全球近10年计算医学研究投入情况 图4:各国计算医学研发投入情况 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 11 (二) 研究现状与趋势 本节内容以Web of Science核心合 集(1900-至今)中收录的主题为 “computational medicine”的5257篇文 献数据为样本,进行计算医学领域研究可视 化分析,了解计算医学整体发展情况,重点 研究内容及演进态势等。(检索条件:主题 =Computational medicine,检索时间截止 至2021年7月27日,文献类型:all)。 本节图表来源未特别标注均为白皮书团队分 析所得。 1. 总体情况 1)时间趋势 文献发布时间跨度为1980年-2021年。总 体来看,全球范围内计算医学研究热度持续 上涨,尤其2010年前后开始出现快速上涨, 整体呈加速趋势,计算医学研究热度持续升 高。中美两国的研究趋势与全球基本保持一 致,见图5。 2) 国家/地区分布 对国家分布进行分析,发文数量最高的前三 个国家分为美国(2154篇)、中国 (761篇)、英国(499篇)。仅从发文 数量来看,中国在研究关注度上与美国相比 仍有一定差距,美国发文数量占总体文献数 的34.24%,为中国(12.1%)的2.83倍, 见图 6。 来源:知领全球科研项目库数据;白皮书团队分析 表2:近十年全球计算医学领域研发投入经费前十的项目情况 项目名称资助机构承担机构起止时间项目金额(美元) 多发性硬化症中遗传和非遗传因 素的多种表现与多组学加速个性 化治疗的方法 8 欧盟Karolinska Institutet 2017-2021 17,085,366 深度学习和高性能计算机促进生 物医学健康应用 9 欧盟Everis Spain SL 2019-2021 16,632,216 伦敦国王学院医学工程卓越研究 中心 10 英国Kings College London 2017-2022 12,100,395 为DCCP提供生物医学计算支持 服务 11 美国 Information Management Services 2015-2017 14,112,182 伦敦医学影像与人工智能价值医 疗中心 12 英国Imperial College London 2019-2022 9,985,272 生物医学学习和学生培训 (BLaST)计划 13 美国University of Alaska Fairbanks 2014-2024 12,396,907 国家智能医学成像联盟(NCIMI) 14 英国University of Oxford 2019-2021 9,633,794 医学生物信息学:个性化医学的数 据驱动发现 15 英国University College London 2014-2021 11,129,560 通过大数据分析和动态建模,实 现慢性呼吸系统疾病个性化医疗 的数据驱动计算方法 16 欧盟 Fundacio Institut De Bioenginyeria De Catalunya 2020-2022 196,434 使用人工智能增强的社交机器人 改善儿童的医疗体验 17 英国University of Glasgow 2020-2025 636,497 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 12 3)主要研究机构情况 从发文机构来看,美国机构占了前十中的9 个,主要以约翰霍普金斯大学、哈佛大学医 学院、斯坦福大学、美国密歇根大学等高校 为主,中国仅有1家机构进入前十,为中国 科学院。国外相较国内在计算医学领域已经 形成了比较有影响力的领域研究中心,见图 7。 图7:计算医学发文前十机构发文数量 图5:1990-2021年计算医学研究领域发文量时间分布比较 图6:计算医学发文量国家分布情况 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 13 4)主要发文期刊 发文量排名前10的期刊共刊登了计算医学 文献832篇(15.83%),排名第一的为医 学物理学(Medical Physics)发文量为 385篇(7.32%),IF最高的生物信息学 简报(Briengs in Bioinformatics)发文 量排名第6位。计算医学文献发文量前十的 期刊及影像因子(IF),见表 3。 图8:计算医学领域发文数量前十学科领域情况 表3:计算医学领域发文数量前十的期刊情况 排序期刊数量 IF (2020) IF (5年) 1医学物理学(Medical Physics)385 4.071 3.767 2医学生物学超声(Ultrasound in Medicine and Biology)76 2.998 3.051 3PloS One68 3.24 3.788 4科学报告(Scientic Reports)60 4.379 5.133 5Bmc生物信息学(Bmc Bioinformatics)55 3.169 3.629 6生物信息学简报(Briengs in Bioinformatics)50 11.622 10.288 7Plos计算生物学(PloS Computational Biology)42 4.475 5.379 8 计算与结构生物技术期刊 (Computational and Structural Biotechnology Journal) 35 7.271 7.409 9生物信息学(Bioinformatics)31 6.937 8.47 10 威利跨学科评论-系统生物学和医学 (Wiley Interdisciplinary Reviews-Systems Biology and Medicine) 30 5.0 4.938 5)学科领域特征 从文献学科分类统计来看,计算医学主要与 放射学、核医学和医学影像、生物化学和分 子生物学、数学与计算生物学、计算机科学 与跨学科应用、药理学与制药、生物医学工 程、生物化学研究方法学、工程、电器与电 子、多学科科学、计算机科学、人工智能等 学科密切相关。计算医学作为医学、工程与 计算机的交叉学科,是多个学科专业共同的 交叉研究领域,见图 8。 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 14 2. 研究热点与趋势 1)研究热点分析 关键词词频分布 对文献关键词统计结果进行分析,排名 前十的关键词,见图9。可以看到计算 医学领域排名前十的关键词分别为:模 型(model)、癌症(cancer)、表达 (expression)、预测(prediction)、仿 真(simulation)、识别(identication)、 系统生物学(system biology)、精准医学 (precision medicine)、系统(system)、 算法(algorithm)。 关键词国家分布 各国国家计算医学关键词分布情况见图 10。可以看出,在研究领域选择上不同国 家各有侧重。中美两国的研究领域涉及面较 广,各类研究关键词均有相关文献;印度主 要侧重“药物发现(drug discovery)”, 大部分国家包括德国、加拿大、意大利等的 研究关注点均集中在精准医疗(precision medicine)、模型(model)和机器学习 (machine learning)。中美两国具体对 比来看,中国的研究关键词排名前三的为 药物发现(drug discovery)、精准医疗 (precision medicine)、预测(prediction)。 美国研究关键词排名前三的则依次为精准医 疗((precision medicine)、模型(model) 和机器学习(machine learning),就研究 关键词的发文数量来看,中国在计算医疗技 术领域的模型构建、仿真模拟以及机器学习 研究和应用领域的精准医疗、个性化医疗等 五个方面的研究关注度与美国差距较大,见 图 11。 图9:计算医学领域关键词词云 图10:主要国家计算医学研究关键词分布情况 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 15 各国研究热点变化 主要国家主题河流图显示了各个国家近20 年来研究热点的变迁,总体来看主要是从原 有理论、模型等基础性研究向应用研究转变。 2009年以前,各国研究主题非常多样,存 在重叠的主题主要集中在“方法(method)” 和“模型(model)”,在2002-2009年和 2006-2009年分别成为日本、美国的研究热 点;2010年以后,各国的计算医学研究热 点开始出现更多重叠,2014-2017年“癌症 (cancer)”成为多个国家计算医学领域的 研究热点,“表达(expression)”先后成 为韩国、英国、中国在计算医学领域的研究 重点。2018年-2021年,“精准医疗(precision medicine)”成为美国计算医学领域研究热 点,见图 12。 研究热点时间变化 我们将1980年-2021年的5257篇文献按 每5年1个区间(years per slice=5),分 别选择每个区间内文献被引次数前50的文 献为对象(selection criteria=Top N,50), 图11:中美两国研究关键词发文数量比较 图12:主要国家计算医学领域研究主题河流图 文献篇 IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 16 进行关键词(node types=keyword)共现 网络分析,并根据关键词特征进行聚类, 共得到了10个聚类类别。一般认为轮廓值 (Silhouette)S0.5聚类是合理的,S0.7 意味着聚类是令人信服的。计算医学形成的 10个聚类结构都非常清晰,见表 4。聚类序 号越小,表明聚类中包含的关键词越多,“精 准医学”的研究内容是所有聚类中最为丰富 的,其次是“机器学习”子领域,第三则为 虚拟筛选靶点发现等药物发现相关的“计算 研究”领域,同时“计算研究”也是最新的 领域方向,平均发文时间为2013年。 表4:计算医学关键词聚类信息汇总表 序号聚类名称节点数轮廓值平均年份聚类标签词(LLR算法) 0 精准医疗 precision medicine 27 0.935 2000 精准医疗(precision medicine) (584.39,0.0001); 特征选择(feature selection) (500.1,0.0001); 立体定向放射治疗计划系统(stereotactic radiosurgery treatment planning) (441.45,0.0001); 理论指导(theoretic steering) (441.45,0.0001); coloring theory (436.95,0.0001) 1 机器学习 machine learning 26 0.968 2000 机器学习(machine learning) (969.03,0.0001); 人工智能(articial intelligence) (759.7,0.0001); 潜在靶点(potential target) (706.71,0.0001); 创伤后应激障碍(posttraumatic stress disorder) (660.74,0.0001); 认知框架(epistemological framework) (486.14, 0.0001) 2 计算研究 computational study 21 0.969 2013 计算研究(computational study)(1251.14,0.0001); cov-2主要蛋白酶(cov-2 main protease)(902.95, 0.0001); 蛋白酶(main protease)(873.95,0.0001); 结构虚拟筛选(structure-based virtual screening) (851.42,0.0001); 虚拟筛选(virtual screening)(664.72,0.0001) 3 实现路径 practical method 18 0.918 1998 实现路径(practical method) (314.6,0.0001); 散射补偿(incorporating scatter) (314.6,0.0001); 精确散射补偿(accurate scatter compensation) (314.6,0.0001); 边界元方法(boundary element approach) (307.27, 0.0001); 蒙特卡罗模拟研究(monte carlo modeling studies) (299.94,0.0001) 4 可行性研究 feasibility study 16 0.955 1997 可行性研究(feasibility study) (568.6,0.0001); X线透射(x-ray uoroscopy) (385.91,0.0001); 消痛颗粒(xiaotong granule) (379.96,0.0001); 治疗骨关节炎(treating osteoarthritis) (379.96, 0.0001); 增加噪声(using additive noise) (374.01,0.0001) IMIT白皮书 2021年 07月 第21期 计算医学:数智时代的医学发展新范式 17 序号聚类名称节点数轮廓值平均年份聚类标签词(LLR算法) 5 发展趋势 current trend 15 0.995 1994 发展趋势current trend (213.91, 0.0001); 人类基因组图mapping human gene (213.91, 0.0001); 发现设计原则(discovering design principle) (205.34, 0.0001); 介观动力学模型(mesoscopic model) (205.34, 0.0001); 食物过敏(food allergy) (196.78, 0.0001) 6 基因序列 dna sequence 15 0.886 2003 基因序列(dna sequence) (670.85,0.0001); 组织工程学(tissue engineering) (639.12,0.0001); 主题发现(discovering motif)
展开阅读全文