资源描述
人工智能和机器学习引领智慧医疗发展随着医疗信息化和互联网医疗的发展,以及电子病历(Electronic Health Records, EHRs)数据的不断积累,医疗行业自然而然的成为了机器学习和人工智能大放异彩的舞台。就在今年6月,腾讯发布了国内首个开放式AI医学辅助诊疗平台,而早在2016年和2017年,百度和阿里云分别相继推出了各自的“ 医疗大脑” ( AI辅助诊断应用)。自2013年到2017年,整个AI医疗行业共获得241笔国内融资(1)。AI在医疗行业的火热程度不言而喻,BAT 都在抢滩AI医疗市场,而各企业拥抱AI并享受其带来的益处也不再遥远。曾有分析指出 (2),下一个机器学习和人工智能的突破口最有可能发生在医疗、金融或自然语言处理这三个领域,因为这些领域每分每秒都在产生着新的数据。有人甚至预言,“ 人工智能可将医疗效果提高30%-40%,减少多达50%的医疗成本” 。通过使用大量医疗数据训练模型,机器学习已经在药物研发、降低误诊率、提供临床诊断辅助和优化市场销售等方面提供了无可比拟的帮助。技术的一日千里和数据的逐渐开放,也为AI在医疗行业的应用提供了更大的想象空间。在详细介绍IQVIA结合人工智能和机器学习助力医疗行业发展的最新应用之前,我们首先来简单介绍下人工智能和机器学习的概念。一、人工智能和机器学习概述人工智能(Articial Intelligence,AI)人工智能这个概念由来已久,在各种题材的科幻小说或电影中我们都能找到它的身影。从银河系漫游指南中的忧郁王子 Marvin到星际穿越中的智能机器人TARS,都是人们印象中人工智能的实现方式。从计算机科学领域的定义来看,当一个机器具有了学习和推理的能力,能通过分析它所处的环境信息,自主执行最优的行动(action ),那么就称这个机器具有了智能。人工智能最重要的特征是能够自主地执行或者推荐最优的行动 (3)。一般来说,人工智能的发展可以分为4个阶段 (4): 计算智能(Computational intelligence)机器开始像人类一样会计算,从而帮助人们存储和快速处理海量数据,这个阶段是后面认知和感知的基础。 感知智能(Cognitive intelligence)机器开始听懂或者看懂提供给它的信息,从而做出判断或者做出预测。例如,可以听懂语音的智能音箱,可以预测疾病风险的辅助诊疗工具(Clinical Decision Support System,CDSS)。这些机器可以帮助人们高效地完成“ 听 ”和 “看 ”的工作。 弱人工智能(Weak AI)当机器可以在特定的场合自主理解和思考问题,并最终给出解答时,我们就称它具有了弱人工智能,例如Google的AlphaGo。这些机器能够帮助人们在特定场合中解决复杂的问题。 强人工智能(Strong AI)强人工智能其实更贴合人们想象中的人工智能,在这一阶段, 机器完全具有了人类的智能,可以像人类一样思考和处理任何问题。通常如果一个系统通过了图灵测试 (5),就认为该系统具有了人工智能。例如,完全独立驾驶的无人驾驶汽车,或者完全独立飞行的无人机都是强人工智能的例子。这个阶段的人工智能可以完全替代或者辅助人类工作。随着近几年大数据的爆发,分布式计算框架的提出,以及计算能力的不断提高,目前人工智能正在从感知智能向弱人工智能阶段发展。在一些特定的场景下,人工智能已经迅速超越人类最高水平,例如,AlphaGo以大比分3 : 0战胜柯洁奠定围棋霸主地位;卡内基梅隆大学开发的人工智能系统Libratus在一对一无限注德州扑克中击败4 名人类顶尖高手;美国旧金山Enlitic公司开发的检测系统凭借深度学习,癌症检测技术超越了4 位顶级的放射科医生,包括诊断出了人类医生无法诊断出的7%的癌症,以及在人类医生高达66%的癌症误诊率的情况下,Enlitic的误诊率只有47% (4)。机器学习(Machine Learning, ML)机器学习的主要工作是模式识别,例如,识别患病人群和非患病人群的区别。其中“ 学习” 的含义是指当提供更多更01 前沿视点 VIEW POINT有区分度的数据的时候,机器可以通过不断的迭代来提高模式识别的准确性,从而得到更加精准的预测结果 (6)。机器学习模型可以分为两类: 有监督学习:目的是从数据中学习到一个模式(model),从而当提供新的输入数据时,可以预测出相应的输出结果。有监督学习一般要求数据包含每个样本点X 对应的预期输出结果 Y,例如垃圾邮件识别或者图像识别,这些是有监督学习的代表性例子,也就是说在训练模型的时候,我们有很明确的标签表示邮件是否是垃圾邮件,图像中的动物是否是猫。举一个医药领域的例子,有监督学习可以从患有心血管疾病( CVD) 的人群和没有CVD的人群的电子病历或就诊记录中学习出一套模型,从而预测新人群是否患有CVD(图1)。 无监督学习:目的是找到数据中隐含的结构或者隐藏的模式,我们事先一般对模型的输出并没有明确的预期。举一个与上述监督学习类似场景下的案例:无监督学习是基于未经标记的人群,通过大量电子病历中的记录和结果,寻找病人之间可能存在的逻辑划分,例如低收入人群和高收入人群,或者用药人群和未用药人群等等,进而帮助我们了解数据内在的逻辑,能为更深入的分析数据建立基础(图2 )。人工神经网络(Articial Neural Networks, ANN)和深度学习(Deep Learning, DL)人工神经网络是模拟人类大脑的生物神经网络的一类机器学习算法。我们都知道人脑的基本单元是神经元细胞,而对应的人工神经网络中基本的单元被称为感知机(Perceptron)。简单来说,它的工作原理就是接收输入信息,例如X1, X2,X3,然后给这些信息一些事先指定的权重,最后输出结果 (7)(图3)。图1:有监督机器学习(x1, y1), (x2, y2), . , (xN, yN)模型xN+1P(Y|X)Y=f(X)学习系统预测系统yN+1(x1, x2, . , xN)模型xN+1P(Y|X)学习系统预测系统Y图2:无监督学习基于上图的感知机,举个容易理解的例子,假设周末即将举办一个你十分感兴趣的展览,你可能需要在衡量下面三个因素之后再决定去或不去:1. 你的男朋友或女朋友会陪你一起去吗?2. 周六的天气如何?3. 展览馆是否临近地铁站(假设你没有私家车)?同时假设你很喜欢这个展览,并且天气是你的主要考虑因素,所以除非周六天气不好,即便你的男朋友或女朋友不陪你或者展览馆的交通不方便,你也会选择去看展览。那么,可以定义天气因素的权重为6 ,其余两个因素的权重均为2 ,这样根据选定不同的阈值,这个简单的感知机就可以帮助你做出决定。例如,假设你的阈值是5 ,那么只要周末是个好天气,你就会选择去看展览。当有多个这样的感知机一起工作,并且它们的输出可以作为下一个感知机的输入时,简单的人工神经网络就形成了。下图展示了一个4 层的人工神经网络,最左边的一层一般称为输入层,最右边的被称为输出层,中间的层统称为隐层。一般来说,当隐层的个数超过 3层的时候,这样的人工神经网络被称为深度神经网络,简称深度学习。(图4 )。图3:感知机X1X2输出X3在详细介绍IQVIA结合人工智能和机器学习助力医疗行业发展的最新应用之前,我们首先来简单介绍下人工智能和机器学习的概念。一、人工智能和机器学习概述人工智能(Articial Intelligence,AI)人工智能这个概念由来已久,在各种题材的科幻小说或电影中我们都能找到它的身影。从银河系漫游指南中的忧郁王子 Marvin到星际穿越中的智能机器人TARS,都是人们印象中人工智能的实现方式。从计算机科学领域的定义来看,当一个机器具有了学习和推理的能力,能通过分析它所处的环境信息,自主执行最优的行动(action ),那么就称这个机器具有了智能。人工智能最重要的特征是能够自主地执行或者推荐最优的行动 (3)。一般来说,人工智能的发展可以分为4个阶段 (4): 计算智能(Computational intelligence)机器开始像人类一样会计算,从而帮助人们存储和快速处理海量数据,这个阶段是后面认知和感知的基础。 感知智能(Cognitive intelligence)机器开始听懂或者看懂提供给它的信息,从而做出判断或者做出预测。例如,可以听懂语音的智能音箱,可以预测疾病风险的辅助诊疗工具(Clinical Decision Support System,CDSS)。这些机器可以帮助人们高效地完成“ 听 ”和 “看 ”的工作。 弱人工智能(Weak AI)当机器可以在特定的场合自主理解和思考问题,并最终给出解答时,我们就称它具有了弱人工智能,例如Google的AlphaGo。这些机器能够帮助人们在特定场合中解决复杂的问题。 强人工智能(Strong AI)强人工智能其实更贴合人们想象中的人工智能,在这一阶段, 机器完全具有了人类的智能,可以像人类一样思考和处理任何问题。通常如果一个系统通过了图灵测试 (5),就认为该系统具有了人工智能。例如,完全独立驾驶的无人驾驶汽车,或者完全独立飞行的无人机都是强人工智能的例子。这个阶段的人工智能可以完全替代或者辅助人类工作。随着近几年大数据的爆发,分布式计算框架的提出,以及计算能力的不断提高,目前人工智能正在从感知智能向弱人工智能阶段发展。在一些特定的场景下,人工智能已经迅速超越人类最高水平,例如,AlphaGo以大比分3 : 0战胜柯洁奠定围棋霸主地位;卡内基梅隆大学开发的人工智能系统Libratus在一对一无限注德州扑克中击败4 名人类顶尖高手;美国旧金山Enlitic公司开发的检测系统凭借深度学习,癌症检测技术超越了4 位顶级的放射科医生,包括诊断出了人类医生无法诊断出的7%的癌症,以及在人类医生高达66%的癌症误诊率的情况下,Enlitic的误诊率只有47% (4)。机器学习(Machine Learning, ML)机器学习的主要工作是模式识别,例如,识别患病人群和非患病人群的区别。其中“ 学习” 的含义是指当提供更多更02总第38期 2018.07有区分度的数据的时候,机器可以通过不断的迭代来提高模式识别的准确性,从而得到更加精准的预测结果 (6)。机器学习模型可以分为两类: 有监督学习:目的是从数据中学习到一个模式(model),从而当提供新的输入数据时,可以预测出相应的输出结果。有监督学习一般要求数据包含每个样本点X 对应的预期输出结果 Y,例如垃圾邮件识别或者图像识别,这些是有监督学习的代表性例子,也就是说在训练模型的时候,我们有很明确的标签表示邮件是否是垃圾邮件,图像中的动物是否是猫。举一个医药领域的例子,有监督学习可以从患有心血管疾病( CVD) 的人群和没有CVD的人群的电子病历或就诊记录中学习出一套模型,从而预测新人群是否患有CVD(图1)。 无监督学习:目的是找到数据中隐含的结构或者隐藏的模式,我们事先一般对模型的输出并没有明确的预期。举一个与上述监督学习类似场景下的案例:无监督学习是基于未经标记的人群,通过大量电子病历中的记录和结果,寻找病人之间可能存在的逻辑划分,例如低收入人群和高收入人群,或者用药人群和未用药人群等等,进而帮助我们了解数据内在的逻辑,能为更深入的分析数据建立基础(图2 )。人工智能和机器学习引领智慧医疗发展人工智能和机器学习引领智慧医疗发展03 前沿视点 VIEW POINT二、AI在医疗领域的应用AI在中国的应用尚属起步,从全球的实践来看,AI主要能带来科研和医疗服务的升级以及营销手段的精准化。例如,人工智能可以帮助医药公司模拟药物研发,加速研发过程;也可以作为辅助诊断功能被集成到医疗器械和医疗软件户中;还能帮助放射科医生进行前期医疗图像处理并形成诊断报告;也能直接为患者提供个性化的健康管理方案,实现疾病的前期预防和及时诊断;同时也可以帮助客户优化市场策略,为产品或服务提供最优定价方案。在这一系列多元应用中,智能诊疗和健康管理是最重要和最核心的应用场景。利用AI技术,可以训练模型从病患数据中找到逻辑和模式,模拟医生的思维和诊断方式,从而辅助医生做出更精准的诊断,或选择更合适的诊疗方案。图4:人工神经网络输入层输出层案例一 基于深度学习的自动化医疗AI平台IQVIA基于病人的纵向数据建立了自动化医疗AI平台,为客户提供实时的解决方案。该平台能够在不同情况下快速有效地识别病人,并准确地预测病人的发病风险及病程变化。创新点和成果IQVIA的自动化医疗AI平台使用深度学习中的循环神经网络(Recurrent Neural Network, RNN)处理纵向数据中的时间序列变量,自动生成疾病相关的特征,从而避免了繁冗的人工生成特征的步骤,极大地提高了效率。同时该医疗AI平台直接和数据库对接,能够无缝添加新数据,实现模型的实时更新。该平台将广泛用于医生的辅诊过程中,当AI判断患者具有高风险或高可能性罹患某种疾病时,平台将对医生发出提示。基于深度学习的特征工程,模型效率及预测准确性获得显著提高,这些自动生成的特征在疾病诊断和病程预测中可以生成十分稳定的结果。不断上升的研发成本,不断下降的终端销售价格,以及入院上量的挑战和复杂,对企业自身的营销竞争力提出更高的要求。多元、合规的营销渠道和高效的医患教育成为迫切需求;精准化、智能化、协同化是对新营销提出的具体诉求。以 AI为引擎的智能精准营销是企业应对环境和受众之变的有效手段。诊断、治疗到服务等各个环节的运行模式。医疗行业本身具备特有的复杂性,致使医疗AI的应用领域成为了一个庞大的产业体系,同时也在孕育丰富的创新机会。人工智能有望在各个方面改变医疗健康产业的格局。据中商产业研究院的数据显示,中国医疗 AI市场规模正在迅速扩容,2016年市场规模已达到96.61亿元,估计2017年超130亿元,并有望在2018年达到200亿元。在医疗、医药、医院等健康产业的各个环节,AI都有广阔的空间得以施展。在中国市场,虽然目前患者和医生对AI的信任感还不足,且行业缺失监管标准,数据的结构化也有待提升,但相信总有一天,医疗AI能冲破重重阻碍和挑战,使医疗环境更为高效精准,将医生从繁冗的工作中解放出来,给予患者真切个性化的关怀,从而促进建立以人本为中心的医疗环境和医患关系。(图7)。案例二 利用机器学习优化数字化医疗策略机器学习能帮助客户了解医生在数字化营销中的行为特征,并对其逐一攻破。例如,找到影响医生点击或者打开电子邮件的关键变量,从而依据行为模式对医生进行分类,最终对不同类别的医生采取行之有效的市场推广策略。创新点和成果IQVIA将多渠道获取的有关医生阅读电子邮件的行为数据整合在一起,对 100+个特征进行评估及分析,选择其中最具代表性的特征,创新地综合利用无监督学习和有监督学习,在得到医生分类结果的同时,也对每个类别中影响医生行为的关键特征进行了评估及解释。通过对医生行为模式的分类及解释,IQVIA 对每个类别的医生采取个性化的市场策略,优化电子邮件发送时间和邮件内容,使电子邮件的打开率提升了4%,进而也大大提升了医生电子邮件推广活动的影响力。(图5)。案例三 基于罕见病风险预测模型的精准化营销在罕见病领域,AI 的应用为罕见病诊断打开新的大门。由于患者数量稀少,病程发展缓慢、并发症复杂等原因,尽早及准确地识别罕见病患者一直困难重重。但真实世界数据的发展和最新机器学习算法的引入,使更快、更精准地找到这些罕见病患者成为了可能。图5:IQVIA数字化解决方案三、AI在医疗领域应用的机遇医疗AI借助数据、互联和智能,重构了医疗行业从研发、明确医生行为驱动力根据网络行为将医生群体分组分析和预测客户流失率根据分组确定营销策略图6:IQVIA罕见病解决方案某罕见病患病率1万-10万人中有1人患病无法根据诊疗数据明确诊断出罕见病患者识别出约6000人高患病风险的病人建模后罕见病识别率显著提升19人中能识别出1人数据来源:IQVIA创新点和成果IQVIA基于大数据开发出了一整套高效准确的机器学习算法,在真实世界中寻找潜在的高风险罕见病患者。同时将这些潜在患者和他们对应的医生关联起来,帮助企业实现精准化营销。例如,在某种血管类的罕见病领域,IQVIA的解决方案将患者识别率从真实世界中的1/10000-1/100000,提升至1/19。 基于此模型, IQVIA还帮助药企设计出了更加准确的医生名单,使目标医生数量从 20000人减少至4000人,其中约有50%的医生是第一次被纳入企业的目标名单中。(图6 )。04总第38期 2018.07人工智能和机器学习引领智慧医疗发展诊断、治疗到服务等各个环节的运行模式。医疗行业本身具备特有的复杂性,致使医疗AI的应用领域成为了一个庞大的产业体系,同时也在孕育丰富的创新机会。人工智能有望在各个方面改变医疗健康产业的格局。据中商产业研究院的数据显示,中国医疗 AI市场规模正在迅速扩容,2016年市场规模已达到96.61亿元,估计2017年超130亿元,并有望在2018年达到200亿元。在医疗、医药、医院等健康产业的各个环节,AI都有广阔的空间得以施展。在中国市场,虽然目前患者和医生对AI的信任感还不足,且行业缺失监管标准,数据的结构化也有待提升,但相信总有一天,医疗AI能冲破重重阻碍和挑战,使医疗环境更为高效精准,将医生从繁冗的工作中解放出来,给予患者真切个性化的关怀,从而促进建立以人本为中心的医疗环境和医患关系。(图7)。三、AI在医疗领域应用的机遇医疗AI借助数据、互联和智能,重构了医疗行业从研发、人工智能和机器学习引领智慧医疗发展05 前沿视点 VIEW POINT联系方式如果您想了解更多人工智能和机器学习在医疗行业中的最新应用,请随时联系: 何伟红,IQVIA全球统计部高级总监, Megan.Heiqvia, +86 10 8567 4312 金晖,IQVIA全球统计部副总监,Hui.Jiniqvia, +86 10 8567 4427参考文献1. BAT抢滩AI医疗. 中国企业家杂志. 2. GilElad. Startups in machine learning AI. Elad Gil Blog. 2016年Sep月. sohu/a/114110469_464065.3. NorvigRussell and PeterStuart. Articial Intelligence: A Modern Approach. aima.cs.berkeley.edu/. 2003年. 4. 国泰君安证券. 人工智能重塑医疗行业. 2018.5. Wiki. Turing Test. en.wikipedia/wiki/Turing_test. 2018年. 6. BresnickJennifer. How Do Articial Intelligence, Machine Learning Differ in Healthcare? healthitanalytics/features/how-do-articial-intelligence-machine-learning-differ-in-healthcare. 2018年. 7. NielsenMichael. Neural Networks and Deep Learning. 2017.8. 15 AI Applications / Usecases in Healthcare . blog.appliedai/healthcare-ai/.图7:医疗AI应用场景 (8)营销和管理研发医学成像和诊断患者诊疗辅诊或自动诊断实时患者优先或分类患者数据分析妊娠管理误诊风控医学成像辅助判断早期诊断市场调研定价和风险管理品牌管理和营销药物研发基因分析和基因编辑设备和药物有效性对比医疗健康行业关于 IQVIATMIQVIA(纽交所代码: IQV)是全球领先的信息、创新技术和研发外包服务企业,致力于通过使用数据和科学,帮助医疗健康行业客户为患者提供更好的解决方案。IQVIA源于艾美仕(IMS Health)和昆泰(Quintiles)的合并,利用医疗信息、技术、分析和人类智慧的进步,提供一系列解决方案,推动医疗健康行业的发展。IQVIA帮助客户不断改善临床研发效率和提高商业绩效,坚信创新的力量,提高病患治愈的可能。IQVIA全球现有约 5万 5千名员工,遍布100多个国家,齐心致力于充分彰显人类数据科学的力量。IQVIA CORE是我们业务解决方案的基石,完美结合大数据、先进技术和海量行业信息分析,形成有实际指导意义的行业洞见。IQVIA是保护患者个人隐私的全球领导者。 IQVIA拥有多种多样的加强型隐私技术和保障手段,能够在保护个人隐私的同时对信息进行管理,从而推动医疗的发展。这些洞见和执行能力帮助生物科技、医疗设备、制药公司、医学研究者、政府机关、支付方以及其他医疗利益相关方,获得对疾病、人类行为和科技进步更深入的理解,共同朝着治愈各类疾病的方向迈进。敬请关注IQVIA 中国研发官方微信敬请关注IQVIA 中国商务官方微信2018 IQVIA及其子公司。保留所有权利。IQVIA各商标已在美国和其他多国注册。更多详情,请登录官网IQVIA查询IQVIA 中国公司艾美仕市场调研咨询(上海)有限公司上海市静安区北京西路 968 号嘉地中心 12 和 15 楼+86 21 3325 2288艾美仕市场调研咨询(上海)有限公司北京分公司北京市朝阳区建国门外大街光华东里 8 号中海广场中楼 7 楼+86 10 8567 4500昆泰企业管理(上海)有限公司上海市徐汇区枫林路 388 号枫林国际大厦 A 号楼 3 楼和 5 楼+86 21 2422 8888昆泰企业管理(上海)有限公司北京分公司北京市东城区王府井大街 138 号新东安广场第 3 座 9 层 901-919 室+86 10 5911 7888昆泰医药发展(大连)有限公司辽宁省大连高新技术产业园区汇贤园 1 号楼 10 层 10-02/04+86 411 8498 8188IQVIA 全球总部83 Wooster Heights RoadDanbury, CT 06810United States
展开阅读全文