2020-2021全球AI技术发展趋势报告.pdf

返回 相关 举报
2020-2021全球AI技术发展趋势报告.pdf_第1页
第1页 / 共94页
2020-2021全球AI技术发展趋势报告.pdf_第2页
第2页 / 共94页
2020-2021全球AI技术发展趋势报告.pdf_第3页
第3页 / 共94页
2020-2021全球AI技术发展趋势报告.pdf_第4页
第4页 / 共94页
2020-2021全球AI技术发展趋势报告.pdf_第5页
第5页 / 共94页
亲,该文档总共94页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
章节一:顶会趋势(NeurIPS)分析 章节二:20202021 技术趋势总结21 1-1 发表论文作者相关数据情况 1-2 发表论文机构相关数据情况 1-3 趋势分析 1-3-1 论文热门主题 1-3-2 知名机构关注论文主题 1-3-3 报告相关热门技术 1-3-4 趋势小结 2-1 背景 2-2 人工智能技术总趋势 2-3 人类语言技术趋势 2-4 计算机视觉技术趋势 2-5 机器人与自动化技术趋势 2-6 机器学习技术趋势 2-7 智能基础设施技术趋势 2-8 数据智能技术趋势 2-9 前沿智能技术趋势 04 08 12 12 16 19 20 22 23 28 31 33 34 36 38 39 Contents 目录 02 前言01 章节三:20202021 技术趋势分析详解41 3-1 人类语言技术42 本章节仅于完整版报告内收录 3-3 机器人与自动化技术44 本章节仅于完整版报告内收录 3-4 机器学习45 本章节仅于完整版报告内收录 3-2 计算机视觉43 本章节仅于完整版报告内收录 3-5 智能基础设施46 本章节仅于完整版报告内收录 附录 I:技术趋势分析方法、数据及局限49 本章节仅于完整版报告内收录 3-7 前沿智能技术48 本章节仅于完整版报告内收录 3-6 数据智能技术47 本章节仅于完整版报告内收录 附录 II:技术领域相关大事件 (20152020)50 1 人类语言技术 2 计算机视觉 3 机器人与自动化技术 4 机器学习 5 智能基础设施 6 数据智能技术 7 前沿智能技术 51 53 54 56 59 64 68 附录 III:Synced Indicators75 1. 人类语言技术 2. 计算机视觉 3. 机器人与自动化技术 4. 机器学习 5. 智能基础设施 6. 数据智能技术 7. 前沿智能技术 76 77 78 79 80 81 82 附录 IV:参考文献83 结束语86 01 前言 2017年,我们发布了机器之心人工智能技术趋势报告,系统介绍了人工智能领域(AI) 下不同的技术分支,并以定性分析的方法讨论了各分支技术当时所处的发展阶段、瓶颈以 及未来发展方向,帮助读者理解飞速发展中的 AI 领域内各项技术的概况和层出不穷的新 鲜技术内涵。在初版报告发布至今的这三年里,越来越多的 AI 技术实现了商业落地,但 也有不少深度学习方法开始触碰到技术自身的天花板,亟需突破。在这个可能是 AI 技术 发展的关键拐点,我们发布2020-2021全球AI技术趋势发展报告,兼顾2017年初 版报告定性分析方法的同时,重点加强了数据层面的挖掘、分析和探索,更加侧重对具体 技术趋势的挖掘以及量化分析指标的形成。定量研究方面,本报告基于近五年的开源论文 与专利语料,结合机器之心自有的新闻舆论以及模型最佳表现(SOTA)等相关数据库进 行了探索性数据分析,并形成了用以帮助技术趋势判定的量化指标Synced Indicator; 定性研究方面,我们邀请了近100位专家学者通过问卷形式了解其对具体技术成熟情况 的分析判断。报告分Lite(简要版)与Plus(完整版)两个版本。当前的Lite版涵盖“顶 会趋势(NeurIPS)分析”、“2020-2021 技术趋势总结”两个主要部分,同时包含“参 考文献”、“近年技术领域相关大事件”以及“Synced Indicator技术指标”的附录供参考。 另有 Plus 版在 Lite 版的基础上增加了包含完整数据和丰富图表的各技术领域趋势分析细 节,同时在附录介绍了具体的数据来源、分析方法、研究局限以及未来研究方向供参考。 02 章节一 顶会趋势(NeurIPS)分析 1-1 发表论文作者相关数据情况 1-2 发表论文机构相关数据情况 1-3 趋势分析 1-3-1 论文热门主题 1-3-2 知名机构关注论文主题 1-3-3 报告相关热门技术 1-3-4 趋势小结 03 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 NeurIPS 2020 刚刚落下帷幕,今年的 NeurIPS 2020 因疫情原因而改为线上举行,一万八千人参会的 NeurIPS 2020 相比 去年数量暴涨了三成。 今年的最佳论文奖项(Best Paper Awards)由三篇论文共同获得,分别是CMU与米兰理工大学合著的No-Regret Learning Dynamics for Extensive-Form Correlated Equilibrium,利用学习的方法为通用交互寻找相关均衡 (correlated equilibria,CE),UC Berkeley 学者发表的关于复杂数据的高效数据总结(data summarization)任 务 相 关 论 文Improved Guarantees and a Multiple-Descent Curve for Column Subset Selection and the Nystrom Method,以及 OpenAI 今年 5 月公开的有史以来最大的预训练语言模型 GPT-3 论文Language Models are Few-Shot Learners。对于 GPT-3 未来的研究发展方向,论文作者之一的 Dario Amodei 在 NeurIPS 2020 大会上表示:“GPT-3 仍然只是预测一段文字之后的下一个字,我们还有很多事可以做,如通过强化学习来微调语言模型以改变目标函数, 进而生成更复杂的文字内容。” 今年的时间检验奖(Test of Time Award)则是颁给了由 UW Madison 华人学者 Feng Niu 作为一作在 NeurIPS 2011 上 发表的论文HOGWILD!: A Lock-Free Approach to Parallelizing Stochastic Gradient Descent,NeurIPS 大会认为, 该研究提出了首个在没有任何锁定机制情况下并行运行随机梯度下降算法的实验,且能够保证强大的性能;自提出以来至 今,该论文的被引用量接近2000次,它不仅对机器学习领域有影响,对计算机系统和优化领域也有影响,这些都促进了 对 Hogwild! 方法的发展和理解。 根据大会官方数据,今年的 NeurIPS 2020 共计收到 9467 篇完整的论文提交,投稿数量较 2019 年增加了 40%,与 2018 年至 2019 年的增长率接近。其中,大会接收了 1899 篇论文,包含 105 篇 Oral 论文和 280 篇 Spotlight 论文,分别占录 取论文数的5.53%和14.74%。尽管今年的论文投稿和录取数量都创下纪录,但论文录取率仅为20.06%,为近三年最低 低于 2019 年的 21.59% 和 2018 年的 20.81%。与往年相比,今年 Oral 论文和 Spotlight 论文,无论是数量还是在录取论 文中的比重,都创下新高。 年年 份份 投投 稿稿 (同同 增增 ) 录录 取取 (录录 取取 率率 ) Oral(%) Spotlight(%) 2020 9467(40.40%) 1899(20.06%) 105(5.53%) 280(14.74%) 2019 6743(38.92%)/6614* 1428(21.59%)* 36(2.52%) 164(11.48%) 2018 4854 1010(20.81%) NULL NULL 表 1-1 NeurIPS 近三年投稿 / 录取论文数量表 *注:根据NeurIPS官方数据,2019年投稿数量有6743(初始投稿数)和6614(有效投稿数),计算同比增长时使用 6743,计算录取率时使用 6614。 04 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 图 1-1 NeurIPS 投稿 / 录取论文数量情况 1-1 发表论文作者相关数据情况 从发布论文作者的角度切入,被NeurIPS 2020录用的1899篇论文共计覆盖6012位从业学者(经过简单的同名作者识别后), 其中 1 位学者有 12 篇相关论文发布在 NeurIPS 2020,7 位学者有 9 篇相关论文,6 位学者有 8 篇相关论文,总计 77 位学 者被录取的论文数量在 5 篇以上(含 5 篇),27 位学者录取论文数量在 7 篇以上,详情参见下表。 录录 取取 论论 数数 量量 对对 应应 作作 者者 数数 量量 1 4909 2 751 3 202 4 73 5 31 6 19 7 13 8 6 9 7 12 1 总总 计计 6012 =5 77 =7 27 表 1-1-1 录取论文数量及对应作者数量统计 05 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 图 1-1-1 每位学者发表论文数量统计 NeurIPS 2020 录取论文数量最多的作者是来自 UC Berkeley EECS 学院的助理教授 Sergey Levine,该学者的研究方向是 用于决策和控制的机器学习算法,主攻深度学习和强化学习算法,应用方向覆盖自动驾驶、机器人以及计算机视觉和图形 相关技术领域。值得注意的是,Sergey Levine同样是去年的NeurIPS 2019上被接收相关论文数量最多的学者(同样以 12 篇相关论文数量排名第一),详情参见下表。 作作 者者 相相 关关 论论 数数 量量 SergeyLevine(UCBerkeley) 12 CsabaSzepesvari(DeepMind/UniversityofAlberta) 9 JinwooShin(KAIST) 9 LinYang(UCLA) 9 MihaelavanderSchaar(UniversityofCambridge) 9 StefanoErmon(Stanford) 9 SungJuHwang(KAIST,AITRICS) 9 ZhaoranWang(NorthwesternUniversity) 9 JasonLee(PrincetonUniversity) 8 JunZhu(TsinghuaUniversity) 8 PieterAbbeel(UCBerkeleyLeCun 一直提倡的自监 督 学习方法则是一种“利用完整数据监督不完整数据修复”的特殊的无监督学习 ; 而 Bengio 提倡的借鉴认知科学的符号 推 理相结合的方法同样需要研究先验知识如何降低数据的需求。三位业界巨擘都认识到无监督学习在解决深度学习缺乏场 景 数据和计算资源的问题上有巨大的可能性。我们在机器学习章节的数据分析中也同样看到,无论是论文、专利、亦或相 关 资讯,无监督学习都有着令人瞩目的高数值和增长率。相关问卷调查也显示,无监督学习有利于解决目前人工智能技术 的 主要瓶颈之一数据不足问题,与其相关的少样本学习、模仿学习、自监督学习以及对比学习等都有着无限可能性。 移动设备和 IoT 设备开始承担更多 AI/ML 计算 随着移动智能手机和 IoT 设备的计算能力越来越强,用户和监管机构对数据隐私的保护越来越重视,同时移动网络 5G 的 逐步部署落地,移动设备和 IoT 设备会进行更多的 AI/ML 的计算和训练。这使得人工智能离数据更近,离用户更近,也能 更迅速地进行迭代升级。一方面,云计算发展依旧迅猛,并逐渐向边缘计算发展,助力物联网智能化 ; 另一方面,AI 芯片 也逐渐走向云端、边缘端以及物联网设备终端,有实力的科技公司将 AI 算力打包成服务,既合理利用了自身多余的算力资 源,又降低了不具备相关科研实力的中小企业可以以更低的成本使用到足够的资源,完成自身的 AI 开发与部署需求,这与 近年来媒体讨论度颇高的无服务计算有着一致的思想理念。可以预见,随着 5G 技术的逐渐成熟,将会有越来越多的物联 网设备和相关应用,进一步促使相关的云计算和芯片产业与之共同发展前进。 25 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 图神经网络、图深度学习、大规模图计算平台将有很大发展空间 近年来,受社交网络、知识图谱以及生物信息学和神经科学中图形的重要性所驱动,将深度学习模型应用在不规则图结构 的数据上逐渐成为了一种新兴趋势。这些基于图的神经网络(图神经网络,GNN)通常将神经网络模型应用在图中与顶点 和边相关的特征上,传播运算结果并进行聚合,从而生成下一级的特征,目前已经在分类、嵌入、问答等多种不同的目标 应用中取得最佳表现效果。20192020 年,无论是在自然语言处理、计算机视觉、亦或机器学习的相关学术会议上,图神 经网络的相关论文均占据着不小比例。这种方法“将端到端学习与归纳推理相结合,业界普遍认为其有望解决深度学习无 法处理的因果推理、可解释性等一系列瓶颈问题”。相比传统的文本、语音、图像数据格式,图结构是一种泛用性更强且 更能代表现实世界真实情况的数据表示方式。随着知识图谱与推荐系统得到越来越广阔的应用,能够更切合相关数据表示 的图神经网络深度学习未来大有可为,这也是越来越多的云计算平台开始布局大规模图计算的主要原因。 深度学习的可解释性与 AI 安全 黑盒问题是自深度学习诞生起便一直伴随其中的主要问题与瓶颈之一,尽管深度学习技术的发展日新月异,在准确率等技 术指标上取得了惊人的成就,但是对于模型的可解释性方面提升仍然不大。这极大地影响了相关技术在一些对模型结果的 可信度和可解释性有着高要求行业 ( 如金融和医学 ) 的应用。与此同时,伴随着 AI 技术的不断发展,用户对于技术的关注 度越来越高,人工智能安全问题也便随之越来越受到大众关注。这与神经网络的可解释性一样是技术得到更广泛的应用之 前所必须突破和解决的问题。 自动驾驶与机器人技术任重而道远 从下表所示热词挖掘的整体数据可以看出,自动驾驶技术虽然在整体上仍然处于上升趋势,但是其最近 3 年的总体热度相 对其他 AI 技术而言却是逐年下降的。2015 年无人驾驶最火热的年代曾有多家公司和媒体预测 2020 年将会有高可用性的 L4-L5 级别 的自动驾驶出现 ; 然而随着高成本、复杂环境、以及一些无人驾驶事故的出现,人工智能带来的安全、隐私和 道德问题也 开始得到越来越多的关注。无论是技术上还是社会影响上,无人驾驶领域的泡沫开始逐渐散去,其研发开始转 入了一个相对沉静的缓慢发展期。 26 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 排名 年份 新闻技术热词 年份 新闻技术热词 年份 新闻技术热词 1 2020 上半年 AI 2019 AI 2018 AI 2 2020 上半年 智能 2019 智能 2018 智能 3 2020 上半年 5G 2019 5G 2018 神经络 4 2020 上半年 其他 2019 机 2018 驾驶 5 2020 上半年 神经络 2019 神经络 2018 机 6 2020 上半年 机 2019 其他 2018 5G 7 2020 上半年 脸识别 2019 驾驶 2018 其他 8 2020 上半年 NLP 2019 规划 2018 脸识别 9 2020 上半年 AR 2019 NLP 2018 GAN 10 2020 上半年 数据库 2019 感知 2018 NLP 11 2020 上半年 感知 2019 脸识别 2018 TensorFlow 12 2020 上半年 规划 2019 导航 2018 规划 13 2020 上半年 VR 2019 AR 2018 卷积 14 2020 上半年 准确率 2019 VR 2018 准确率 15 2020 上半年 参数 2019 TensorFlow 2018 IoT 16 2020 上半年 BERT 2019 数据分析 2018 感知 17 2020 上半年 驾驶 2019 数据库 2018 机器翻译 18 2020 上半年 查询 2019 IoT 2018 CNN 19 2020 上半年 导航 2019 BERT 2018 AR 20 2020 上半年 数据分析 2019 准确率 2018 数据分析 表 2-2-1 近三年新闻技术热词比较(Top 20) 机器人技术方面,智能机器人、服务机器人在专利方面总体都呈现上涨趋势,可以看到整个行业正在从完全侧重关注工业 机器人向更贴近大众生活的服务型机器人方向转化。与此同时,机器人流程自动化技术 (RPA) 在论文、专利、以及新闻 舆 论各方面都处于一个全面的持续增长期,在人工智能的助推下,软件自动化的方式实现对人工操作的大量替换,使得专 业 人士可以从大量重复的工作流程中解放出来,并大大提高生产效率,在医疗、零售、制造、金融,以及政府等多个场景 有 着广阔的应用前景和价值。 27 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 图 2-2-2 近五年累计技术趋势指数(Synced Indicator)总体情况 总体而言,我们可以看到,最近 5 年里,在经历了前几年的高歌猛进之后,许多人工智能相关技术在 2019 年开始放慢脚步。 基于机器之心的技术趋势分析,总结以上七类技术层面下各子技术领域的累计趋势指数(Synced Indicator)整体情况如下: 28 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 2-3 人类语言技术趋势 综合所有 AI 相关技术,趋势指数排名前十的分别为: 语音识别、卷积神经网络、云计算、GPU、深度学习、推荐系统、机器翻译、 定位、大规模预训练模型 及 情感分析 。而综合所有技术近 3 年的变化来看,2018 年增长最厉害的技术前五分别是 区块链、 联邦学习、多任务学习、 以及 图神经网络 ,2019 年是 扩展现实、工业物联网、人体关键点剪裁、三维推理、 以及 移动机器 人 ;20172019 三年间综合对比增幅最大的top5 技术分别是 语音识别、文本分类、数据挖掘、物体识别, 以及 GPU 技术 。 从该技术领域值得关注的问题出发,基于专家问卷对 NLP 和语音两大人类语言技术未来需要解决如下6个方面的具体问题: 1. 跨语种、小语种 ( 包括方言、俚语俗语 ) 问题 : 目前自然语言处理或语音技术的研究和应用主要都是针对单一语言或语 言对进行的。一方面,这导致了对于使用者不多的冷门语言或方言,研究投入通常相对较少,技术成熟度低,而这一类语 言通常又是掌握人数不多,相对更需要机器辅助的类型。另一方面,这使得相关的应用通常需要预设好使用场景语言, 而 对于多语言夹杂、混用的情况就相对乏力。与此同时,随着互联网时代的蓬勃发展,语言的更新换代迅速,不同年代 人交 流产生的俗语俚语都给自然语言处理带来了挑战。 2. 跨领域问题 : 与跨语种问题类似,自然语言处理或语音技术的研究与应用受场景语料限制,目前较为成功的应用集中在 新闻一类较为生活日常的使用场景,这也是由于互联网上新闻的语料数据较多。而对于医疗、法律、金融甚至具体到人工 智能等专业性相对强一些的垂直领域,无论是自然语言处理还是语音技术方面都尚有不小的发挥和挖掘空间。 3. 数据集欠缺问题 : 为了解决跨语种、跨领域的技术难题,研究层面的第一直觉便是增加扩展使用小语种、垂直领域的数 据集参与深度学习模型的训练。然而,符合要求的语料数据少之又少,构建相关的高质量数据集又面临着耗时耗力、标注 困难等问题。这就给对数据要求相对较低的半监督、无监督、自监督学习带来了机会。 4. 语义理解难题 ( 一词多义 ): 自然语言处理的问题很多时候根本上都是围绕如何进行语义理解,这里又涉及一个被多个专 家提及的问题,一词多义现象,尤其是中文,一句话里对应多种不同断句的不同涵义有时都可以解释得通,这时如何结合 上下文和语境理解语言真正要表达的意思便成为了主要的挑战。 图 2-3-1 人类语言技术领域热门技术词云图 29 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 5. 跨领域多轮嵌套式问答 : 跨领域多轮嵌套式问答与语义理解和跨领域都有一定的相关性,这是目前智能问答类任务普遍 存在的主要挑战之一。一方面,目前阶段的人工智能在面对语言提问时通常只能一次针对一个全新的问题,对于承接之 前 提问的多轮对话处理相对乏力 ; 另一方面,在回答嵌套连续问题时如果涉及到不同领域知识库的情况便会难上加难, 使得 智能 agent 难以判断该选取何种应对模式。 6. 集中在语音技术上的方言、噪声、多人说话、鸡尾酒会问题等特殊情况 : 具体到与信号处理有学科交叉的语音技术,尽 管语音识别是专家问卷反馈应用最为成功广泛的语言类技术任务,但仍然面临着诸多挑战和问题。一方面,与 NLP 任务类似, 受限于语言本身的特点,语音技术对于跨语言、小语种、方言俚语等特殊情况的识别能力同样有很大提升空间。 与此同时, 语音识别还面临着自身特点受限的例如场景内噪音、收音设备的音质影响,以及多人说话时的区分、定位和识别这类经典 的鸡尾酒会问题。 在解决上述问题方面,近年兴起的大规模预训练语言模型凭借其迁移方面的优势正在向解决这类问题的方向努力,谷歌在 去年发布的 Multilingual BERT(mBERT) 以维基百科为基础,训练了维基百科数量最多的前 100 多种语言,产出的模型在 近 15 个语种上都可以达到业界最佳的 SOTA 表现。今年 4 月谷歌更进一步,与 Deepmind、CMU 共同发布多语言、多任 务 NLP 新基准 XTREME,覆盖了 40 种不同类型的语言 ( 跨 12 个语系 ),并包含了 9 项需要对不同句法或语义层面进行推 理的任务。大规模预训练模型的进一步发展也正是该领域最受被访问专家关注的发展方向, 超大规模预训练语言模型加微 调 的范式有望进一步改进,对通用、多模态的自然语言处理和语音技术实现扩展和应用。与此同时,超大规模的预训练语 言模型也面临着模型大、资源消耗多等困境,如何 利用知识蒸馏、模型量化裁剪等方式对 NLP 模型进行压缩和优化 也 是 该领域未来值得关注的方向。 在语音技术方面,端到端的方法进一步成熟,一些学者开始使用单一的端到端模型(a single model)去实现多种任 务。端到端的特征提取和模型构建能够提供多种任务的解决方案,算法思路主要是基于 CTC(Connectionist Temporal Classification) 和基于注意力机制 (attention mechanism,通常也被称作为 Listen-Attend-Spell, LAS 模型 ) 的各类改良 模型,近年来随着 BERT 类无监督预训练的出现,语音技术也有望借助 transformer 的架构,通过大规模语料的预训练使 得语音技术的模型表现和泛用性更上一层楼。 综合来看,语音识别的发展趋势与自然语言处理类似,其本质上都是序列到序列的问题的处理,所以语音识别可以从 NLP 的实践中借鉴很多经验。因此无监督预训练的广泛推广和应用可谓人类语言技术未来几年的核心研究领域,除了目 前已经 收获颇丰的大规模预训练语言模型的研究之外,自监督学习领域目前最具代表性的框架对比学习 (Contrastive Learning), 致力于使用更少数据完成模型训练的少样本学习,以及结合知识图谱、图神经网络来构建新型 NLP 模型,探索如何更有效 地结合知识提升模型泛化能力,促进领域知识自动发现都有待进一步探索。 进一步结合具体的论文专利、新闻舆情等数据分析多个不同维度的数据分析项来看,人类语言技术方面整体有如下几点趋 势值得关注 : 1. 大规模预训练语言模型成为主流 如果说词向量打开了 NLP 深度学习的大门,那大规模预训练语言模型则是帮助深度学习彻底迈入了 NLP 技术的房间之中。 语言模型开始便是 NLP 任务的主要方法之一,在深度学习兴起后,先后经过词向量、端到端以及注意力模型的演进,大规 30 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 模预训练语言模型于 2018 年开始萌芽,并于 2019 年迅速席卷整个 NLP 领域,掀起了一股预训练研究浪潮,Transformer 也成为了主导的 NLP 深度学习架构。2020 年以来,该技术日渐成熟,并开始向多种不同的任务以及垂直应用领域扩展, 是近年来 NLP 领域最大的突破和有最多投入的研究领域。语音技术与自然语言处理有诸多共性,因此借助 NLP 的相关经 验正在加大预训练模型这个层面的研究,有望取得更大的进展和突破。 2. 语音识别技术相对其他 NLP 技术应用发展程度更高 在相关论文数量上,语音识别技术虽然是占比最多的技术任务,但相比同样数量可观的情感分析、机器翻译等自然语言处 理任务并没有明显的突出优势 ; 但是从相关专利数量方面来看,语音技术的相关专利数量则占比超过 50%,有着统治级别 的优势。智能语音是最早落地的人工智能技术之一,在 AI 技术相关产品中的应用也颇为广泛。深度学习技术的发展使得语 音识别的准确率从统计算法时代的 70% 左右跃升至 90% 以上,使之真正达到了可用的程度。作为目前人工智能相关技术 的主要入口之一,各大科技公司和智能语音产品的生产商也看到了其背后蕴含的广阔商机,纷纷注册专利、推出产品,抢 占市场。 3. 问答系统、聊天机器人相关应用趋势放缓,情感分析、文本分类增速不减 智能语音助手是问答系统、聊天机器人目前阶段的主要应用形态,最常见诸于智能手机、音箱以及汽车等移动终端,作为 人工智能技术主要的入口之一,目前的上升空间仍然很大,在相关论文数以及新闻关注度方面发展势头依然强劲。但是从 专利数据角度来看,该领域相关的技术在 2018 年达到顶峰后 2019 年新增的专利数量均有了明显的下降。机器翻译虽然是 NLP 领域在研究方面最具代表性的技术,但近五年的专利方面建树不大 ; 而情感分析、文本分类在论文、专利方面的数量 和增速均依旧很可观,应用领域的可能性非常广泛,仍然有不小发展潜力。 4. 跨领域融合越来越多 通过不同角度的技术分析我们发现,人类语言技术在不同层面的跨领域融合越来越多,集中体现在以下 3 个不同方面 : null 人类语言技术内部融合 : 主要是自然语言处理与语音技术的结合,语音技术的发展离不开自然语言处理技术的突破, 两者也面临着语言上共同的瓶颈与挑战。大规模预训练语言模型为这样的融合带来可能性,其已经在 NLP 领域不同子 任务间的泛用性方面取得了令人瞩目的成果,未来在语音技术方面的扩展应用值得期待。 null 语言技术与其他智能 AI 技术的融合 : 在一项技术本身达到一定的成熟度和可用性之后,便会开始看到其向外扩展融合 更多其他领域的技术以实现一些新型的技术方法或者应用 ,例如问答系统与计算机视觉和知识图谱的结合,便衍生出 了视觉知识问答(VQA)这一新型的技术任务研究领域,和基于知识的问答(KBQA)这样的技术方法。与此同时,语 言 技术的产出常常都是推荐系统的输入,影响着推荐的质量。可以预见,在我们离强人工智能越近的时候,语言技术与视 觉技术这样作为人类感知的重要技术领域就会与其他的相关技术领域产生更多的融合 null 不同垂直领域、使用场景的融合 : 前文也提到,目前的语言技术多数是限定使用场景下的弱人工智能,这与人类学会 语言后可以自由使用的特性有着较大区别,体现出目前的语言表示尚不能实现很好的语言理解泛化能力。预训练模型 的成功给我们以启发,无监督学习还大有可为。未来一套模型应对多个不同场景的翻译、问答任务,以及语音方面实 现跨设备“自由场景自由说”都是产业界和研究界共同努力的方向。 31 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 2-4 计算机视觉技术趋势 基于学界问卷的反馈,专家认为现在的机器学习都是基于大数据运算,没有革命性的进展,尤其是计算机视觉方面,最根 本的原因是基础神经科学的滞后,没有从本质上了解生物学的视觉认知,在没有解决这个问题前,专家不认为现在所谓的 人工智能会有突破性的进展。就计算机视觉现存的一些问题,如模型训练需要大量标签数据、 可解释性差等,专家认为可 以结合无监督学习,减少对人工标签的依赖 ; 针对可解释性做研究,模型的可解释性方面的研究一方面有利于隐私安全方 面的透明性,另一方面也有利于有针对性地对模型进行进一步优化,提高计算机视觉领域模型 的鲁棒性、泛化性。 结合专家意见与本次数据分析的相关结果,CV 领域整体有如下几个发现或趋势方向值得关注: 1. 深度学习成为计算机视觉主流方法,CNN 举足轻重 根据热词分析结果来看,计算机视觉相关内容在整个人工智能领域可以说是最火热的。在 2012 ImageNet 由深度学习方法 赢下之后,计算机视觉领域开始进入深度学习时代,其中,卷积神经网络为计算机视觉领域的发展注入了活力,绝大多数 模型都是基于 CNN。 2. 人脸识别应用越来越广泛,应用全面开花 近年来,人脸识别商业化落地十分成功,已经融入人们的日常生活,也被专家选为技术成熟度最高的技术任务。在论文、专利、 新闻舆论等各方面内容都占比较高。 3. 图像分割以语义分割为主 目前图像分割的研究主要集中在语义分割,而难点也在于语义,因为表达某一语义的同一物体并不总是以相同的形象出现, 这对精确分割带来了很大的挑战。在论文、专利分布上面,语义分割的数量远远大于实例分割的部分。 图 2-4-1 计算机视觉领域热门技术词云图 32 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 4. 三维视觉发力,点云是最常见技术之一 纵使 CNN 的特征提取能力极强,建立在 CNN 基础上的计算机视觉还是单目识别,而人类是双目。人类生活的世界是一个 三维的物理空间,拿着二维图像去做识别,这远远不够。三维视觉相关的论文、专利数量越来越多,新闻方面也有更多的报道。 技术方面,点云逐渐成为一项常用技术,在舆论中有很多的搜索量。 5. 预训练模型在视觉中的应用 对于希望学习算法或尝试现有框架的人来说,预训练的模型是一个很好的帮助。预训练模型可以很快地帮助你上手,如最 新的 YOLO、MobileNet 等。 6. 学习范式的创新 目前的机器学习框架的最大问题是对标注数据的依赖性,未来视觉领域的关注方向应该聚焦于探索解决训练数据瓶颈的技 术, 从多个数据源挖掘辅助信息来提高性能,以及对知识的积累和迁移,具体的学习范式有无监督、自监督、弱监督学习等; 除了上述的学习范式之外,还有一类小样本学习的思路是元学习方法。小样本学习中,小样本生成对抗网络、小样本目标检测、 跟踪领域也值得关注。联邦学习在计算机视觉领域也很有作用,联邦视觉能够让参与各方在不披露底层数据及其加密形态 下共建模型,学习中的隐私保护以及 AI 的偏见和公平性同样是值得关注的问题。 7. 模型压缩、搜索及优化 计算机视觉模型可以通过自动机器学习来进行神经网络架构搜索,获得性能更优的 CNN 结构,还可以结合模型压缩,获得 体积更小更容易部署的模型,还可以结合硬件特征协同考虑进行模型的设计。模型压缩、模型加速以及模型压缩方向的自 动化 ( 多种压缩方式的自动结合 ) 也是研究的方向。 8.CV 跨界 NLP,视觉问答成为新课题 除此之外,计算机视觉领域的边界不断拓展,逐渐开始与自然语言处理方面相交,衍生了视觉问答、图像描述生成等技术任务, 虽然其成熟度不如其他技术,但其相关论文数量保持了较高的增速,有非常大的发展潜力。 9.DeepFake 带来图像生成领域的新挑战 DeepFake 的相关新闻数量占比较高说明该技术火热,且因为其不道德和恶意方面的应用而臭名昭著,而关于如何检测是 否使用 DeepFake 的研究也将成为图像生成领域中隐私安全研究一大重要的课题。 33 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 2-5 机器人与自动化技术趋势 机器人与自动化领域涉及的技术面较广也较复杂,人工智能下多项子技术领域如计算机视觉、机器学习等都会对机器人与 自动化技术产生重大影响。根据机器之心对相关论文专利、新闻舆情分析,结合学界问卷的反馈来看,该领域目前有如下 几个角度值得关注: 1. 自动驾驶热度褪去,专注解决实际问题 从新闻舆论角度来说,自动驾驶技术相关的数据近年热度增长有所放缓,论文保持较高增长,而专利数量的增长依旧惊人, 可以推测企业和相关科研机构开始着力解决不同场景下自动驾驶面临的实际问题。例如,自动驾驶需要处理的数据量大, 实时性受限,可结合双目伪雷达,激光视觉多感知融合,并配合数据压缩等技术,提高 自动驾驶环境理解与认知 ;。 2. 机器人硬件提升与 AI 结合改变人机交互方式 机器人领域受诸多技术掣肘,如移动机器人在国产电机及传感方面性能有待提升;运动控制层面,受机械加工与组装的影 响较大,需要进一步提升性能;此外,柔性与自适用控制,力、视觉集成控制, 在柔性驱动上可提升人机交互的安全性与 舒适性。 智能机器人、服务机器人在专利方面总体都呈现上涨趋势,移动机器人将结合 AI 变得更加智能化,服务人们的生活。 随着技术整体的发展,从能够与机器交互开始转变为如何与机器更好地交互将成为一个新的议题。人类语言技术的发展, 使得语音交互技术更趋向人类自然对话体验 ; 对话机器人也会被精心设计性格,让他们更活泼自然。 3.RPA 开始加速发展,结合 AI 趋向智能自动化 机器人流程自动化在论文、专利、新闻、舆论方面都在持续增长,结合 AI 相关技术,可以突破传统机器人流程自动化能力 的边界,使得 RPA 趋向智能自动化。 图 2-5-1 机器人与自动化技术领域热门技术词云图 34 2020-2021 全球 AI 技术趋势发展报告(简要版) 机器之心 产业研究 2-6 机器学习技术趋势 从该技术领域值得关注的问题出发,结合专家问卷与相关数据分析结果,机器学习各子领域和子技术未来可能的发展方向 有如下几个方面 : 1. 深度学习仍是人工智能领域主流发展方向,仍有进一步开发和完善的空间 深度学习在近年来硕果累累,大部分专家认为“该技术已得到广泛应用并融入人们的社会生产、生活中”。但这项技术的 成熟 并不意味着学界和产业界对其兴趣的减小。虽然专利成果因技术瓶颈在 2019 年有所下降,舆情对深度学习的兴趣也 落后 于强势发展的强化学习和自动化机器学习,但从各方面的占比上看深度学习的热度依旧遥遥领先其他领域。 深度学习的可解释性、泛化性、普适性是存在已久的难点,针对以上痛点,专家们提出要加强小样本和元学习的研究。此外, 部 分受访学者也指出深度学习的理论研究需要继续深入和加强。在产业应用方面,来自跨境电商行业的专家指出“深度学 习在图片文本领域技术较为成熟,但在其他领域的应用还未得到充分的开发”。 2. 强化学习井喷式爆发 , 应用的开发力度尚需加大 对于深度神经网络无法解决的如何基于环境最大化预期收益的博弈问题,强化学习可以通过对智能体、环境、状态、动作、 奖励、 策略以及目标几大不同要素的深入研究,使得智能体可以模仿人类与环境的交互方式以获取最大奖励。强化学习的 自身特性加 上 DeepMind 等公司在该领域的推动,使得强化学习不管是在研究力度、专利成果、资讯和舆情 上都表现出色。 在受访专家看来,强化学习目前理论超前于应用,其应用上目前还局限于游戏和自动驾驶等小众领域,但其取 得的成绩是 令人瞩目的,其优秀的问题解决能力也使之成为当前发展速度仅次于深度学习的主流领域。 强化学习目前理论超前于应用,主要挑战集中在应用上 :1. 目前的落地应用比较局限,主要集中在游戏领域 ;2. 强化学习对 训练数据 量和计算量的要求极高,导致在实际应用中成本过高 ;3. 学习鲁棒性差,在机器人落地应用中效果不够强健 ;4. 针 对模型表现的测试难度较大,除非直接应用在实际场景中。对强化学习未来趋势分
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642