资源描述
2018 人工智能核心产业发展白皮书 赛迪顾问股份有限公司 2018 年 11 月 2018人工智能核心产业发展研究报告 目录 一、 人工智能技术内涵 . 3 (一)人工智能的定义 . 3 (二)人工智能的主要理论范式及技术演进 . 3 1. 人工智能的发展 的早期理论背景 . 3 2. 人工智能的两种范式的发展 . 4 3. 人工智能发展的技术约束条件 :算法、硬件算力和数据 . 5 (三)人工智能两大核心技术领域的特点 . 8 (四)人工智能技术面临的理论问题 . 9 (五)发展趋势 . 9 二、 人工智能的核心产业 . 11 (一)人工智能核心产业的定义 . 11 (二)人工智能核心产业统计口 径 . 12 (三)人工智能产业链分析 . 14 1、基础层 . 14 2、技术层 . 18 3、应用层 . 20 (四) 行业 应用分析 . 23 1、智能金融应用中典型模式与挑战 . 23 2、智能驾驶应用中典型模 式与挑战 . 25 3、智能医疗应用中典型模式与挑战 . 30 4、工业互联网应用中典型模式与挑战 . 37 (五)行业演进趋势分析 . 39 1、巨头加速布局,打造生态闭环 . 39 2、高校跨界创新成为新趋势 . 42 3、政策先行推动应用部署 . 44 三、 国内外人工智能产业发展的比较分析 . 46 (一)全球人工智能发展态势分析 . 46 1、人工智能产业成为国际 竞争新焦点 . 46 2、全球人工智能发展集中在四大区域 . 47 3、研究机构在人工智能发展中起引领作用 . 51 (二)国内重点区 域人工智能产业现状分析 . 53 1、国内重点城市人工智能发展措施 . 53 2018人工智能核心产业发展研究报告 2、重点地区人工智能产业创新实践 . 55 (三)中美人工智能发展要素对比分析 . 59 四、 展望与赛迪建议 . 63 (一)展望 . 63 1、开源化浪潮将成为中国人工智能操作系统争夺主战场 . 63 2、 人工智能产业将与智慧城市建设协同发展 . 63 3、中国人工智能应用将在服务机器人领域迎来突破 . 63 (二)赛迪建议 . 64 2018人工智能核心产业发展研究报告 一、 人工智能技术内涵 (一) 人工智能的定义 马文明斯基:将人工智能定义为让机器做本需要人的智能才能做到的事情的一门科学。 约翰麦卡锡:人工智能就是要让机器的行为看起来就 像 是人所表现出的智能行为一样。 美国麻省理工学院温斯顿:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。” 这些说法反映了人工智能学科的基本思想和基本内容,即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。 (二) 人工智能的主要理论范式及技术演进 1. 人工智能的发展的早期理论背景 上世纪 40 年代主要的理论包括: M-P 模型,冯诺伊曼自动机理论,维纳控制论。其中, McCulloch 和 Pitts 在人工神经网络方面做出了突出贡献,发表了神经系统中所蕴含的思想的逻辑演算,提出 了形式神经元的数学描述和结构方法,建立了神经网络最早的M-P 模型。冯 诺依曼从 1940s 开始一直在领导计算机,在去世之前一直是计算机和人工智能的领导者。当时,冯诺伊曼在 Princeton大学聚集了一批计算理论、博弈理论、智能理论和机器人理论的未来领袖,包括麦卡锡、明斯基等,这些人后来成为人工智能的主要领导人物。 2018人工智能核心产业发展研究报告 1953 年,麦卡锡和香农在编辑自动机研究一书时与香农相互争论。 1956 年,麦卡锡提出人工智能的概念,现在大部分认为人工智能的起源是 1956 年的达特茅斯会议,它是第一个以人工智能为名的会议,是在冯诺依曼的支持下,明斯基和麦卡锡等人召开的。20 世纪 50 年代,真正重要的会议是美国东西部的计算机大会。分别由 MIT 和 UCLA 领导。早期,在 M-P,冯 诺伊曼和明斯基的理解中,符号主义和联结主义是统一的,但因为工程角度找 trick 很难,线性异或问题很难发现,研究的领域越来越狭窄,人工智能发生了研究范式的分化。 2. 人工智能的两种范式的发展 符号主义和联结主义平行发展,但在不同的历史时期,两种主义相继占据主流地位: 第一代人工智能:符号主义 ,又称逻辑主义和物理符号系统假设。符号主义是以逻辑作为工具,发展起来的人工智能一派理论。符号主义在刚开始占据主流地位,是因为联结主义所需要的算法算力数据三大条件不具备。 1969 年明斯基和 Papert 在 Perception 当中,提出一个重大困难,即单层的 MP 模型解决不了异或( XOR)问题,造成了人工智能的第一低潮。在该时期,基于符号主义的专家系统,如深蓝( Deep Blue)成为当时 人工智能发展的典型代表,该系统是一个基于两人零和组合博弈的人工智能系统,该系统的核心技术是麦卡锡发明的 Alpha-Beta 剪枝术和专家系统,在 1997 年战胜了世界象棋冠军卡斯帕罗夫。 符号主义没有产生跟联结主义一样强大的工具,因为没有联结主义灵活。所以只有专家系统和深蓝。而专家系统是在解决让计算机认2018人工智能核心产业发展研究报告 识世界的过程中遇到很多困难。 第二代人工智能:联结主义 ,是一种基于神经网络及网络间的连接机制与学习算法的智能模拟方法,核心是神经元网络与深度学习,仿造人的神经系统,把人的神经系统的模型用计算的方式呈现,用它来仿 造智能,目前人工智能的热潮实际上是联结主义的胜利。研究重点侧重于模拟和实现人的认知过程中的感觉、直觉过程、形象思维、自学习过程。 联结主义是以统计方法为基础发展起来的人工智能一派理论。1986 年, 通过反向传播( Back Propagation)的方法来训练, 多层感知机解决了单层感知机解决不了的问题,但由于算法、算力和数据三大条件依然均不具备,联结主义的发展经历了漫长的复兴。 90 年代中期,由于核方法和图模型的效果好于人工神经网络( ANN),再加上基于 ANN 的创业公司无法实现其宣称的预期效果,联结主义进入第二次 低潮。 2006 年, Hinton 发明了深度训练网络,使用的技术是贪婪逐层预训练,起到了普及了深度学习的概念。深度学习复兴了联结主义。在2012, Hinton 小组拿到了李飞飞创办的 ImageNet 比赛的第一名。深度学习爆发了,联结主义回归。当时,算法、算力和数据得到极大发展,深度学习迎来了春天。 2016 年 AlphaGo 战胜李世石,其核心技术是随机二人零和组合博弈。其中的神经虚拟自我学习( NSFP),深度强化学习( DRL),蒙特卡洛树搜索 (MCTS),开启了人工智能发展的新时代。 3. 人工智能发展的 技术约束条 件 :算法、硬件算力和数据 算法、数据和硬件算力组成了人工智能高速发展的三要素。三要2018人工智能核心产业发展研究报告 素缺一不可。人工智能到最近才开始呈现爆发的主要是因为直到今日,人工智能的算法、数据和硬件才满足了人工智能的基本需求。 第一个是优秀的算法,比如现在最流行的深度学习算法,就是近期人工智能领域中最大的突破之一,为人工智能的商业化带来了希望 ;第二个是大量高性能硬件组成的计算能力,以前的硬件算力并不能满足人工智能的需求,当 GPU 和人工智能结合后,人工智能才迎来了真正的高速发展;第三个是被收集的大量数据,数据是驱动人工智能取得更好的 识别率和精准度的核心因素。以人脸识别为例, 在 2013年深度学习应用到人脸识别之前,各种方法的识别成功率只有不到 93%,低于人眼的识别率 95%,因此不具备商业价值。而随着算法的更新,深度学习使得人脸识别的成功率提升到了 97%。这才为人脸识别的应用奠定了商业化基础。 算法方面 ,随着深度学习理论和工程技术体系的成熟,包括通过云服务或者开源的方式向行业输出技术,先进的算法被封装为易于使用的产品和服务,越来越多的人和公司能够开始使用这些算法。人工智能相关的技术包括了水平层和垂直层的技术,水平层面上主要体现在算法 方面。进入互联网时代后,才出现了大数据的高速发展与积累,这为人工智能的训练学习过程奠定了良好的基础。比如,在 AlphaGo的学习过程中,核心数据是来自互联网的 3000 万例棋谱,而这些数据的积累是历经了十多年互联网行业的发展。所以直到今年,基于深度学习算法的 AlphaGo 才取得突破性进展。离开了这些棋谱数据的积累,机器战胜人是无法实现的。 算力方面 ,云计算的兴起起到了非常关键的作用。因为深度学习是极其消耗计算资源的,而通过云计算就可以以低成本获取大规模的2018人工智能核心产业发展研究报告 算力,动态地获取几千个 CPU,甚至上万个 CPU 的算力都很 轻松。除了云计算之外, GPU计算的进步对深度学习也有很大的推动作用,它能够加速深度学习中的计算速度,有些情况下甚至成百上千倍的提高。例如,现在深度学习的算法涉及到了大量可以并行化的矩阵运算,而 GPU 的工作方式就是多核并行计算流的方式,这个特点特别适合于人工智能领域中的计算。此外,一些面向人工智能的专用硬件架构也开始出现,比如说用 FPGA 去做专用的人工智能加速芯片和加速的基础设施,微软的数据中心就大量运用了 FPGA 技术。在二十年前,一个机器人,当时是用 32 个 CPU, 达到 120MHz 的速度。现在的人工智能系统 使用的是成百上千个 GPU 来提升的计算能力。这使得处理学习或者智能的能力得到比较大的增强。之前用 CPU 一个月才能出结果,然后再去调整参数,一年只能调整 12 次,也就是有 12 次迭代。 GPU 产生后大幅提升了计算量,现在用 GPU 可以一天就出结果,这样可以迭代的更快,这是技术大幅发展的条件。 数据方面 ,近年来由于移动互联网的爆发,积累了大量的数据,同时物联网也极大的扩展了获取数据的数量和类型。事实上,相比较于算法和算力,数据的获取会更难一点。因为它是建立在已有业务基础上的,以往我们都是先通过非人工智能的方式积累大量的 数据,而现在初创企业要去获得它就需要一些巧劲。每个时代都要解决不同的问题,今天人工智能公司也一样需要去解决问题,就怕打着人工智能的旗号,做一些不接地气的事,不能够为用户解决实质性问题。进入互联网时代后,才出现了大数据的高速发展与积累,这为人工智能的训练学习过程奠定了良好的基础。 只有当以上三方面都做好准备的时候,人工智能时代才能真正地2018人工智能核心产业发展研究报告 到来。而现在是三个要素刚刚开始具备的起点。 (三)人工智能两大核心技术领域的特点 1. 知识图谱 知识图谱的核心是通过推理规则来实现知识推理。利用推理规则实现关系抽取的经典方法是 Path Ranking Algorithm,该方法将每种不同的关系路径作为一维特征,通过在知识图谱中统计大量的关系路径构建关系分类的特征向量,建立关系分类器进行关系抽取,取得不错的抽取效果,也成为近年来的关系抽取的代表方法之一。但这种基于关系的同现统计的方法,面临严重的数据稀疏问题。 在知识推理方面还有很多的探索工作,例如采用谓词逻辑( Predicate Logic)等形式化方法和马尔科夫逻辑网络( Markov Logic Network)等建模工具进行知识推理研究。目前来看,这方面研究仍处于百家争鸣阶段,大家在推理表示等诸多方面仍为达成共识,未来路径有待进一步探索。 2. 深度学习 深度学习是通向人工智能的途径之一,是一种特定类型的机器学习,一种能够使计算机系统从经验和数据中得到提高的技术机器学习可以构建出在复杂实际环境下运行的 AI 系统,并且是唯一切实可行的方法。深度学习一种适应性人工神经网络形式,通过 back propagation 反向传播的方法来训练,具有强大的能力和灵活性。它将大千世界表示为嵌套的层次概念体系(有较简单概 念间的联系定义复杂概念、从一般抽象概括到高级抽象表示)。深度学习有着悠久而丰富的历史,但随着许多不同哲学观点的渐渐消逝,与之对应的名称也渐渐尘封。算法、算力、数据的发展,让深度学习的能力不断增强。2018人工智能核心产业发展研究报告 随着可用的训练数据量不断增加,深度学习变得更加有用;随着计算机软硬件及基础设施的改善,模型的规模也随之增长。 (四)人工智能技术面临的理论问题 深度学习算法,仅仅从纯工程和技术层面进行研究,出现了很多问题,比如说黑箱化,不可解释,不可理解。要解决这些问题必须从智能科学的基本原理谈起。 用重复博弈理论解释信息瓶颈理论 (information bottleneck theory)。信息瓶颈理论,需要计算方差和均值的比例,深度学习有很多层级,每往前走一层,信号越来越强,噪音越来越弱,信噪比越来越大,重复前面一层的重复博弈,需要计算信噪比。获得了对对象的整体认知。重复博弈放前面,每重复一次,信号越来越强。因此,需要新的理论创新。 (五)发展趋势 斯坦福大学李飞飞认为:物理学已有几百年的发展历史,如果牛顿力学作为重要时间点的话,那么人工智能“还没到达牛顿时期”。截至目前,人工智能还没有一套完整的理论体系,“我认为现在人工智能只 能是伽利略时代,甚至比伽利略时代还要洪荒”。从工业时代的领袖学科是物理学,信息时代应该是智能科学。有了智能科学以后,才能推出人工智能技术,产业和社会。国际上一些科学家,如斯坦福大学的张首晟、 Facebook 的 Yann LeCun, Cornell 的 John Hopcroft、清华的姚期智等等,都认为应该探索人工智能背后的科学原理。例如,内燃机背后的科学原理是热动力学,飞机设计背后的原理是空气动力学。杨立昆提出问题:人工智能和机器人,背后的原理是什么?这是当前全球人工智能界面临的重大科学问题。
展开阅读全文