资源描述
中国人工智能产业路线图联合发布2017-2018 V1.02017-2018中国人工智能产业路线图 V1.0电话:(86)10-51661202地址:北京市朝阳区酒仙桥路10号院恒通商务园B8座二层 100015 网址:csdnLmJOEE 开篇语十多年前,所有的公司都在进行互联网化,现在CSDN作为一个20岁的互联网公司,从创立至今一直都是全球最大的中文IT社区,一路走来,见证了技术从PC到互联网,从互联网到移动互联网,从云计算到大数据的振奋人心的全过程。如今,技术大潮再次汹涌澎湃,在大数据、计算力和深度学习算法的共同推动下,已经有60年历史的人工智能迎来了发展的最好时期。此时所有的互联网公司又都在寻求智能化的变革:2016年,Google的战略从Mobile First转向AI First,Facebook、微软、亚马逊等也重金入局,而国内的百度喊出了“All in AI”,腾讯要“AI in All”,阿里则创立“达摩院”,纷纷重注AI。当然,看好人工智能的不只是科技巨头,有远见的传统企业和创业者也积极投身其中。但是,人工智能技术投入巨大,到底哪些技术能够落地,哪些还不成熟,要怎样实现从技术到商业的转换,成为所有玩家都在积极探索的问题,这些探索者里也包括一年前的CSDN。在这个历史使命的感召下,经过几年科技投资的淬炼后,我在2017年底重新回归CSDN。从开发者社区的视角审视这场AI浪潮,我的脑海里涌现出两个字:赋能。帮助开发者成为 I时代的开发者,帮助企业成为AI时代的企业,构建一个新形态的社区,把技术的创造者及使用者连接到一起。针对这个新使命,CSDN发布了人工智能技术路线图,同时还联合易观对多家企业进行了采访,并邀请到多名业内的专家为我们提出了宝贵的指导意见,描绘出AI产业进阶路线图,希望成为中国企业和产业实现AI转型升级的有益参考。我们希望把这样的一份报告做成活的路线图,时时维护,随时更新,动态开放。所有的企业都将互联网化,所有互联网企业都将AI化,未来十年,物联网将构建更先进的基础设施,AI将构建更先进的生产力,区块链将构建更先进的生产关系。CSDN会驾乘一轮轮的技术发展浪潮,与社区伙伴共同成长。2018年1月16日2017-2018 中国人工智能产业路线图 V1.02017-2018 中国人工智能产业路线图 V1.02重要发现我们在本次调研过程中主要有以下几大发现:1 CSDN首次推出AIMM企业智能化成熟度模型按照 AIMM企业智能化成熟度模型,可以将企业按照智能化的程度划分为 05级 6个发展阶段:0级 企业无信息化1级 数字化:企业核心流程标准化和数字化2级 商业智能:在业务中运用数据挖掘和数据分析,实现描述性分析3级 算法模型:企业运用机器学习算法建立模型,预测和优化决策4级 AI采用:在业务中使用 AI为基础的解决方案,实现创新和效率的提升5级 AI驱动:以 AI为核心的全新企业形态和商业模式2 AI投资热潮来临,然而超过五分之一的企业还未实现信息化2012年,我国的 AI投资事件共26 起,投资总额 6亿元人民币。 2017年, AI投资事件 384起,投资总额622亿元人民币,相比 2012年翻了上百倍。2017年, 22%的企业还未进行信息化改造, 51%的企业刚刚在核心业务中实现了核心流程标准化和数字化。Business ValueIntelligenceAIMM0无信息化AIMM1数字化AIMM2商业智能AIMM3算法模型AIMM4AI采用AIMM5AI驱动企业智能化成熟度模型(AIMM)V1.0(来源:CSDN)2017-2018 中国人工智能产业路线图 V1.033 AI人才需求迅速增长,薪酬比IT工程师高出一个等级2017年, AI类工程师在全部 IT技术招聘岗位中的占比为 9.86%,是 2014年的 8.8倍。10年以上工作经验的 AI工程师,最高年薪可达 140万,而 10年以上工作经验的普通 IT工程师的最高年薪还不到 55万。4 中美互有胜负:美国垄断AI芯片,中国在AI应用领域蓬勃发展中国在 AI芯片领域实力薄弱,玩家多为创业公司。而美国在这一领域既有英伟达、英特尔等重量级玩家,创业公司也层出不穷。中国在 AI领域除了 BAT之外,还诞生了包括商汤、旷视、云知声等在内新兴独角兽,融资额度甚至超过美国同行,支撑 AI应用蓬勃发展。5 金融、文娱、安防等领域向AI转型的条件最成熟,农业、制造业等还有待观察AI对各行业赋能需具备数据、计算力、算法、应用场景这四个要素,其中计算力属于通用基础设施。金融、文娱、安防等行业条件最成熟,农业、制造业等还在积累阶段。6 实现AI转型,明确应用场景是关键思考哪些业务可以成为 AI应用的场景,定义要清晰明确;根据确定的场景收集关键数据,同时注意数据结构化;根据企业自身情况,引入相关 AI专家或者第三方技术公司。0级 无信息化1级 数字化2级 商业智能3级 算法模型4级 AI采用5级 AI驱动22%31%20%13%6%8%CSDN企业智能化成熟度调查(数据来源:2017 CSDN中国软件开发者大调查)2017-2018 中国人工智能产业路线图 V1.0编委会出 品 方: CSDN 易观 出 品 人:蒋 涛 于 揚 总 策 划:孟 岩 孟迎霞 总 编 辑:谷 磊 编 写 组:周 翔 胡永波 何永灿 何 谦 王会娥 美术设计:纪明超 特邀专家组(按姓氏首字母排序) 柏文洁 肽积木创始人兼 CEO 初 敏 思必驰副总裁、北京研发院院长 党 壮 企名片创始人兼 CEO 李智勇 声智科技联合创始人 孟祥广 海康威视研究院解决方案经理 单 艺 猎聘首席数据官 王咏刚 创新工场人工智能工程院副院长 吴良军 海康威视高级系统技术工程师 叶向宇 旷视科技金融事业部技术总监 赵育颖 人工智能行业专家关注“AI科技大本营”回复“产业路线图”下载全文42017-2018 中国人工智能产业路线图 V1.05开篇语 1重要发现 2第 1章 AI发展报告综述 71.1 发展历程:风雨60年,历经两起两落,如今再次繁荣 71.2 国家政策: AI进入政府工作报告,上升到国家战略层面 101.3 产业图谱:产业分层已经明晰,“ AI+”蔚然成风 111.4 投融资现状:融资额逐年攀升,智慧金融领域最受资本青睐 141.5 人才分析: AI人才缺口进一步扩大,新手年薪最低 16.2万起 16第 2章 AI基础资源现状分析 202.1 AI基础资源 202.2 大数据:移动互联网造就海量数据,结构化数据依然缺乏 212.3 计算力: GPU成 AI芯片代名词, FPGA、 ASIC日受青睐 232.4 算法:深度学习助推 AI发展,语音识别、计算机视觉大跃进 24第 3章 AI基础技术现状分析 263.1 准确率超人类水平,语音将成下一个流量入口 263.2 自然语言处理大发展,交互式智能服务的风口即将到来 303.3 计算机视觉产业爆发,人脸识别最受关注 34第 4章 AI技术主要应用领域分析 414.0 产业升级关键要素及路线图 414.1 金融领域 AI应用分析 454.1.1 传统金融机构的痛点和现状 45目录 CONTENTS 2017-2018 中国人工智能产业路线图 V1.064.1.2 现阶段“ AI+金融”的应用场景 464.2 医疗领域 AI应用分析 524.2.1 传统医疗机构的痛点和现状 524.2.2 现阶段“ AI+医疗”的应用场景 534.3 智能家居领域 AI应用分析 564.3.1 现阶段智能家居的应用场景 564.3.2“ AI+家居”提升智能家居产品交互体验 574.3.3“ AI+家居”实现内容和服务的拓展 584.3.4“ AI+家居”未来趋势 59第 5章 行业应用典型案例 615.1 金融案例 615.1.1 智能投顾5.1.2 个性化推荐和营销 635.1.3 车险定损 655.2 医疗案例 685.2.1 语音电子病历 685.2.2 眼底筛查 705.2.3 癌症诊疗 725.3 家居案例 745.3.1 智能扫地机器人 745.3.2 智能音箱 76结语 78附录:参考文献 792017-2018 中国人工智能产业路线图 V1.07第1章 AI发展报告综述1.1 发展历程:风雨60年,历经两起两落,如今再次繁荣人工智能(Artificial Intelligence,简称 AI)是一门前沿交叉学科,目前还没有统一的定义。根据中国人工智能学会与罗兰贝格联合发布的最新报告,人工智能是一门利用计算机模拟人类智能行为科学的统称,它涵盖了训练计算机使其能够完成自主学习、判断、决策等人类行为的范畴。但是,人工智能并不是一个新的概念,它实际上诞生于20世纪50年代。在这60年间,人工智能的发展并不是一帆风顺,而是起起落落,先后经历了Pre-AI时代、黄金时代、第一次低谷、第二次繁荣、第二次低谷,我们目前正处于第三次浪潮之中。19501956 1980198719972000201220161960s197419801950年图灵发表论文,提出著名的图灵测试,预言了创造智能机器的可能性,成为AI史上第一个严肃提案。1956年达特茅斯会议聚集了最早的一批研究者,确定了人工智能的名称与任务,被称为AI诞生的标志。1974-1980年,AI发展遇到瓶颈,迎来第一次低谷。数据的缺失与算力的不足使得计算的复杂性难以被解决,因而陷入莫拉维克悖论。由于研究缺乏进展,期望落空,AI受到了业内的很多批评,政府也随之停止了资金的资助。由于XCON等最初大获成功的专家系统的实用性仅仅局限于某些特定场景,而且难以升级,维护费用也居高不下,导致第二波浪潮迅速由热转冷。由于对AI的高预期再次落空,政府开始大幅削减资助费用,认为AI并非下一个浪潮。2000年互联网发展进入拐点,数据量开始逐步增长。2016年AlphaGo战胜围棋选手李世石,再次将AI推向高点,资本加码、政策扶持的轮回再次开启。60年代期间,涌现了大批AI研究方向,包括搜索式推理、自然语言、机器视觉等。不少研究者对机器可在十年左右达到人类智能水平表示乐观,与此同时,英美政府每年也在研究经费上给予了百万级的支持。1980年,一款名为XCON的专家系统,因每年可为企业节省数千万美金受到热捧,进而带动了大公司在AI上的投入,为其供支持的产业也随之而生。日本、英国、美国等政府部门重新斥巨资投入AI,拨款高达亿级。至1987年人工智能又经历了短暂的繁荣期。1997年深蓝计算机战胜国际象棋冠军,成为AI历史上的里程碑事件。受到摩尔定律的影响,计算性能开始大幅提升。2012年深度学习算法通过ImageNet比赛名声大噪,进而被广泛采用。研究不聚焦且市场预期高 探索商业化但迅速被替代 基础设施就位,与应用紧密结合,仍存在非理性繁荣Pre-AI时代最初的人工智能研究其实是 30年代末到 50年代初的一系列科学进展交汇的产物。1943年,沃伦 麦卡洛克( Warren McCulloch)和瓦尔特 皮茨( Walter Pitts)首次提出“神经网络”的AI发展历史(来源:CSDN &易观)2017-2018 中国人工智能产业路线图 V1.08黄金时代:1956-1974达特茅斯会议之后的十数年里,人工智能迎来了第一个繁荣的发展时期。在这段黄金时代,很多在当时看来非常神奇的程序被渐次开发了出来,自此计算机具备了以下能力:概念。1950年,阿 兰 图灵( Alan Turing)提出了著名的“图灵测试”:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器则具有智能。直到如今,图灵测试仍然是人工智能的重要测试手段之一。1951年,马文 明斯基( Marvin Minsky)与他的同学一起建造了第一台神经网络机,并将其命名为 SNARC( Stochastic Neural Analog Reinforcement Calculator)。不过,这些都只是前奏,一直到 1956年的达特茅斯会议,“ Articial Intelligence”(人工智能)这个词才被真正确定下来,并一直沿用至今。AI诞生1956年的达特茅斯会议被广泛地认为是 AI诞生的标志性事件,其最重要的贡献是正式确立了人工智能的概念。此外,该会议还讨论了自动计算机、编程语言、神经网络、计算规模理论、自我改造(即机器学习)、抽象、随机性与创造性等诸多议题,掀开了人工智能各个研究方向波澜壮阔的历史画卷。2006年达特茅斯会议参会者50年后再聚首,左起:摩尔、麦卡锡、明斯基、塞弗里奇、索罗门诺夫2017-2018 中国人工智能产业路线图 V1.09解代数应用题证明几何定理学习和使用英语1957年,罗森布拉特( Frank Rosenblatt)提出“感知器( Perceptron)”,这是第一个用算法来精确定义的神经网络,也是日后许多新的神经网络模型的始祖。第一次AI低谷:1974-19801969年,马文 明斯基和西蒙 派珀特( Seymour Papert)共同出版了感知器:计算几何简介一书,书中论证了感知器模型的两个关键问题:第一,单层的神经网络无法解决不可线性分割的问题,典型例子就是异或门。第二,当时计算机的能力不足,无法满足计算量的需求。当然,除了这两个原因之外,传感数据不足也成为限制感知器进一步发展的重要因素。由于这些问题在当时无法得到解决,感知器的发展几乎停滞,以神经网络为基础的人工智能研究开始进入低潮,相关项目长期无法得到政府经费支持,这段时间被称为业界的“核冬天”。第二次繁荣:1980-198720世纪 80年代,“专家系统”开始由理论研究走向实际应用,人工智能迎来了又一波发展浪潮。专家系统一般采用人工智能中的知识表示和知识推理的技术来模拟通常由领域专家才能解决的复杂问题。1980年卡内基梅隆大学为 DEC( Digital Equipment Corporation,数字设备公司)设计了一个名为 XCON的专家系统,取得了巨大的成功,在那个时期,它每年可为该公司节省四千万美元。同时,日本政府也在积极地投资第五代计算机项目,旨在造出能够与人对话,翻译语言,解释图像,并且像人一样推理的机器。第三次AI浪潮:1993至今1994年,美国科学家 Jonathan Schaeffer的人工智能程序 Chinook第一次战胜西洋跳棋世界冠军。1997年 5月 11日, IBM公司的“深蓝”超级电脑战胜国际象棋世界冠军加里 卡斯帕罗夫( Garry Kasparov)。2017-2018 中国人工智能产业路线图 V1.0101.2 国家政策:AI进入政府工作报告,上升到国家战略层面中国的这一波人工智能热潮除了技术和商业的驱动之外,更离不开政府的推波助澜。2015年 5月,国务院印发中国制造 2025,其中“智能制造”被定位为中国制造的主攻方向,而这里智能的概念,其实可以看做人工智能在制造业的具象体现。2015年 7月,国务院印发国务院关于积极推进“互联网 +”行动的指导意见,其中人工智能是重点布局的 11个领域之一。时间 行政机关 相关政策 政策内容2015年5月 国务院 中国制造2025 提出“以推进智能制造为主攻方向”2015年7月 国务院国务院关于积极推进“互联网+”行动的指导意见将人工智能作为“互联网+”的十一个重点布局领域之一2016年3月 国务院国民经济和社会发展第十三个五年规划纲要(草案)提出要“重点突破新兴领域人工智能技术”2016年5月 发改委“互联网+”人工智能三年行动实施方案培育发展人工智能新兴产业,推进重点领域智能产品创新,提升终端产品智能化水平2016年7月 国务院 “十三五”国家科技创新规划提出“重点发展大数据驱动的类人智能技术方法”2017年3月 国务院 政府工作报告 人工智能首次被写入政府工作报告2017年7月 国务院 新一代人工智能发展规划提出了“三步走”的战略目标,宣布举全国之力在 2030 年抢占人工智能全球制高点2017年12月 工信部促进新一代人工智能产业发展三年行动计划(2018-2020年)促进人工智能产业发展,提升制造业智能化水平,推动人工智能和实体经济深度融合2015-2017 AI政策汇总 (整理:CSDN)2006年,杰弗里 辛顿( Geoffrey Hinton)提出“深度学习”。自此,人工智能进入了快速发展的阶段。2011年, IBM沃森参加“ Jeopardy!”节目,打败人类选手。2016年 3月, AlphaGo击败韩国九段围棋选手李世石, AI彻底走入大众的视野。与前两次不同,第三次人工智能的热潮迎来了全面商业化的爆发。互联网兴起产生的海量数据、以及摩尔定律带来的计算力的突飞猛进,推动了深度学习技术在人工智能领域的普及,并促进语音识别、图像识别等技术快速发展并且迅速产业化。2017-2018 中国人工智能产业路线图 V1.0112016年 3月,国民经济和社会发展第十三个五年规划纲要(草案)发布,国务院提出,要重点突破新兴领域的人工智能技术。2016年 5月,发改委、科技部、工信部和网信办联合印发“互联网 +”人工智能三年行动实施方案,提出到 2018年“形成千亿级的人工智能市场应用规模”。2016年 7月,国务院印发“十三五”国家科技创新规划。规划指出,要重点发展大数据驱动的类人智能技术方法;突破以人为中心的人机物融合理论方法和关键技术,研制相关设备、工具和平台;在基于大数据分析的类人智能方向取得重要突破,实现类人视觉、类人听觉、类人语言和类人思维,支撑智能产业的发展。2017年 3月,人工智能首次被写入国务院的政府工作报告,正式进入国家战略层面。2017年 7月,国务院印发新一代人工智能发展规划,提出了“三步走”的战略目标,宣布举全国之力在 2030年抢占人工智能全球制高点,人工智能核心产业规模超过 1万亿元,带动相关产业规模超过 10万亿元。2017年 12月,工业和信息化部印发促进新一代人工智能产业发展三年行动计划( 2018-2020年)。计划提出,以信息技术与制造技术深度融合为主线,以新一代人工智能技术的产业化和集成应用为重点,推进人工智能和制造业深度融合,加快制造强国和网络强国建设。可 以 看出,自 2016年以来,中国的人工智能政策密集出台,在全球竞争的背景下,人工智能已经上升为国家意志。未来,人工智能技术的产业化将是大势所趋。1.3 产业图谱:产业分层已经明晰,“AI+”蔚然成风和以往的几次兴盛不同,在这一波人工智能的浪潮里,产业公司替代大学或者政府的科研机构成为了主要的推动者。产业公司是需要盈利的,而人工智能需要持续地高昂投入,因此如何让技术变现是推动人工智能不断发展的重要支撑。在 2017年 3月发布的新一代人工智能发展规划里,国务院明确了市场主导的基本原则,强调要遵循市场规律,坚持应用导向,突出企业在技术路线选择和行业产品标准制定中的主体作用,加快人工智能科技成果商业化应用,形成竞争优势。该规划提出了“三步走”的战略目标:2017-2018 中国人工智能产业路线图 V1.0122020年:人工智能核心产业规模超过 1500亿元,带动相关产业规模超过 1万亿元。2025年:人工智能核心产业规模超过 4000亿元,带动相关产业规模超过 5万亿元。2030年:人工智能核心产业规模超过 1万亿元,带动相关产业规模超过 10万亿元。通常情况下,我们可以将人工智能产业划分为三层,分别是基础层、技术层和应用层。其中基础层是推动人工智能发展的基石,主要包括数据、芯片和算法三个方面,技术层主要是应用技术提供方,应用层大多是技术使用者,这三者形成一个完整的产业链,并相互促进。不过,很多企业(特别是大型科技公司)业务线较长,很多时候既是技术提供方,也是技术的使用者,因而很难有清晰的界定。为了相对全面的展现目前中国与美国的人工智能产业链布局情况, CSDN联合易观筛选了众多人工智能相关公司,绘制出以下两张图谱。图谱中的企业信息来自 IT桔子、 CB Insights、 Crunchbase及公开报道。对比下面的两张图谱我们可以得出以下结论:基础层方面,中国的实力还比较薄弱,尤其是芯片领域,玩家多为创业公司,而美国在这一领域多为英伟达、英特尔等重量级玩家,同时创业公司也层出不穷;在基础技术框架领域,国外有 Google、微软、 Facebook、亚马逊等,国内有百度、腾讯、阿里巴巴等;在数据领域,很多互联网公司本身就积累了海量数据,不过这些商业数据一般不会对外共享,而且这些公司也对标注处理后的有效数据存在需求,因此市场上存在第三方数据提供商,国内以海天瑞声为代表,美国则以 CrowdFlower为代表。技术层主要分为三个领域:机器学习、语音识别和自然语言处理、以及计算机视觉。其中除了 BAT等大玩家之外,语音识别和自然语言处理领域的代表公司有科大讯飞、云知声、思必驰等,计算机视觉领域的代表公司有商汤科技、旷视科技、依图科技等。它们中有很多已成为新兴的独角兽,融资额度甚至超过美国同行。在 AI应用领域,中国呈现出爆发的趋势,目前主要集中在安防、金融、医疗、教育、零售、机器人以及智能驾驶等领域。其中安防领域的代表公司有海康威视、大华等;金融领域有蚂蚁金服、众安科技等;医疗领域有医渡云、汇医慧影等;教育领域有科大讯飞、乂学教育等;零售领域有阿里、京东、缤果盒子等;机器人领域有大疆创新、优必选等;智能驾驶领域有百度、驭势等。2017-2018 中国人工智能产业路线图 V1.013应用层综合公司技术层基础层智能安防智能医疗芯片 技术平台/框架 数据中心服务 数据服务智能驾驶智能客服 智能家居 新零售智能教育 机器人智能金融 个性推荐及广告营销计算机视觉 语音识别及语义处理 机器学习中国人工智能产业图谱V1.0(来源:CSDN & 易观)应用层综合公司技术层基础层智能驾驶智能金融 智能客服 智能教育 机器人 新零售智能家居芯片 技术平台/框架 数据中心服务 数据服务智能医疗 个性推荐及广告营销计算机视觉 语音识别及语义处理 机器学习美国人工智能产业图谱V1.0(来源:CSDN & 易观)2017-2018 中国人工智能产业路线图 V1.014其他金融制造业电商健康医疗社交媒体交通物流游戏娱乐教育安防能源零售17%16%10%9% 9%7%7%7%6%5%5%3%AI与各行业的结合情况(数据来源:2017 CSDN中国开发者大调查)2012-2017 AI融资趋势(数据来源:IT桔子)1.4 投融资现状:融资额逐年攀升,智慧金融领域最受资本青睐IT桔子统计的数据显示,从 2012年至今,我国 AI领域共有 1354家公司,投资事件 1353起,投资总额为1448亿人民币。2012年,我国的 AI投资事件共 26起,投资金额为 6亿元人民币。到了刚刚结束的 2017年,投资事件已经高达 384起,投资总额已经超过 622亿元人民币,相比 2012年翻了上百倍。不过,相对 2016年, 2017年的投资事件只增加了一起,但是投资总额大幅上升。2012投资事件数融资额2013 2014 2015 2016 201750100150200250300350400450500100亿 50亿 150亿 200亿 250亿 300亿 350亿 400亿 450亿 500亿 500亿 550亿 600亿 投资事件数 融资额2017 CSDN中国开发者大调查的数据显示, AI技术正在与各个行业的业务发生着融合促进,其中金融、制造业、电商、医疗等行业占比最高。可见,虽然在基础领域,中国与美国还存在一定差距,但是在商业化应用方面,中国已经多点开花,大有赶超之势。2017-2018 中国人工智能产业路线图 V1.0152012-2017 AI融资汇总(数据来源:IT桔子 注:某些公司可能横跨多个领域,因此存在重复统计的情况)据统计,自然语言处理领域共有 185家公司, 6年间投资事件 223起,总投资额为 241亿人民币;今日头条、搜狗、出门问问位列融资额度前三甲。计算机视觉领域共有 139家公司, 6年间投资事件 182起,总投资额为 225亿人民币;美图秀秀、商汤科技、旷视科技位列融资额度前三甲。按应用领域划分,那么金融、汽车、医疗和文娱领域最受资本青睐,其中智慧金融领域以 434亿人民币高居融资额榜首,智能汽车和智慧医疗领域分别以 349亿和 294亿紧随其后。应用领域 公司数量 投资事件数量 投资额(亿人民币)智慧金融 124 205 434智能汽车 146 218 349智慧医疗 166 214 294文娱行业 84 109 258智慧教育 134 171 248智能安防 97 116 146智能家居 93 119 132城市交通 81 78 103智慧农业 57 47 83智慧旅游 33 45 78智慧零售 25 38 70智能制造 182 144 37智能媒体 24 41 26物流仓储 91 50 13智慧法律 19 17 7从时间维度来看,智慧金融、智慧医疗、智能汽车这几个领域的融资从 2014年就开始呈现爆发的趋势,最近两年更是达到了一个高峰,而传统的制造、家居等行业从 2015年开始也日益受到资本的青睐,不过农业、法律等行业依然处在蛰伏期,但是我们预计未来这些冷门领域也将迎来自己的机遇。应用领域 2012 2013 2014 2015 2016 2017智慧金融智能汽车智慧医疗文娱行业智慧教育智能安防智能家居城市交通智慧农业智慧旅游智慧零售智能制造智能媒体物流仓储智慧法律各行业人工智能投资热度图V1.0(数据来源:IT桔子)投资总额:投资事件数: 高 多 少低2017-2018 中国人工智能产业路线图 V1.0161.5 人才分析:AI人才缺口进一步扩大,新手年薪最低16.2万起AI产业的迅速发展,引发了一场人才争夺战,根据猎聘的统计, 2017年 AI技术类工程师的招聘量是 2014年的 8.8倍。 2014年, AI类工程师和数据类工程师在全部 IT技术岗位中的占比分别是 2.97%和 7.86%,这一数字到 2017年分别涨到了 9.86%和 17.59%。数据工程师的技术岗位占比变化(百分比)AI工程师在技术岗位中占比变化(百分比)0246810122014 2015 2016 2017141618207.86% 2.97%3.75%5.94%9.86%9.75%13.38% 17.59%2014-2017 AI工程师招聘需求占比变化(数据来源:猎聘)2017-2018 中国人工智能产业路线图 V1.017AI各细分领域的招聘量也逐年攀升,而且薪资比 IT技术岗位要高上许多。根据猎聘的数据, 2016年以来公开发布的招聘岗位中, IT工程技术类的平均年薪为 17.92万,而 AI领域知识图谱方向的最高年薪可达 43.42万,其平均年薪也高达34.06 万,接近 IT工程技术类的两倍。而 AI细分 领 域中,除了知识图谱,平均年薪较高的依次是自然语言处理、语音识别、机器学习和计算机视觉。403020100知识图谱34.0631.7131.2230.2127.8117.92语音识别 机器学习 计算机视觉 IT工程技术类自然语言处理AI细分领域技术岗位与IT技术岗位平均年薪对比年薪(万元)2016-2017 AI细分领域岗位与IT技术岗位平均年薪对比(数据来源:猎聘)2017-2018 中国人工智能产业路线图 V1.018CSDN社区统计的数据显示, 2015年到 2017年间, AI开发者从 5万增长到了 18万,可见 AI之热,然而有经验的 AI工程师仍然极度缺乏,其年薪也随着从业时间的增长而急剧增加。工作不满一年的新手,最高年薪为 28.7万,最低年薪也有 16.2万,而有着十年以上工作经验的 AI工程师,最高年薪可达 140万。相比之下,具有 10年以上工作经验的普通 IT工程师的最高年薪还不到 55万。工作经验与AI岗位薪酬之间的关系(数据来源:猎聘)1401301201101009080706050403020100一年以下年薪(万元)从业时间1-3年 3-5年 5-8年 8-10年 10年以上AI工程技术类年薪上限 AI工程师类年薪下限IT工程师类年薪上限 IT工程技术类年薪下限2017-2018 中国人工智能产业路线图 V1.019目前,按行业划分,对 AI人才需求最大的依然是互联网行业,占比超过 73%,其次是电子、汽车、金融等领域。对 AI人才需求最少的则是政府、农林牧渔这些领域。按地域划分, AI人才需求分布非常集中,北京占比 42.60%,上 海、深 圳 分 列二 三 位,占 比 分 别为17.02%和 11.43%。而阿里巴巴总部所在地杭州则排在了第四位,占比 7.08%。73%9%6%4%5%1%2%互联网游戏软件电子金融制造业医药文化传媒其他各行业AI工程师需求占比 (数据来源:猎聘)AI工程师地域需求占比(数据来源:猎聘)50.0%12.5%25.0%37.5%北京 上海 深圳 杭州 广州 其他42.60%17.02%11.43%7.08%4.76%17.11%AI工程师地域占比图腾讯研究院发布的人才报告显示, 2017年的前 10个月,企业对 AI人才的需求量已经达到 2016年的近两倍, 2015年的 5.3倍,目前 AI人才缺口至少在 100万以上。随着人工智能产业的进一步发展,我国 AI人才的缺口或进一步扩大,而且由于我国对 AI的研究起步较晚,企业对 AI人才学历的要求较高,因此 AI人才急缺的情况在未来几年将无法改善, AI人才的薪酬也预计会进一步水涨船高。2017-2018 中国人工智能产业路线图 V1.020第2章 AI基础资源现状分析2.1 AI基础资源纵观人工智能的发展历程,几次起落很大程度上受到业界对人工智能的认知变化及市场预期的影响,但究其根本还是在于技术的局限性。没有基础设施的供给,人工智能的所有设想将沦为幻想。当前人工智能主要致力于训练机器看懂图像、听懂语言、处理大数据,实现人机自然交互,辅助人类进行决策,最终实现自我决策。而支撑这一目的的基础要素可以归纳为三点,即数据、算法、算力,此三点缺一不可。关于这三者的关系,吴恩达曾有一个著名的比喻:发展人工智能就像用火箭发射卫星,需要强有力的引擎和足够的燃料,如果燃料不够,火箭无法将卫星推到合适的轨道;如果引擎推力不够,火箭甚至都不能起飞。而这当中,算法模型就好像引擎,高性能的计算机是打造引擎的工具,海量的数据就是引擎的燃料。人工智能算法 硬件 数据工程学方法 模拟法 GPU FPGA ASICAI基础资源(来源:CSDN)2017-2018 中国人工智能产业路线图 V1.0212.2 大数据:移动互联网造就海量数据,结构化数据依然缺乏互联网催生了大数据,而大数据则催生了人工智能。数据是训练人工智能的必备燃料,在现阶段人工智能的发展水平下,数据的规模和质量直接决定了模型的训练效果。2005年,在美国国家标准与技术研究所举办的机器翻译软件评测中,在该领域初出茅庐的 Google成为了最大的黑马,在 BLEU分值(一种机器翻译的评价准则)上大幅超越 IBM、德国亚琛工学院等诸多老牌机器翻译机构。赛后, Google公布了获胜的秘诀:他们使用了比其他团队多上万倍的数据!但是,在人工智能发展的早期阶段,获得大量的数据并非易事,甚至成为 AI发展历程中难以克服的掣肘。但这一问题正随着数据时代的到来而得到缓解,特别是联网设备的爆发和服务生态的完善使得数据来源增多,促使数据呈指数式增长。 IDC的 数 据 显 示,自 2010年全球数据量突破 1ZB( 1ZB为 1万亿 GB)以来, 2016年这一数据已达到 16.1ZB。 IDC预计,未来数据量的 CAGR(年度复合增长率)高达 30%,相应地, 2025年数据量将会达到 163ZB。需要说明的是,仅关注数据规模还远远不够,只有结构化的数据对于训练人工智能才有意义。结构化数据的获取可以分为数据采集、清洗、标注、建模等几个流程,这考验着研究者收集数据和处理数据的能力。目前海量的有效数据主要掌握在互联网巨头手中,在已经到来的人工智能时代,由于马太效应的存在,凭借这些宝贵资产,他们可以和用户形成良性的数据闭环,从而强者恒强。2010年1.22016年 2025年1801601401201008060402016.1163单位:ZB2010-2025 全球数据规模增长趋势(数据来源:IDC)2017-2018 中国人工智能产业路线图 V1.022另一方面,更多的从业者其实面临着数据短缺的尴尬境地。这些从业者主要分为两类:传统企业和AI创业公司。传统企业由于在其所在的行业深耕多年,拥有大量的原始数据。但它们往往并不注重数字资产治理,这些宝贵的数据往往像待开采的矿石一般被低效地利用,并未被结构化。对于此类企业,我们建议其与平台或技术社区合作,将已有的数据充分利用起来。例如,作为中国最大的图片提供商,视觉中国拥有海量的已标注数据资源,这些数据在过去很长一段时间都是人工标注的。如今,视觉中国已经与 CSDN的一站式 AI服务平台 TinyMind( tinymind)展开合作,以寻求更加快速的解决方案。比起传统企业, AI创业公司对数据的渴求更加强烈,对于此类公司,目前较为常见的训练数据来源主要有三种:学术界和大公司对外开放的免费数据库。以计算机视觉为例,其中最为知名的是斯坦福大学李飞飞副教授创立的 ImageNet。经过多年的积累, ImageNet通过众包的方式积累了 2万多种类别的 1400多万张图片,是目前世界上最大的图片数据库。另外, Google作为开源大户,于 2016年相继对外开放了自然语言数据库、视频数据库、图片数据库。通过第三方数据供应商或众包平台购买或定制数据。对数据的需求促进产业生态进一步完善,催生了专业的第三方服务供应商,国内较为知名的有海天瑞声、数据堂等。另外,需求者还可以通过众包平台发布任务,聚集平台上的闲散廉价人力为己所用,如 CrowdFlower、亚马逊的 AMT( Amazon Mechanical Turk)、百度众包平台等。自行采集实际数据或模拟数据。对于某些特殊场景,现有的数据积累不足或无法满足需求,则需要厂商自行采集数据。典型场景,如自动驾驶。名称 来源 说明MNIST纽约大学、Google、微软研究人员共同创立手写数字数据库6万个训练样本集和1万个测试样本集ImageNet 斯坦福大学 1400多万张图片,2万多种类别Open Image Google 900万张标注数据,6000多种标签类别COCO 微软 超过30万张图片,80种物体类别YouTube-8M Google 800万个标注视频,50万小时总时长,4800种类别计算机视觉开源数据库举例(来源:CSDN & 易观)2017-2018 中国人工智能产业路
展开阅读全文