2019年人工智能AI视觉与语音专题分析报告.doc

返回 相关 举报
2019年人工智能AI视觉与语音专题分析报告.doc_第1页
第1页 / 共23页
2019年人工智能AI视觉与语音专题分析报告.doc_第2页
第2页 / 共23页
2019年人工智能AI视觉与语音专题分析报告.doc_第3页
第3页 / 共23页
2019年人工智能AI视觉与语音专题分析报告.doc_第4页
第4页 / 共23页
2019年人工智能AI视觉与语音专题分析报告.doc_第5页
第5页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2019年人工智能 AI视觉与语音专题分析报告 2019 年 03 月 19 日 内容目录 1.计算机视觉 : AI 行业最具商业化价值的赛道 . 4 2.智能语音:产业进入爆发期,看好对话式人工智能发展 . 10 3.重点公司介绍 . 17 商汤 : AI 算法提供 商龙头,平台化战略赋能公司和行业 . 17 旷视:优秀的人脸识别平台企业,战略进军 AIoT .19 依图:注重实战,业务聚焦于安防和医疗 20 云从 : AI 国家队,银行、机场人脸识别产品第一大供应商 . 21 云知声 : 云端芯 战略,重点布局家居、车载及医疗三大领域 . 22 4.风险提示 . 22 图表目录 图表 1:全球 AI 企业应用技术方向分布 . 4 图表 2:中国 AI 企业应用技术方向分布 . 4 图表 3: 2017 年 全 球 AI 市场结构 . 4 图表 4: 2017 年 中 国 AI 市场结构 . 4 图表 5: 2017-2022 线上视频流量和非视频流量占比 . 5 图表 6:计算机视觉架构及各层级玩家示意 . 5 图表 7: 2017 年中国计算机视觉应用市场份额 . 6 图表 8:我国安防行业十年 CAGR 达 16% . 6 图表 9:我国安防行业市场结构 . 6 图表 10: 2018 年全球计算机视觉行业市场结构 . 7 图表 11: ImageNet 竞赛深度学习算法隐含层数与图像识别错误率变化趋势 .8 图表 12:全球 AI 人才分布 . 8 图表 13:中国 AI 人才分布 . 8 图表 14: AutoML 工作原理(红色部分自动完成) . 9 图表 15: AutoML 内部工作机制 . 9 图表 16:语音识别已进入 实质生产高峰期 . 10 图表 17:智能语音市场将维持高速增长(单位:亿美元 ) . 10 图表 18:全 球智能语音市场格局 . 11 图表 19:中国智能语音市场格局 . 11 图表 20:近几年语音识别准确率变化 . 11 图表 21:头部智能语音初创企业首款专用芯片发布梳理 . 12 图表 22:对话式人工智能人机交互流程 . 12 图表 23:对话式人工智能生态图谱 . 13 图表 24:美国语音助手使用场景统计 ( 2018 年 9 月) . 13 图表 25:中国用户对对话式人工智能终端的期望度 . 14 图表 26:对话式人工智能在随身设备、智能车载、智能家居中的渗透 率 . 14 图表 27:近三年全球智能音 箱出货量情况 . 14 图表 28:全球智能语音助手市场份额预测 . 15 图表 29: Microsoft 申请的 silent voice input 专利 . 16 图表 30:商汤业务布局梳理 . 17 图表 31:商汤近年对外重要投资梳理 . 17 图表 32: 2015-2017 三大顶级会议论文收录数 . 18 图表 33:算法和算力支撑公司应用拓展 . 18 图表 34:旷视对外投资梳理 . 19 图表 35:依图对外投资梳理 . 20 图表 36: FRVT(2018)比赛结果(部分) . 20 基本结 论 作为 AI 时代的两个主要的入口,计算机视觉是 AI 行业最具商业化价值的赛道,智能语音产业即将进入爆发期。 首先,计算机视觉在 AI 领域中应用场 景最丰富,极具商业化价值。计算机视觉主要以图像和视频等高维、密集数 据为主要处理对象,信息提取程度更深,应用场景更加丰富。目前,国内外 均有 40%以上的 AI 企业聚集计算机视觉领域,市场规模在所有领域中全球第二、中国第一,商业成熟度较高, 2017 年中国计算机视觉应用规模约为 15.5 亿元,预计 17-22 CAGR 超 56%。其次,智能语音领域,根据 Gartner 2018 AI 技术成熟度曲线,语音识别、虚拟助理等相关智能语音技术历经淘 洗已相对成熟,未来将推动产业走向爆发期,预计整个市场规模将从 18 年 的 75 亿美元增长至 24 年的 215 亿美元, CAGR 达 19%。 整 体而言,传统科技巨头布局平台和生态,初创算法企业抢占垂直赛道。 具 体来讲,计算机视觉领域,市场呈现出科技巨头把控基础层、初创算法企业 领跑技术和应用、垂直领域龙头占据场景的格局。现阶段,计算机视觉行业已进入群雄逐鹿阶段,头部算法企业如商汤、依图横向建立平台,垂直领域龙头如海康 、大华纵向深耕行业,科技巨头如阿里、华为立体式打造全产业 生态。智能语音领域,当前国内外市场已相对集中,头部企业如 Nuance、 Google、科大讯飞等占据了大部分市场份额, CR5 均超 80%。两大类市场玩家 通用平台商如谷歌、百度致力于打造开放语音生态,专业应用商如云从、思必驰致力于抢占家居、车载等细分赛道。 视听盛宴来临,看好头部初创企业的发展。 计算机视觉领域,我们 看好算法储备丰富、算力供应充沛、长期发展具有深厚底蕴的商汤,具备强大软硬件结合能力及 阿里系 背景的旷视,先发优势明显、实战指 标领先 的依图以及唯一的 国家队 云从;智能语音领域,我们看好 云端芯 一体化发展、具备人才优势与先发优势的云知声。 投资建议 计算机视觉领域,建议关注 CV 四小龙 :商汤、旷视、依图、云从;智能语音领域,建议关注云知声。 风险提示 计算机视觉及智能语音初创企业商业模式不清晰、技术发展及应用落地速度不及预期、新竞争者的涌入导致行业竞争加剧等。 1.计算机视觉: AI 行业最具商业化价值的赛道 计算机视觉是国内外 AI 企业最集中的领域,商业成熟度较高。 从 AI 企业的应用技术方向分布来 看,计算机视觉技术企业在全球 AI 企业中占比约 40%,在国 内占比约 46%;无论国外还是国内,计算机视觉都是 AI 企业最集中的领域。从市场规模来看, 2017 年计算机视觉市场占全球 AI 市场总规模的 16.9%,排在语 音识别之后;而国内计算机视觉市场占 AI 市场的 34.9%,排名第一。国内外计算机视觉的市场规模差异要远大于企业分布差异,说明国内计算机视觉公 司的总 体盈利能力较其他 AI 领域的公司较强,商业成熟度较高。 图 表 1:全球 AI 企业 应用技术方向分布 图 表 2:中国 AI 企业 应用技 术方向分布 图 表 3: 2017 年全球 AI 市 场结构 图 表 4: 2017 年中国 AI 市 场结构 计算机视觉是 AI 领域应用场景最丰富、商业化价值最大的赛道。 目前, AI 技术处理的数据类型不外乎四类:文字、语音、图像和视频。从信息维度来看, 从文字到视频维度是递增的,文字 的信息维度最少、包含的信息量也最少,视频的信息维度最多、包含的信息量最大。反映在数据量占比上,以线上数据为例,根据 Cisco 的研究,到 2022 年全球线上视频流量占总流量的比例将从 2017 年的 75%上升到 82%,说明线上数据将越来越被视频数据所主导。信息维度更高加之数据量更大,因此以图像和视频为主要处理对象的计算机视觉要比以文字或语音为主要处理对象的其它 AI 技术具有更加丰富的应用场景和商业化价值。我们认为,当前资本市场也正以其资源配置、资产定价功能充分反映计算机视觉相对其它 AI 领域的优 势。例如,根据公开资料,当前计算机视觉行业四家头部初创企业(商汤、旷视、依图、云从)的总估值已经超过 1000 亿人民币,也超过了语音识别行业几家头部初创企业(思必驰、云知声、出门问问、图灵机器人、捷通华声) 总估值加上 AI 语音龙头科大讯飞的市值总和。 24.8% 计 算机 视 觉 语 音识别 其它 34.9% 40.3% 34.9% 48.2% 16.9% 语 音识别 计 算机 视 觉 其它 计 算机 视 觉 语 音识别 自 然语 言 处理 基 础硬件 22% 46% 19% 14% 20% 40% 28% 13% 计 算机 视 觉 语 音识别 自 然语 言 处理 基 础硬件 安防 智能终端 智能驾驶 渗 透 渗 透 渗 透 基础技术 云计算 渗 透 芯片 深 度学习 框架 基础层 技术层 应用层 图表 5: 2017-2022 线上视频流量和非视频流量占比 市场格局上,科技巨头把控基础层,初创企业领跑应用层。 计算机视觉架构从 下至上: 1)基础层 核心芯片被 Intel、 Nvidia 等 传统芯片厂商把控,新型芯片厂商尚未崛起,规模应用有待时日; 开源平台以谷歌的 Tensorflow、 Facebook 的 Caffe 等为主,其它企业的深度学习框架多为二次开发; 2)技术层 算法,初创企业占优;云计算,几乎被 AWS、 Google Cloud、 Azure、阿里云等垄断; 3)应用层 垂直行业龙头占据场景,技术层初创企业向上渗透。根据 IDC, 2017 年中国计算机应用市场总规模约为 15.5 亿元,商汤、旷视、依图、云从 四小龙 市场份额共计达 69.4%,至 2022 年中国计算机 视觉应用市场规模将达到 146. 1 亿元人民币。 图表 6:计算机视觉架构及各层级玩家示意 CPU GPU FPGA DSP ASIC Intel Nvidia Xilinx 深鉴科技 CEVA 中星微 Google 寒武纪 120% 100% 25% 18% 80% 82% 75% 60% 40% 20% 0% 2017年 2022年 视 频流 量 非 视频 流 量 图表 7: 2017 年中国计算机视觉应用市场份额 目前中国计算机视觉算法企业在技术水平、商业化程度以及融资能力 ( 估值) 上均领先于国际同行。 技术上,近年来中国计算机视觉头部算法企业在国际性 图像 识别竞赛如 ImageNet、 FRVT、 MSR IRC 等中频繁摘得桂冠;商业化上, 根据公开报道,商汤、旷视、云从等在 2017 年均已实现盈利,而国际初创企业同行如 EverAI 等尚处于净投入阶段;另外,从估值上看, CV 四小龙均已达到数十亿美元估值,而国外尚没有仅靠人脸识别、图像识别就估值破十亿美元 的初创企业。 分析上述领先优势产生的原因,我们认为,主要是由于国内头部计算机视觉算法企业充分享受了安防行业( 尤其是视频监控 ) 发展的红利 :一是安防市场快速成长的红利, 2007 年至 2017 年我国安防行业 十年 CAGR 达 16%, 2016 年以后安防智能化趋势确定,计算机视觉技术率先得到应用;二是政策红利,与欧美国家相比,当前我国对公民生物特征的保护政策并不完善 (见下文 ) ,因此国内计算机视觉算法企业可以从包括地方政府在内的各种机构中获得大量的人脸、人像数据用于模型训练和算法改进。根据 Quartz 的报道, 中国某头部计算机视觉算法企业声称拥有 20 亿张训练图,而国际最大的公开图库之一的 ImageNet 仅拥有 1300 万丈左右的训练图,相差 150 倍以上。 图 表 8: 我 国安防行业十年 CAGR 达 16% 图 表 9: 我 国安防行业市场结构 7000 6000 5000 4000 3000 2000 1000 0 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 市场规 模 (亿 元 ) 增速 ( %) 25% 20% 15% 10% 5% 0% 3.5% 视频监控 出入口控制 实体防护及其他智能家居 防盗报警平台 从 市场结构上看,国内外市场结构略有不同:国内安防、金融、互联网为主, 国外消费、机器人 ( 及机器视觉 ) 、智能驾驶领先。 根据 IDC 的市场跟踪, 2018 年中国计算机视觉技术输出规模最大的 3 个行业是政府、金融和互联网, 最大的两个场景为政府行业中的平安城市以及金融行业中基于人脸识别的身份 20.6% 30.6% 17.3% 15.0% 16.4% 商 汤 依 图 旷 视 云 从 其他 8.0% 10.2% 13.7% 50.6% 14.0% 认证。而根据 Tractica 的预测, 2018 年全球计算机视觉技术输出规模最大的 3 个行业分别为消费、机器人 ( 及机器视觉 )以及智能驾驶。我们认为影响计算机视觉落地的三个主要因素为监管政策、行业接受度及用户接受度,三者并不割裂:监管政策表明了监管机构的态度,行业接受度体现了行业玩家的购买意愿,而用户接受度一定程度上会影响监管政策和行业接受度。造成国内外计算机视觉市场结构巨大差异的主要原因,我们认为是监管政策和行业接受度的不同。 在欧美国家,生物特征作为关键的个人信息在被科技公司收集和使用时受到法 律法规的严格保护。去年 5 月 25 日,欧盟史上适用范围最广、定则条例最严、处罚金额最昂贵的数据保护法案 GDPR 生 效,该法案将指纹、人脸、视网膜等信息全部纳入个人资产范畴,对科技公司利用上述信息盈利进行了严格规定和 限制。因此,在欧美计算机视觉率先在政策较为宽松、用户接受度较高的领域 落地,例如消费和智能驾驶等。 在中国,首先,公民生物特征的保护政策并不完善;其次,基于安防效率和成本方面的考虑,政府是计算机视觉产品最早、最积极的买家之一。由于政府信用和购买力良好,加之安防行业成熟度高(利于计算机视觉技术集成 ) 、图像及视频数据丰富(利于计算机视觉算法、模型训练 ) ,因此计算机视觉最先在安防领域落地。此外政策因素(如实名制 、反洗钱等 ) 也是导致国内金融业主动拥抱计算机视觉技术的主要原因。 图表 10: 2018 年全球计算机视觉行业市场结构 企业核心竞争壁垒,中短期看是技术能力和产品化能力,长期看是生态构建能 力。 中短期来看,包括人脸识别、人体识别、图像识别等在内的主要计算机视觉技术均基于使用神经网络的深度学习算法,而神经网络的种类选择、结构设计以及参数调整等是一连串极其复杂的工作,因此算法的优劣和迭代速度将直接取决于算法设计人员的知识和经验储备,也会进一步决定计算机视 觉技术的准确率、可靠性等关键性能。 ImageNet 竞赛中神经网络隐含层数对图像识别准确率的影响最能说明问题。从 10 年至 15 年,随着神经网络隐含层数的增多,图像分类 Top-5 错误率随之显著降低(见下图 ) ,但与此同时算法设计的复杂度越来越高,对技术人员的要求也越来越高。 47% 安全监控 医疗 机器人及机器视觉 消费 运动及娱乐 汽车 19% 5% 7% 16% 6% 图表 11: ImageNet 竞赛深度学习算法隐含层数与图像识别错误率变化趋势 此外,计算机视觉技术在场景中落地时需要企业具备大量的除算法以外的know how,例如在软硬件结合以及保护终端用户隐私上的知识和经验等。现阶段,掌握技术的 AI 人才(尤其是顶级人才)主要分布在高校及科研院所,产业内的人才供应不足,加之多数场景下计算机视觉的落地能力不足,人才的争夺与落地能力的竞争将决定企业的发展速度。 图 表 12:全球 AI 人 才分布 图 表 13:中国 AI 人 才分布 但是,技术层面,随着自动机器学习技术 AutoML 的出现,机器学习模型的设计门槛随之降低。 AutoML 的出发点是用强大的算力通过更多次的训练提高模型的准确度, 其最大特点是将机器学习模型的设计过程自动化。算法设计人员只需了解模型的基本概念并提供标签数据即可,神经网络的参数及结构调整是自动完成的,无需人工干预。目前 AutoML 已经进入落地阶段。例如,去年 1 月谷歌发布了提供自定义图像识别系统自动开发服务的 Cloud AutoML Vision, 用户从导入数据到训练模型都可以通过拖放式界面完成。 AutoML 已经被谷歌应用于 CIFAR-10 高度基准测试数据集,并且训练出了与手工设计不相上下的模型。我们认为,随着 AutoML 技术的成熟,算法设计的门槛将 越来越低,但相应的,算力的重要性会越来越明显,长期来看有可能成为计算机视觉企业的核心竞争力之一。 ILSVRC10 ILSVRC11 ILSVRC12 ILSVRC13 ILSVRC14 ILSVRC14 ILSVRC15 0 0.0% 20 3.6% 浅层 5.0% 40 6.7% 7.3% 60 10.0% 11.7% 80 15.0% 100 16.4% 20.0% 140 120 25.0% 25.8% 160 152 28.2% 30.0% 神经网络隐含层数 TOP-5错误率 22 19 8 8 72.3% 高校 研究机构企业 其它 9.3% 3.2% 15.2% 4.0% 5.9% 8.8% 高校 研究机构企业 其它 81.3% 图 表 14: AutoML 工作 原理(红色部分自动完 成 ) 图 表 15: AutoML 内部 工作机制 产品层面,我们认为,随着竞争的加剧,成功的企业不仅要具备大量的跟技术落地相关的 know how,还必须能够主动地挖掘甚至创造需求,具备类似苹果在智能手机上的理解力。这就要求企业在纵向上能够主导整个产业链,横向上能够接入更多开发者和场景,因此长期看生态构建能力将成为主要竞争壁垒。 现阶段,头部算法企业横向建立平台,垂直领域龙头纵向深耕行业,科技巨头 立体式打造全产业生态。 头部算法企业的布局是横向拓展基础技术,建立基础平台。例如,商汤以人脸识别技术起家,逐渐拓展到人体分析、机器人、无人驾驶等领域,加上 GPU 超算中心和云计算平台,逐渐将自身打造成一个基础的人工智能平台,然后探索在应用端的迅速 落地。 垂直领域龙头公司的布局是纵向打通计算机视觉框架,深耕所在行业。例如, 安防设备龙头海康威视逐渐脱离了与初创算法企业的合作,自主研发关键技术, 并在 ILSVRC( 2016)图像分类获得第一名;此外,还推出了 AI Cloud 平台, 着力解决算力问题。通过纵向打通基础层、技术层和应用层,垂直领域龙头公 司可以提出更加智能的行业解决方案。 科技巨头公司的布局是以平台为核心立体式地推进,打造全产业生态。例如, Google 以 TensorFlow 及 Google Cloud 为核心,横向上进军图像分 析、文字识别等技术,推出 Google Lens 等视觉服务产品;纵向上向下拓展基础硬件推出 TPU 芯片,向上拓展医疗 ( Verily) 、无人驾驶 ( Way mo)等垂直领域,逐渐打造包括计算机视觉在内的人工智能大生态。
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642