资源描述
中国计算机视觉行业研究报告2017年22017.12 iResearch Inc iresearch来源:艾瑞咨询研究院自主研究绘制。摘要算法迭代将不断提升限定场景识别准确率,加速渗透为各行业应用赋能。前沿算法之外,计算机视觉公司的商业壁垒有赖于产品、服务、市场等综合建设。深度学习主要提升的是计算机视觉领域分类任务的准确率;开源环境仅降低计算机视觉领域的入门技术门槛,前沿算法的技术壁垒依然存在;计算机视觉比赛成绩、论文成果不直接代表技术团队解决实际业务问题的能力。前端嵌入式智能系统的渗透率将逐步提升,与后端协同智能计算,加速产业智能升级。2017年中国计算机视觉规模预期为 40亿,凭借安防领域的爆发性增长,预期 2020年将增长至 725亿。SMS3计算机视觉技术概述 1计算机视觉行业概况 2计算机视觉的应用场景 3计算机视觉典型公司案例 4计算机视觉行业发展趋势 542017.12 iResearch Inc iresearch计算机视觉的概念与行业主要应用计算机视觉横跨感知与认知智能,现阶段应用以感知为主视觉使人类得以感知和理解周边的世界,人的大脑皮层大约有 70%的活动在处理视觉相关信息。计算机视觉即通过电子化的方式来感知和理解影像,以达到甚至超越人类视觉智能的效果。从 1966年学科建立( MIT: The Summer Vision Project)至今,尽管计算机视觉在 感知与认知智能方向仍有大量难以解决、尚待探索的问题 ,但得益于深度学习算法的成熟应用( 2012年,采用深度学习架构的 AlexNet模型,以超越第二名 10个百分点的成绩在 ImageNet竞赛中夺冠),侧重于感知智能的图像分类技术在工业界逐步实现商用价值, 助力金融、安防、互联网、手机、医疗、工业等领域智能升级。 2017年下半年,数家计算机视觉公司单笔融资上亿美元,再次将计算机视觉推向人工智能领域最受关注的方向之一。本报告聚焦于计算机视觉技术现阶段在工业界的应用与研发,将在对相关技术热点及产业整体做概述性介绍的基础上,对典型应用的具体使用场景分领域论述,希望理清现状,写明征途,供产业界、投资界、政策制定者及关注人工智能领域的社会各界以参考。因报告研究对象以技术层创业公司为主,偏颇遗漏之处,敬请指正。来源:艾瑞根据专家访谈、公开资料等研究绘制。涉及常识推理、语义理解、规划决策等问题难以定义或用函数逼近通常为对声、光、电等物理信号做简单分类大致可用函数来逼近感知智能认知智能金融及互联网领域刷脸认证安防领域疑犯追踪 视频结构化手机及娱乐领域影像分类 影像处理 AR特效零售领域商品识别工业领域产品质检 3D分拣医疗领域医疗影像分析自动驾驶领域环境感知 高精地图 定位无人机 /机器人领域环境感知 定位 自动避障计算机视觉的典型应用视觉感知小有所成,视觉认知道阻且长通过电子化的方式感知和理解影像计算机视觉 广告营销领域自动化挖掘影像内容广告位52017.12 iResearch Inc iresearch计算机视觉的学术研究任务现阶段有较好商业化进展的主要为语义感知中的分类任务来源:参考资料 Stuart Russell.人工智能:一种现代的方法 M等。语义感(认)知对象关系识别:空间关系、动作关系、介词方位关系等行为识别及预测、追踪看图写话:场景理解,语句、段落等生成3D目标分类及对象关系、姿势行为分析、相关场景理解3D重建:从影像信息中重建这个世界的几何模型, 一般从二维影像出发得到场景的三维表示,可利用运动视差、双目立体视觉、多视图、纹理、明暗、轮廓、物体及场景几何结构等线索定位与控制定位 基于影像信息(往往也结合惯性运动单元 IMU等其他传感器获取多维度信息)机器人(包括自动驾驶汽车)在环境中对自身进行定位,进而导航控制 指导机器人操纵物体,拾起、抓住、转动等,自动驾驶领域则涉及横向、纵向及障碍物避让等控制 是一个需要不停观察、规划的连续决策问题建立影像信息与语言描述的映射3D目标感(认)知与重建猫 猫鸭子狗 猫鸭子狗图像分类 物体检测 语义分割计算机视觉的学术研究任务(部分)与人类实时选择性处理视觉信息不同(如人在驾驶时不需在意公路边草地的纹理或形状,也不用知道每辆车的确切形状),计算机仍难以从实际需求出发自主选择性输入并计算影像信息,通常需要人类对具体任务进行分解并使用与之匹配的计算方法,建立完整理想的智能视觉系统仍有很大挑战。另外,与可结合常识做猜想和推理进而辅助识别的人类智能系统相比,现阶段的视觉技术往往仅能利用影像表层信息,缺乏常识以及对事物功能、因果、动机等深层信息的认知把握。分类:图像分类、物体检测、语义分割等,分别为图像整体、局部以及像素级的分类任务去模糊、超分辨率等技术可有效增强影像信息62017.12 iResearch Inc iresearch 2017.12 iResearch Inc iresearch核心算法之深度学习深度学习的概念及成就深度学习算法由多重非线性变换构成多个处理层,辅以复杂结构设计和各种梯度技术,通过对大量样本的输入与对应输出数据的抽象计算,拟合出一个可处理新输入信息的函数模型,解决其分类或预测问题。尽管神经网络(可理解为深度学习算法的前身或别称)的研究历史其实比计算机视觉的研究历史还要长,但在之前的研究过程中,深度神经网络的方法并未得到有效验证。直到 2011年,语音识别领域凭借深度学习取得重大突破; 2012年, AlexNet,一个 8层的神经网络,以超越第二名 10个百分点的成绩在 ImageNet竞赛中夺冠(图像分类的 Top 5错误率为 16.4%),深度学习终迎来包括学术探索与工业应用中的热潮。不断提升的层数逐步提升计算机分类视觉的准确率, 2015年夺冠的 ResNet 深达 152层,以 3.57%的错误率超越人类视觉的 5.1%。来源:参考资料 周志华 .机器学习 M等。 来源:参考资料 CS231n.Convolutional Neural Networks for Visual Recognition等。深度学习与传统方法的区别传统方法 , 针对不同类别的物体 , 一般首先由研究员充分发挥聪明才智 , 手工定义不同的特征 , 然后利用不同的机器学习算法 ( 分类器学习 ) , 这时的算法一般仅有两到三次非线性变换 , 学到的参数较少( 浅层学习 ) ;深度学习则通过机器学习自身来产生特征 , 因此特征和分类器学习不再有区分 。 如今深度学习的算法已可达上千层 。样本数据 人工设计 特征 分类模型样本数据 机器学习 特征 分类模型端到端学习传统方法深度学习分类器学习ImageNet Large Scale Visual Recognition 2010-201528.2%25.8%16.4%11.7%7.3% 6.7%3.6%8 819 221522010 2011 2012 2013 2014 2014 2015错误率( 5 Guesses) 神经网络层数浅层学习深度学习夺冠72017.12 iResearch Inc iresearch 2017.12 iResearch Inc iresearch核心算法之深度学习数据与算力是深度学习的重要支撑日益丰富的影像内容为深度学习算法提供了大量的数据支撑。据思科公司评估, 2021年单月上传至全球网络的视频总时长将超过 500万年,每秒将诞生 1百万分钟的网络视频内容,网络视频流量将占据全球所有网络用户流量的 81.44%。需要说明的是,现在的学习多为有监督学习(需要对数据进行充分标注),而且并非所有类型的影像数据都易得易标注(比如医疗影像数据需由专业医师标注病灶),业界领先的视觉公司一般会有数百人的标注团队(多为外包,但需专业培训,实时指导)。另一方面,深度学习学习过程中的“训练”与应用部署后的“推断”均涉及大量并行计算,传统 CPU算力不足,而 GPU、 FPGA (现场可编程门阵列) 、 ASIC ( TPU、 NPU等 AI专属架构芯片)等具有良好并行计算能力的芯片可提供数十倍乃至于上百倍于 CPU的性能,与云服务一起,大幅缩短计算过程(在过去,往往数周甚至数月才能跑出一次结果,然后调整模型架构,效率极低),易于短期调整多种模型架构,显著提升分类模型的进步速度。 2010年以后, CPU内部晶体管数量的增长明显放缓,传统摩尔定律失效, 而 GPU类处理器依然保持着快速增长的势头( 2016年 GPU的计算力为 10个 TFLOP/S , 2017年达到了 120个 TFLOP/S ,TPU则实现了惊人的 180个 TFLOP/S ),验证着 AI时代的摩尔定律。来源:参考资料 Cisco Visual Networking Index: Forecast and Methodology 等。 来源:艾瑞咨询研究院自主研究绘制。并行计算能力有效提升模型计算效率57116 75109 98182 125853 15916174.73%77.00%79.02%80.42%81.44%2017e 2018e 2019e 2020e 2021e2017-2021年全球网络视频用户流量网络视频用户流量 PB/月 网络视频用户流量在总流量中的占比GPU、 FPGA、 ASIC等并行运算处理器在云端服务器、用户终端等助推模型训练与推断82017.12 iResearch Inc iresearch热门技术之人脸识别人脸识别是当下视觉领域热门应用的重要技术支撑人脸识别可看做语义感知任务中针对人脸影像的分类问题,也是当下视觉领域热门应用的重要技术支撑,各个环节都因深度学习算法的推进实现了更优的计算结果。泛金融领域的远程身份认证、手机领域的刷脸解锁一般属于人脸验证(技术相对成熟);安防影像分析一般为人脸识别,刑侦破案对亿级甚至十亿级比对有刚性需求,目前技术技术仍有很大进步空间,更多新功能、新场景的解锁依赖于最先进的算法团队和相关业务领域开拓者的共同努力。来源:艾瑞根据专家访谈、公开资料等研究绘制。人脸检测 人脸配准 人脸属性识别人脸提特征检测出图像中人脸所在位置 定位出人脸的五官关键点 识别出人脸的性别、年龄、种族、表情等将人脸图像转化为人脸特征(固定长度的数值串)衡量人脸间的相似度1:1识别判断两张人脸是否为同一人将库中人脸根据身份进行分组身份来自相似度分析1:N识别将人脸与库中 N个身份逐一比对女性 28岁平静 不戴眼镜颜值 92 女性 28岁平静 不戴眼镜颜值 92人脸识别的技术流程人脸比对人脸验证 人脸识别 /检索 人脸聚类92017.12 iResearch Inc iresearch开源环境与技术壁垒开源环境仅降低计算机视觉领域的入门技术门槛工业界和学术界先后推出了用于深度学习模型训练的开源工具和框架,包括 Caffe、 Theano、 Torch、 MXNet、TensorFlow、 PaddlePaddle、 CNTK等等,极大降低了人工智能技术在工业实践中的入门门槛。尽管不同框架各有所长,但它们并不能真正满足企业在处理实际复杂业务时所面对的挑战,性能、显存支持、生态系统完善性、使用效率等不同层面的不足要求企业需要针对性的调整框架以适合自身业务所需。而在数据处理、计算集群管理、网络设计、应用端性能优化等若干重要环节都存在各种各样非开源技术或已成熟方案所能解决,极度依赖相关技术专家去探索求解的重要问题。对于前沿算法的突破创新以及算法在不同使用环境中的优化升级,不同公司的技术高低差异依然很大。来源:艾瑞根据专家访谈、公开资料等研究绘制。数据处理计算集群管理 算法模型训练应用端性能优化与实际业务场景相关的数据才有价值,基于对影像数据的不同理解所选择的不同筛选及标注策略会对模型训练的效率及最后的性能产生重要影响。没有普适的深度学习框架,需要贴合自身应用场景优化甚至开发自己的深度学习框架,便于及时调整满足个性化需求。结合 GPU、 CPU等多种计算硬件的不同特性为各类 AI 系统的研发提供基础设施层面的保障,分布式、高性能、可扩展,降低 AI 系统和新技术的研发时间成本。需提升运算效能以匹配不同设备特性。在应用端计算能力有限的情况下,需要对网络架构进行调整,可在保持精度的同时显著降低功耗。深度学习人才极度稀缺,相关技术积累对公司能否提出引领业界的创新网络模型进而率先突破工业化红线,或能否在开源后快速重现、超越论文实验结果有重要影响。网络设计深度学习算法研发中的重要环节102017.12 iResearch Inc iresearch计算机视觉比赛的是与非比赛的意义在于推动算法思想的进步2007年由李飞飞教授发起的 ImageNet计划将人工智能领域的影像数据推向了前所未有的规模,至今已有 1400万张经过人工清洗标注的图片,含有 2万个分类,为计算机视觉领域做出巨大贡献。自 2010年每年一度的 ImageNet物体识别竞赛(对 1000类接近 50万张图片的单标签识别),更是成为了计算机视觉领域最受关注的比赛。 2017年, ImageNet举行了最后一届图像分类竞赛, Top 5的错误率降至 2.25%(大幅领先人眼),该竞赛完成了历史使命,而更多的关于图像语义分割(像素级的分类问题)、 1:N人脸识别、图像及视频理解(看图写话)方向的数据集与比赛将逐步登上舞台,推动更多领域更贴近真实世界场景的算法革新。来源:艾瑞根据专家访谈、公开资料等研究绘制。计算机视觉的数据竞赛成果(部分)图像分类(共 1000类)Top 5错误率ImageNet2.25%图像分类(共 1000类)准确率训练数据非人工标注WebVision94.78%0.463COCO图像语义分割平均精确度99.82%LFW1:1 人脸验证 准确率13000多张面部图像FRVT95.5%1:1 人脸验证 准确率百万量级数据盲测来自真实边检、刑侦场景MegaFace1: N 人脸识别 准确率百万量级测试数据91.7%视觉比赛的算法设计一般不太考虑对计算资源的消耗和实际场景的可用性,所以相关算法不能直接用于实战。比赛成绩或许可用来判断对方技术是否位于世界前十,但并不代表相关公司服务客户、解决实际问题的能力。比赛的意义在于推动算法思想的进步,能否提出创新的思想更重要。计算机视觉比赛的价值算法思想11计算机视觉技术概述 1计算机视觉行业概况 2计算机视觉的应用场景 3计算机视觉典型公司案例 4计算机视觉行业发展趋势 5122017.12 iResearch Inc iresearch服务器 芯片 传感器 计算平台数据公共安全 金融 互联网 手机 交通 医疗 零售 智能硬件2017年中国计算机视觉行业图谱说明:本报告的调研对象以 2012年深度学习爆发以后的创业公司为主,未能对起步于传统方法做视觉相关业务的公司做充分研究,因此本图谱未包含 OCR、传统门禁等相关领域。基础层数据及计算资源应用层技术使用者 工业安防影像分析 泛金融身份认证 手机及互联网娱乐 批发零售商品识别自动驾驶医疗影像分析工业制造嵌入式智能系统技术层算法、产品及解决方案提供者广告营销计算机视觉行业图谱132017.12 iResearch Inc iresearch计算机视觉公司的主要商业模式来源:主要为技术层公司的商业模式,艾瑞根据专家访谈、公开资料等研究绘制。API提供云端比对识别服务弹性、灵活、高效互联网金融公司多采用此种形式SDK向客户提供核心算法模块在用户端或客户的服务器端完成视觉计算基于对数据的保护或实时性要求手机及互联网娱乐公司多采用此种形式解决方案向客户提供较为全面的软硬件集成解决方案可能涉及软件系统、嵌入式解决方案前端硬件设备、专有服务器部署等公安、银行多采用此种形式按调用量或包时收费API服务多采用此种收费方式结合授权设备量及授权周期定价SDK服务多采用此种收费方式解决方案也可能采用结合具体项目收费后续每年可有升级维保收入解决方案多采用此种收费方式API和 SDK也可能采用主要服务方式主要收费方式142017.12 iResearch Inc iresearch 2017.12 iResearch Inc iresearch计算机视觉行业市场规模中国计算机视觉行业市场规模2016年下半年 , 1: N人脸识别 、 视频结构化等计算机视觉相关技术在安防领域的实战场景中突破工业化红线 , 敲响了计算机视觉行业市场大规模爆发的前奏 。 伴随人脸识别 、 物体识别等分类 、 分割算法不算提升精度 , 在 2017年占比较高的安防 、 视频广告 、 泛金融 、 手机及互联网娱乐领域之外 , 医疗影像 、 工业制造 、 批发零售等现阶段的创新领域也将逐步解锁 ,成为行业整体快速发展的重要支撑 。来源:艾瑞咨询研究院自主研究绘制。市场规模的统计推算以产业图谱中的技术层企业收入为主,侧重于以视觉算法为主要构成的云服务、 SDK及软件产品的相关收入,也包含一定集成视觉算法及其他丰富功能的软件系统,还有服务器、传感器、整体硬件设备系统的收入,其中泛金融解决方案以后两种收入为主。鉴于自动驾驶技术相对综合且处于早期研发阶段,与驾驶相关的视觉技术(包括司机疲劳检测、 ADAS、自动驾驶等)收入并未包含在内。 来源:艾瑞咨询研究院自主研究绘制。 2017年中国计算机视觉行业市场构成为预期构成。67.9%18.1%4.0%3.8%3.7% 1.7% 0.9%2017年中国计算机视觉行业市场构成安防影像分析 广告营销 泛金融身份认证(解决方案)互联网娱乐 泛金融身份认证(云服务、 SDK等) 手机创新领域11 40120319725264%200%166%127%2016 2017e 2018e 2019e 2020e市场收入 /亿元 增长率2016-2020年中国计算机视觉行业市场规模152017.12 iResearch Inc iresearch嵌入式感知系统加速产业智能升级前端智能的渗透率将逐步提升,与后端协同智能计算伴随 AI专用芯片及嵌入式感知系统的成熟研发,前端设备即可完成相对基础的视觉感知,并将识别、分类的结果实时应用,实现前端智能。对于需要大量计算、存储资源,利用多维度数据关联分析的诸多场景,后端服务器计算依然是当前主流。前端智能的渗透率将逐步提升,与后端智能协同加速产业升级,不仅可满足特定场景对实时性、隐私性的要求,还可在前端成像(千万像素、千帧 /秒)提供越来越多数据信息的背景下,让前端智能选择预处理过的结构化的高质量数据及分析结果传输至后端,减少因带宽压力过大导致的丢包、压缩所引起的信息丢失或误差,提升智能分析的准确性。前端智能系统的功耗、稳定性、存储空间、数据及系统更新的网络传输等诸多重要问题仍有待解决,现阶段主要通过压缩算法模型、挖掘硬件潜力以及在压缩模型的同时针对现有芯片进行优化的方式来解决功耗有限、运算能力低的问题。来源:艾瑞根据专家访谈、公开资料等研究绘制。前端设备计算(边缘计算) 后端服务器计算(计算中心计算)实时性好降低带宽压力保护数据隐私提升后端效率和整体分析质量资源强大可运行复杂算法实现高级功能设备配置与故障筛查相对简单前端智能 VS 后端智能结构化数据协同渗透 助推 AI产业升级16计算机视觉技术概述 1计算机视觉行业概况 2计算机视觉的应用场景 3计算机视觉典型公司案例 4计算机视觉行业发展趋势 5172017.12 iResearch Inc iresearch安防影像分析领域主要应用场景之人脸识别对道路卡口、车站、地铁站、机场等地方的监控视频进行智能分析,检测出动态视频中的人脸与黑名单库中的影像记录做实时比对,比对成功则立即报警推送给警务人员处置。来源:艾瑞根据专家访谈、公开资料等研究绘制。道路卡口 车站 地铁站 机场黑名单库动态视频人脸比对人脸抓拍比中出警安防影像分析之人脸识别182017.12 iResearch Inc iresearch安防影像分析领域主要应用场景之视频结构化2012年南京“ 1 6” 案件发生后,南京警方从全市 1万多个摄像头共提取了近 2000T的视频数据,调动 1500多名公安干警查阅搜索视频线索,共耗时一个多月。海量视频的有效利用存在巨大挑战,完全依靠人工费时费力,而安防影像智能分析则可有效缓解这一问题。视频结构化可针对已经生成的海量视频内容进行自动化处理,提供行人、机动车、非机动车等关键目标的监测、跟踪、属性分析,辅以以图搜图等检索功能,让案件侦办和治安布控更加智能便捷。来源:艾瑞根据专家访谈、公开资料等研究绘制。海量视频内容 结构化视频识别出特定的人、车辆、物体或者事件智能分析自动化处理实现对关键目标的监测、跟踪、属性分析大幅提升破案效率有效利用视频数据安防影像分析之视频结构化192017.12 iResearch Inc iresearch安防影像分析领域安防行业的千亿市场为视觉智能改造提供充分空间2016年中国安防行业总产值为 5410亿,占据 2016年中国 GDP的 7,其中 1900亿属于安防产品产值。从产品结构角度,安防产品可划分为视频监控、防盗报警、出入口控制等,安防影像的智能分析属于视频监控产品的升级改造,是各地区平安城市项目建设中的重要组成。 2011年至 2016年中国安防市场连续 5年保持 2位数增长,结合国家政府对建设更高水平的平安中国、进一步提升人民安全性的要求,未来中国的安防市场依然会保持稳定增长,对人工智能、计算机视觉技术的升级改造也提出了更高的期待。来源:艾瑞根据专家访谈、中安网等公开资料研究绘制。3100亿1900亿410亿报警运营服务及其他产值安防产品产值安防工程产值72016年中国安防行业总产值5410亿74万亿2016年中国 GDP24% 18% 16% 13% 12% 7% 5% 5%平安城市 智能交通 智能楼宇 文教卫 金融 能源 司法监狱 其他视频监控 防盗报警 出入口控制 楼宇对讲 /智能家居 平台 实体防护及其他962亿 152亿 266亿 193亿 67亿 260亿计算机视觉在安防领域的爆发点2016年中国安防行业市场结构202017.12 iResearch Inc iresearch安防影像分析领域智能安防相关政策分析伴随从平安城市、智慧城市到雪亮工程等公共安全相关政策,以及人工智能相关国家战略政策的逐步深化,智能安防也将与高清联网一样,由重点区域、有条件的地区起步,开始新一轮的从局部到整体的全国性拓展。来源:艾瑞根据公开资料研究绘制。公安部 发起“ 科技强警 ”2003年北京、苏州、杭州、济南四个 视频监控试点 城市2005年 2015年中共中央办公厅 、 国务院推进 “ 3111”工程九部委 关于加强公共安全视频监控建设联网应用 到 2020年,基本实现“ 全域覆盖 、 全网共享 、 全时可用 、 全程可控 ”的公共安全视频监控建设联网应用国家持续政策加码各地市亦响应中央号召推出数百部相关政策2016年研发集成图像与视频 精准识别 、 生物特征识别 、 编码识别 等多种技术的 智能安防产品 。支持部分有条件的社区或城市开展基于 人工智能 的公共安防区域示范,加快重点公共区域安防设备的 智能化改造升级 互联网 +” 人工智能三年行动实施方案 发改委 、 科技部 、 工信部 、 网信办2017年国务院办公厅 关于县域创新驱动发展的若干意见 加快实施“ 雪亮工程 ”,推进县域公共安全视频监控建设和联网应用,建设 平安中国5月发改委、网信办、标准委 国家新型智慧城市评价指标 公共安全视频情况成为智慧城市 发展重要指标促进 人工智能 在公共安全领域的深度应用,推动构建公共安全 智能化 监测预警与控制体系。研发集成多种探测传感技术、 视频图像信息分析识别技术、 生物特征识别 技术的 智能安防与警用产品 ,建立 智能化监测平台 新一代人工智能发展规划 国务院11月 5月 7月 10月十九大报告推动互联网、大数据、人工智能和实体经济深度融合公共安全与人工智能相关政策212017.12 iResearch Inc iresearch安防影像分析领域视频监控步入智能时代2015年,国家发展改革委、中央综治办、公安部等九部委下发 关于加强公共安全视频监控建设联网应用工作的若干意见 ,提出到 2020年基本实现“全域覆盖、全网共享、全时可用、全程可控”的公共安全视频监控建设联网应用,视频监控的清晰度和联网率得到快速发展,为智能升级奠定了较好的基础条件。需要说明的是,相比高清联网的“看到、看清”,智能升级的“看懂”对前端设备的部署位置、高度及角度等有着更苛刻的要求,现公安联网的数千万摄像头中的80%90%仍然需要针对性的调整改造。来源:艾瑞根据专家访谈、公开资料等研究绘制。清晰度联网率1080P+100%重点区域100%智能化人脸识别在公安实战中达到可用GB28181标准发布2020年2016年2011年清晰度与联网率为视频监控的智能升级提供基础保障222017.12 iResearch Inc iresearch安防影像分析领域来源:艾瑞根据专家访谈、公开资料等研究绘制。计算机视觉技术供应商监控设备厂商平台软件厂商集成商公安SDK软件平台嵌入式设备解决方案实力强劲的大型设备厂商也在往下游集成商业务拓展,自建渠道直接面向客户软件厂商依托于大型设备厂商或集成商,智能技术的进步不断提升平台软件的附加值直接面向客户可获得较高单价供需双方合作之中有竞争设备厂商也在研发人脸识别算法和前端嵌入式设备集成商每路监控可获收益 210万分给技术厂商 15万 +系统日益复杂集成商门槛不断提高现阶段渠道优势往往大于技术优势智能安防相关产业链条分析智能安防相关产业链条分析计算机视觉技术供应商在提供智能安防影像分析的时候 , 可能面对监控设备及平台软件厂商 、 集成商 、 公安等三大类客户 。在最终的使用者公安以外 , 其他三类参与者关系复杂 , 各自的业务定位都在发展变化 , 合作间有竞争 。232017.12 iResearch Inc iresearch安防影像分析领域 中国安防行业“十三五” ( 2016-2020年)发展规划 中提出到 2020年,安防行业总收入达到 8000亿元左右。结合对计算机视觉技术进步在视频监控前后端、软硬件、公安刑侦各场景迅速渗透的预期,我们认为未来三年智能安防影像分析的相关收入在安防产业中的占比将以 12倍速度增长,由此得出如下市场规模以供参考。来源:艾瑞根据专家访谈、公开资料等研究绘制。可能高估的风险来自平安城市推进及人工智能、计算机视觉相关技术的发展、渗透不及预期,或成熟技术大规模落地后成单价降低;可能低估的风险来自相关技术的发展、渗透速度高于预期。智能安防影像分析的市场规模5 27902485522016 2017e 2018e 2019e 2020e市场规模 /亿元2016-2020年中国智能安防影像分析的市场规模242017.12 iResearch Inc iresearch安防影像分析领域多模态融合、大数据多维分析共同增强智能安防分析能力不足够理想的人脸影像捕捉及人脸本身的相似性导致识别精度有限,因此融合多种生物特征的多模态识别加多维数据的大数据分析等智能技术的交叉融合可大幅提升身份识别精度,结合公安战法有效辅助断案效率,从而进一步提升人工智能在安防领域的落地速度及渗透率。分辨率低距离人脸远光线暗 雾霾成像环境差遮挡非正面角度 外形、表情变化若干因素限制人脸识别精度人脸相似性人脸 指纹 虹膜三大生物特征 (共占全球生物识别市场份额的 80%+)指静脉 步态 声纹多模态生物特征 +大数据多维信息分析WiFi探针 手机信号 话单信息社交关系上网记录交易记录 住行信息来源:艾瑞根据专家访谈、公开资料等研究绘制。性别 装束252017.12 iResearch Inc iresearch泛金融身份认证领域与安防影像分析中人脸的“ 1:N”识别不同,目前泛金融领域以人脸“ 1:1”身份认证为主,部分场景涉及“ 1:N”识别,如银行网点中对 VIP客户的智能识别。来源:艾瑞根据专家访谈、公开资料等研究绘制。金融应用场景 影像采集设备网点 VTM/ATM无卡取款远程开户 个人终端摄像头协助网点柜员确认客户身份VIP迎宾智能分析网点客户人脸、虹膜、指纹等智能识别设备金库等区域出入管理 押运员身份确认电信应用场景 影像采集设备零售应用场景 影像采集设备手机号实名认证 网点自助终端 个人终端刷脸支付 网点自助终端 个人终端转账 /交易 /申贷确认影像采集设备互联网应用场景注册、登录等身份认证 个人终端主要应用场景及相关影像采集设备泛金融身份认证的主要应用场景及相关影像采集设备262017.12 iResearch Inc iresearch.
展开阅读全文