2019年中国机器学习行业市场研究.pdf

返回 相关 举报
2019年中国机器学习行业市场研究.pdf_第1页
第1页 / 共39页
2019年中国机器学习行业市场研究.pdf_第2页
第2页 / 共39页
2019年中国机器学习行业市场研究.pdf_第3页
第3页 / 共39页
2019年中国机器学习行业市场研究.pdf_第4页
第4页 / 共39页
2019年中国机器学习行业市场研究.pdf_第5页
第5页 / 共39页
亲,该文档总共39页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1 报告编码19RI0796 头豹研究院 | 计算机系列深度研究 400-072-5588 2019 年 中国机器学习行业市场研究 报告摘要 TMT 团队 机器学习指专门研究计算机怎样模拟或实现人类的 学习行为以获取新的知识或技能的学科,使计算机 重新组织已有的知识结构并不断改善自身的性能。 自 2006 年起, 深度学习发展迅速, 逐步成为机器学 习领域的主流算法之一,为机器学习的升级发展注 入动力。在深度学习的带动发展下,机器学习在人 工智能应用市场中的应用占比从 2014 年的 9.6%上 升至 2018 年的 12.2%。 人工智能市场规模从 2014 年 71.7 亿元增长至 2018 年的 339.0 亿元, 年复合增长 率达 47.5%, 在人工智能商业化应用步伐逐步加快以 及机器学习应用占比不断提高的发展背景下,机器 学习发展进一步加快。 热点一:深度学习发展迅速 热点二:训练数据问题突出 热点三:发展胶囊网络是机器学习行业的重要趋势 作为机器学习领域的主流算法之一,深度学习凭借其适 应性强、准确率高等特点获得市场高度关注,应用领域 不断拓宽,其在图像识别、语音识别、人脸识别等领域 的应用逐步加深,发展步伐显著加快,深度学习的迅速 发展是推动机器学习行业升级发展的重要因素。 机器学习以数据为基础,训练数据的数量、质量、代表 性与机器学习模型的性能紧密相连。现阶段,机器学习 模型构建常因训练数据数量不足,质量不佳,代表性不 高而出现过拟合、欠拟合、泛化能力减弱、准确度不足 等状况,训练数据的数量、质量、代表性问题是制约机 器学习行业发展的重要因素。 胶囊网络所需训练数据量少,能灵活应对存在重叠对象 的拥挤场景,可克服卷积神经网络的多种缺陷,其在图 像识别领域具有广阔应用发展前景,发展胶囊网络是机 器学习行业的重要发展趋势。 詹欣琪 邮箱:csleadleo 分析师 行业走势图 相关热点报告 计算机系列深度研究 2020 年中国低代码开发平台 行业概览 计算机系列深度研究行 业概览_2019 年中国办公软件 行业概览 1 报告编码19RI0491 目录 1 方法论 . 3 1.1 方法论 . 3 1.2 名词解释 . 4 2 中国机器学习行业市场综述 . 7 2.1 机器学习定义与分类 . 7 2.2 机器学习发展历程 . 8 2.3 中国机器学习行业规模 . 16 2.4 机器学习产业链 . 10 2.4.1 产业链上游 . 11 2.4.2 产业链中游 . 14 2.4.3 产业链下游 . 15 3 中国机器学习行业驱动因素 . 18 3.1 深度学习发展迅速 . 18 3.2 机器学习技术开放平台为行业发展提供有力支持 . 19 3.3 资本投入推动行业发展 . 19 4 中国机器学习行业制约因素 . 21 4.1 训练数据问题突出 . 21 1 报告编码19RI0491 4.2 机器学习模型可解释性差 . 21 5 中国机器学习行业相关政策法规 . 23 6 中国机器学习行业发展趋势 . 26 6.1 发展胶囊网络 . 26 6.2 发展生成对抗网络 . 26 6.3 发展深度强化学习 . 27 7 中国机器学习行业竞争格局 . 29 7.1 机器学习行业竞争格局概览 . 29 7.2 中国机器学习行业典型企业分析 . 29 7.2.1 竹间智能 . 29 7.2.2 第四范式 . 31 7.2.3 库柏特 . 33 2 报告编码19RI0491 图表目录 图 2-1 机器学习行业产业链 . 11 图 2-2 中国公有云市场规模,2014-2018 年 . 13 图 2-3 中国机器学习行业市场规模,2014-2023 年预测 . 17 图 5-1 机器学习行业相关政策法规 . 25 图 7-1 竹间智能融资情况 . 30 图 7-2 第四范式融资情况 . 32 图 7-3 库柏特融资情况 . 34 3 报告编码19RI0491 1 方法论 1.1 方法论 头豹研究院布局中国市场, 深入研究 10 大行业, 54 个垂直行业的市场变化, 已经积累 了近 50 万行业研究样本,完成近 10,000 多个独立的研究咨询项目。 研究院依托中国活跃的经济环境,从人工智能、大数据、云计算等领域着手,研究 内容覆盖整个行业的发展周期,伴随着行业中企业的创立,发展,扩张,到企业走 向上市及上市后的成熟期, 研究院的各行业研究员探索和评估行业中多变的产业模 式,企业的商业模式和运营模式,以专业的视野解读行业的沿革。 研究院融合传统与新型的研究方法, 采用自主研发的算法, 结合行业交叉的大数据, 以多元化的调研方法, 挖掘定量数据背后的逻辑, 分析定性内容背后的观点, 客观 和真实地阐述行业的现状, 前瞻性地预测行业未来的发展趋势, 在研究院的每一份 研究报告中,完整地呈现行业的过去,现在和未来。 研究院秉承匠心研究, 砥砺前行的宗旨, 从战略的角度分析行业, 从执行的层面阅 读行业,为每一个行业的报告阅读者提供值得品鉴的研究报告。 头豹研究院本次研究于 2019 年 07 月完成。 4 报告编码19RI0491 1.2 名词解释 回归:研究因变量和应变量之间线性关系的统计分析模型。 聚类:指将具有相似特征的对象聚集。 数据挖掘:通过算法发现大量数据中的隐含信息的过程。 计算机视觉: 使用计算机模仿人类视觉系统的科学, 让计算机拥有类似人类提取、 处理、 理解和分析图像以及图像序列的能力。 自然语言处理:实现人与计算机之间用自然语言进行有效通信的计算机技术。 生物特征识别:通过计算机利用人体所固有的指纹、虹膜、面相、DNA 等生理特征或 步态、击键习惯等行为特征来进行个人身份鉴定的技术。 智能体:在特定环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性、主动 性等特征的计算实体。 人工神经网络: Artificial Neural Network, ANN, 从信息处理角度对人脑神经元网络 抽象化而建立的模型。 感知器:具有简单结构,并能从数学上严格证明的人工神经网络典型结构。 支持向量机:Support Vector Machine, SVM,一种监督学习模型,通常用来进行模 式识别、分类以及回归分析。 线性分类器:透过特征的线性组合将具有相似特征的对象聚集。 异或:异或也称半加运算,其运算法则相当于不带进位的二进制加法。 线性不可分:线性函数无法将两类样本分离。 先验知识:指先于经验、不依赖于经验的知识。 分类器: 在已有数据的基础上构造出的分类函数或分类模型, 根据分类能力的不同, 分 类器可分为强分类器和弱分类器。 5 报告编码19RI0491 Boosting 算法:一种用于提高弱分类器准确度的方法。 API:Application Programming Interface,应用程序编程接口,本质是预先定义的 函数和算法,目的是供应用程序与开发人员调用特定技术功能。 ID3 算法: 以信息论为基础, 以信息增益度为衡量标准, 实现对数据的归纳分类的算法。 神经网络反向传播算法: Backpropagation, 适用于多层神经元网络的一种学习算法。 AdaBoost 算法:一种由弱分类器演变成强分类器的迭代算法。 符号主义:一种基于逻辑推理的智能模拟方法。 图像识别: 利用计算机对图像进行处理、 分析和理解, 以识别各种不同模式的目标和对 象的技术。 语音识别: 让机器通过识别和理解过程把语音信号转变为相应的文本或命令的计算机技 术。 人脸识别:基于人的脸部特征信息进行身份识别的一种生物识别技术。 前馈神经网络:Feedforward Neural Network,各神经元分层排列的简单神经网络。 卷积神经网络:Convolutional Neural Networks, CNN,指包含卷积计算且具有深度 结构的前馈神经网络。 循环神经网络: 一类以序列数据为输入, 在序列的演进方向进行递归且所有节点按链式 连接的递归神经网络。 递归神经网络:Recursive Neural Network, 具有树状阶层结构且网络节点按其连接 顺序对输入信息进行递归的人工神经网络。 泛化能力: 机器学习模型在原有的数据集上添加新的数据集, 并通过训练输出合理结果 的能力。 生成模型:在给定隐含参数条件下,随机生成观测数据的模型。 6 报告编码19RI0491 损失函数:随机事件或有关随机变量的取值映射为非负实数的函数。 过拟合:为了得到一致假设而使假设变得过度严格。 欠拟合:模型拟合程度不高,模型未能充分捕捉到数据特征。 语篇:交流过程中的一系列连续语段或句子所构成的语言整体。 7 报告编码19RI0491 2 中国机器学习行业市场综述 2.1 机器学习定义与分类 机器学习指专门研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能的 学科,使计算机重新组织已有的知识结构并不断改善自身的性能。机器学习以数据为基础, 通过研究样本数据寻找规律, 并根据所得规律对未来数据进行预测。 机器学习是人工智能的 核心,广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别等人工智能领域。 (1) 按学习模式的不同,机器学习可分为监督学习、无监督学习、强化学习: 监督学习的训练数据具有分类标签, 分类标签精确度越高, 学习模型准确度越高。 监 督学习根据给定的训练数据建立函数模型, 可实现对新数据的标记映射。 监督学习的算 法包括回归和分类,应用领域包括自然语言处理、信息检索、文本挖掘、手写体辨识、 垃圾邮件侦测等。 无监督学习利用无标记的有限数据描述隐藏于数据中的结构或规律, 其典型算法为聚 类。 无监督学习无需以人工标注数据为训练样本, 可避免正、 负样本偏移引起的分类错 误问题。无监督学习的应用领域包括经济预测、异常检测、数据挖掘、图像处理、模式 识别等。 强化学习指智能体在与环境的交互过程中达成回报最大化的学习模式。 强化学习以外 部环境对智能体评价达到最优为目标。 强化学习广泛应用于机器人控制、 无人驾驶、 工 业控制等领域。 (2) 按算法网络深度的不同,机器学习可分为浅层学习和深度学习: 浅层学习算法网络的隐藏层数量少, 算法框架简单, 无需提取多层次抽象特征。 典型 的浅层学习包括支持向量机、逻辑回归等。 8 报告编码19RI0491 深度学习是一种基于多层神经网络并以海量数据为输入规则的自学习方法, 依靠提供 给它的大量实际行为数据, 即训练数据集, 进行规则中的参数和规则调整。 深度学习算 法网络的隐藏层数量多, 算法复杂, 相比浅层学习, 深度学习更注重特征学习的重要性。 典型的深度学习算法包括卷积神经网络、循环神经网络等。 2.2 机器学习发展历程 机器学习发展至今,经历了萌芽期、瓶颈期、恢复期、稳健期、加速期 5 个阶段。 图 2-1 机器学习发展历程 来源:头豹研究院编辑整理 (1) 萌芽期(1949-1968 年) 1949 至 1968 年,机器学习基础理论和模型开始出现,行业进入萌芽期。1949 年, Donald Hebb 提出赫布学习理论,解释了循环神经网络中各节点之间的关联性,为机器学 9 报告编码19RI0491 习的发展奠定了理论基础。1952 年,IBM 的 Arthur Samuel 设计出一款具有学习能力的 西洋跳棋程序,该程序可通过观察棋子的位置变化来构建新模型,逐步改善下棋技巧。 Arthur Samuel 将机器学习定义为可提供计算机能力而无需显式编程的研究领域。 1957 年, Rosenblatt 提出感知器模型,其可在简单结构中表现出智能系统的基本属性。1960 年, Widrow 将 Delta 学习规则应用于感知器模型中,进一步提高线性分类器的精确度。 (2) 瓶颈期(1969-1979 年) 1969 至 1979 年,机器学习在理论研究方面遇到瓶颈,发展步伐趋于滞缓。1969 年, Minsky 提出神经网络异或问题,揭露感知器模型无法处理线性不可分问题的缺陷,机器学 习开始面临理论研究困境。 Winston 于 1970 年提出结构学习系统, 推动基于逻辑表示的符 号主义学习技术进一步发展, 但该系统只能学习单一概念, 未能突破机器学习的理论研究瓶 颈。 (3) 恢复期(1980-1989 年) 1980 至 1989 年, 神经网络领域的理论研究从单一概念学习逐渐拓展至多个概念学习, 机器学习的实践应用逐渐增多,行业进入恢复期。1980 年,首届机器学习国际研讨会于美 国卡内基梅隆大学召开,机器学习的关注度显著提升。1981 年,Werbos 在神经网络反向 传播算法中提出多层感知器模型,机器学习理论研究步伐逐步加快。1986 年,Quinlan 提 出 ID3 算法, 该算法为机器学习领域的主流算法分支之一, 其规则简单, 理论框架清晰, 应 用场景不断增多。 (4) 突破期(1990-2005 年) 1990 至 2005 年,机器学习在算法模型方面实现突破,Boosting 算法、支持向量机模 型的提出有力推动机器学习进一步发展。Schapire 于 1990 年率先构造出多项式级的 Boosting 算法,Freund 于 1991 年提出更高效的 Boosting 算法,Boosting 算法的提出 10 报告编码19RI0491 和发展显著提高弱分类器的准确度。1995 年,Freund 和 Schapire 在改进 Boosting 算法 的过程中提出 AdaBoost 算法,AdaBoost 算法无需弱学习器的先验知识,更易于解决实 际问题。1995 年,Vapnik 和 Cortes 提出支持向量机算法模型,该算法模型具有坚实的理 论基础以及出色的实证结果,是机器学习领域的重大突破。 (5) 加速期(2006 年至今) 2006 年至今,深度学习的出现显著加快机器学习的发展步伐,使机器学习的应用领域 不断拓宽,行业进入加速发展阶段。2006 年,Hinton 提出神经网络深度学习算法,该算法 可通过无监督学习有效降低神经网络的训练难度, 大幅提升神经网络的学习能力。 2012 年, 谷歌首次将深度学习算法运用于语音识别领域,使语音输入测试的单词错误率从 30%降低 至 12.3%。2017 年,由谷歌旗下 Deepmind 公司研发的深度强化学习围棋程序 AlphaGo 战胜当时世界排名第一的围棋冠军柯洁, 引起市场高度关注。 深度学习数据处理量大, 应用 场景不断增多,深度学习的迅速发展有力推动机器学习进一步发展。 2.3 机器学习产业链 机器学习产业链包括上游的人工智能芯片供应商、云计算平台服务商、大数据服务商, 中游的机器学习技术服务商以及下游的机器学习应用服务商。 机器学习产业链上游为支持基 础层, 上游的人工智能芯片供应商主要负责提供 GPU、 ASIC、 FPGA 等人工智能专用芯片, 大数据服务商提供的服务包括数据采集、数据处理、数据存储、数据交易等,云计算平台服 务商提供的服务包括 IaaS、PaaS、SaaS 等。产业链中游为技术层,中游的机器学习技术服 务商为下游的机器学习应用服务商提供机器学习基础开源框架、 机器学习技术开放平台等机 器学习技术服务。 产业链下游为应用层, 下游的应用服务商为最终用户提供基于机器学习的 垂直领域应用服务,机器学习的垂直应用领域包括金融、教育、医疗、零售、工业等。 11 报告编码19RI0491 图 2-2 机器学习行业产业链 来源:头豹研究院编辑整理 2.3.1 产业链上游 (1) 人工智能芯片供应商 人工智能芯片是机器学习产业链的核心底层硬件, 为机器学习应用提供算力基础。 按技 术架构的不同,人工智能芯片可分为 GPU、ASIC、FPGA。 GPU 具有软件生态齐全、 并行计算能力强的特点, 是现阶段深度学习训练的首选芯片。 GPU 是一种具有大规模并行计算架构,专为同时处理多重任务而设计的芯片,其发展时间 长,产品成熟,支持 CUDA 统一架构、OpenCL 架构等编程环境,编程语言成熟易用,便 于开发者开发应用。此外,GPU 的峰值计算能力强,处理速度可达 CPU 的 10 至 100 倍, 适用于并行计算大规模数据,可显著加快深度学习计算速度。 ASIC 是全定制化的人工智能芯片,具有体积小、功耗低、通信效率高、计算速度快等 特点。ASIC 是为符合特定用户需求而定制的专用人工智能芯片,其计算能力和通信效率均 可通过算法进行定制,专用化、定制化的设计将数据传输时间和数据等待时间压制到最低, 12 报告编码19RI0491 显著提升芯片性能与运行速率。ASIC 的主要类型包括 TPU、BPU 和 NPU,其中,TPU 为 谷歌于 2016 年研发的专用于机器学习的 ASIC 芯片。 FPGA 可灵活编译,处理效率高,适用于深度学习预测。FPGA 指现场可编程门阵列, 是在可编程器件的基础上进一步发展的半定制电路, 其处理重复计算指令能力强, 相比 GPU, “CPU+FPGA” 混合异构的功耗更低, 运用于深度学习预测的效率更高, 性能优势更突出。 现阶段, 人工智能芯片市场由海外厂商主导, 中国厂商的发展步伐逐步加快, 但和海外 头部厂商相比仍有明显差距。海外头部厂商包括英伟达、英特尔、IBM、谷歌、微软、高通 等, 英伟达于 2018 年推出新一代 GPU 产品 NVIDIA Tesla V100, 英特尔通过收购 Altera、 Nervana、eASIC、NetSpeed Systems 等芯片组厂商布局人工智能芯片产品线,谷歌于 2018 年发布其第三代人工智能专用处理器 TPU3.0, 苹果于 2018 年发布的新款 iphone 手 机均搭载了 A12 仿生芯片,IBM 的人工智能团队于 2018 年利用大规模模拟存储器阵列训 练深度神经网络,达到与 GPU 相当的精度。中国人工智能芯片厂商着重布局边缘端芯片产 品,针对安防、自动驾驶、智能家居、物联网等领域的终端设备开发专用的人工智能芯片, 代表厂商包括中星微、华为海思、瑞芯微、寒武纪、地平线、深鉴科技、云之声、旷视科技 等,中国人工智能芯片市场以初创型厂商居多。 (2) 云计算平台服务商 云计算是一种可迅速提供并发布网络、服务器、储存、应用等计算资源的模型,用户可 通过网络按需访问计算资源共享池, 实现管理成本或服务供应商干预最小化。 按部署方式的 不同,云计算可分为公有云、私有云、混合云,公有云指利用公共网络向客户提供具有弹性 的计算资源和服务, 现阶段的云计算服务市场以公有云服务为主。 按服务模式的不同, 云计 算可分为 IaaS、PaaS、SaaS。 13 报告编码19RI0491 IaaS(Infrastructure as a Service,基础设施即服务)是将通用计算、储存、网 络以及其他基础硬件资源虚拟化后, 以出租的方式提供给客户的服务模式。 典型的 IaaS 服务有亚马逊的 AWS,阿里云的弹性主机服务等。 PaaS(Platform as a Service,平台即服务)指为开发者提供应用服务运行和开 发环境的服务模式。典型的 PaaS 服务有 Google 的 Google App Engine 平台服 务、阿里云的量子计算云平台等。 SaaS(Software as a Service,软件即服务)指直接通过网络为客户提供软件服 务的商业模式。典型的 SaaS 服务有 Salesforce 的 CRM,Workday 的 HRM,用 友的云 ERP 等。 在中国公有云服务市场中,IaaS 发展最为迅速,公有云 IaaS 市场规模从 2014 年的 26.2 亿元增长至 2018 年的 270.4 亿元,年复合增长率达 79.2%。PaaS 在公有云服务市场 中的占比最小,但其发展步伐显著加快,公有云 PaaS 市场规模从 2014 年的 3.8 亿元增长 至 2018 年的 21.8 亿元, 年复合增长率达 54.8%。 SaaS 在公有云服务市场中的占比从 2014 年的 57.3%下滑至 2018 年的 33.2%,公有云 SaaS 的增长速度明显低于公有云 IaaS、公 有云 PaaS。 图 2-3 中国公有云市场规模,2014-2018 年 14 报告编码19RI0491 来源:中国信息通信研究院,头豹研究院编辑整理 (3) 大数据服务商 大数据服务商提供的服务包括数据采集、数据处理、数据存储、数据交易等,其类型包 括学术机构、数据外包服务公司、人工智能应用服务公司。 学术机构通过自行采集、 标注大量数据来建立学术研究数据库, 以用于算法的创新性验 证、学术竞赛等,该类数据库迭代速度慢,商业应用场景有限,典型代表有 ImageNet。 数据外包服务公司是最常见的大数据服务商类型, 其业务类型包括出售现成数据训练集 的使用授权以及根据用户特定需求提供数据采集、数据标注、数据转写等服务。 人工智能应用服务公司同是大数据服务的需求方和供给方, 除购买数据外包服务公司的 相关服务外, 人工智能应用服务公司还通过自建数据服务团队来构建自用数据库, 部分人工 智能应用服务公司将自建数据库包装成产品出售,大数据服务成为其业务板块之一。 2.3.2 产业链中游 中游的机器学习技术服务商是机器学习产业链的关键主体, 其提供的服务包括机器学习 基础开源框架以及机器学习技术开放平台。 机器学习基础开源框架是构建机器学习模型的重要根基, 市场中的机器学习基础开源框 架产品繁多,市场竞争激烈,谷歌、亚马逊、Facebook 等互联网巨头在机器学习基础开源 框架领域具有领先优势。谷歌于 2016 年推出机器学习系统开源工具 TensorFlow,适用于 智能手机、大型数据中心服务器等各类硬件设备,市场关注度不断提升。MXNet 是亚马逊 的机器学习基础开源框架产品,其适用于 Python,R,Julia,Scala,Javascript 等语言, 可在多个 CPU、GPU 设备上进行分布式训练,运算效率优势突出。Facebook 于 2018 年 推出机器学习基础开源框架产品 Pytorch, 该产品通用性强, 语言简单, 用户数量逐渐增多。 其他机器学习基础开源框架典型代表产品有 Theano、Caffe、Keras 等。 15 报告编码19RI0491 机器学习技术开放平台为开发者提供基于机器学习的应用开发环境, 可简化开发者对算 法的接口调用、 可视化、 参数调优等自动化任务的管理。 典型的机器学习技术开放平台包括 亚马逊的 Amazon Machine Learning、微软的 Azure 机器学习工作台、腾讯的 DI-X 机器 学习平台、阿里云机器学习 PAI 等。 2.3.3 产业链下游 下游的机器学习应用服务商为最终用户提供基于机器学习的垂直领域应用服务, 机器学 习广泛应用于金融、教育、医疗、工业、零售等垂直领域。 在金融领域, 机器学习可满足金融机构在数据处理安全性、 速度、 精确度等方面的高要 求,其在信用评分、投资组合管理、金融产品推荐、客户关系管理、金融欺诈检测等场景具 有高适用性。 金融领域的机器学习应用服务商有商汤科技、 依图科技、 云从科技、 竹间智能、 京东金融等。 在教育领域, 应用机器学习的产品包括语音测评产品、 智能批改产品、 分级阅读产品等。 语音测评产品通过机器学习提高口语测评、 统计评分效率, 智能批改产品通过机器学习大幅 提升批改准确率, 分级阅读产品通过机器学习为不同年龄段学生匹配合适读物。 教育领域的 机器学习应用服务商有科大讯飞、驰声科技、流利说、测评学、一起作业、高木学习等。 在医疗领域,机器学习在疾病监测、药物发明、辅助诊疗等方面具有高适用性,可显著 提高疾病监测效率, 缩短药物发明时间, 提高诊疗精确度。 医疗领域的机器学习应用服务商 有碳云智能、腾讯觅影、天智航、万里云、汇医慧影等。 在工业领域,机器学习可显著提升工业生产中的设备维护、产品质检、能源管理、物流 运输等环节的效率, 其在工业领域的渗透率不断提高。 工业领域的机器学习应用服务商有高 视科技、库柏特、Uptake 等。 16 报告编码19RI0491 在零售领域, 机器学习通过对电商客户的购买记录、 下单频率、 搜索内容等数据进行快 速分析, 并根据分析结果推荐符合客户需求的产品, 从而提升客户的回购率。 零售领域的机 器学习应用服务商有阿里巴巴、京东、旷视科技、Yi+科技、甘来科技等。 2.4 中国机器学习行业市场规模 2006 年以来,深度学习的推广应用速度逐步加快,应用领域不断拓宽,其逐渐成为机 器学习领域的主流算法。 在深度学习的带动发展下, 机器学习在人工智能应用市场中的应用 占比从 2014 年的 9.6%上升至 2018 年的 12.2%。 人工智能市场规模从 2014 年 71.7 亿元 增长至 2018 年的 339.0 亿元,年复合增长率达 47.5%,在人工智能商业化应用步伐逐步 加快以及机器学习应用占比不断提高的发展背景下,机器学习发展进一步加快。 机器学习广泛应用于金融、教育、医疗、工业、零售、能源等多个垂直领域,2014 至 2018 年, 各垂直领域的机器学习应用项目平均市场价格处于 500 万元至 580 万元区间内, 根据各垂直领域机器学习项目平均市场价格以及项目数量进行计算, 中国机器学习行业市场 规模从 2014 年的 8.7 亿元增长至 2018 年的 52.5 亿元,年复合增长率达 56.7%。随着机 器学习算法的不断改进, 其在各垂直领域的应用将进一步加深, 各垂直领域的机器学习应用 项目数量将不断增多, 预计至 2023 年, 机器学习市场规模将达 336.7 亿元, 2019 至 2023 年年复合增长率达 46.3%。 17 报告编码19RI0491 图 2-4 中国机器学习行业市场规模,2014-2023 年预测 来源:头豹研究院编辑整理 18 报告编码19RI0491 3 中国机器学习行业驱动因素 3.1 深度学习发展迅速 作为机器学习领域的主流算法之一, 深度学习凭借其适应性强、 准确率高等特点获得市 场高度关注,应用领域不断拓宽,其在图像识别、语音识别、人脸识别等领域的应用逐步加 深,发展步伐显著加快,深度学习的迅速发展是推动机器学习行业升级发展的重要因素。 在图像识别方面, 深度学习可通过叠加海量数据和计算机并行运算能力显著提升图像识 别精确度。2012 年起,在深度学习的赋能下,图像识别的精准度从 70%大幅提升至 95% 以上。2012 年,ImageNet ILSVRC 比赛中,冠军团队使用 CNN 网络 AlexNet 将深度学 习算法应用在计算机视觉算法改进中,将识别错误率一举降低到 15.3%。此后,ILSVRC 冠 军识别准确率不断提高, 识别错误率从 2013 年 ZFNet 的 11.2%, 到 2014 年 GoogLeNet 的 6.7%,再到 2015
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642