资源描述
1 2020年 中国AI开放平台精品报告 概览标签:人工智能,语音识别,芯片,新基建 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系 头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。 未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造 、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行 为发生,头豹研究院保留采取法律措施,追究相关人员责任的权利。头 豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标 ,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其 他任何第三方代表头豹研究院开展商业活动。 报告主要作者:李哲 2020/042 2020 LeadLeo AI开放平台是集成了AI算法、算力与开发工具的平台,通过接口调用的形式使企业、个人或开发者可高效使用平台中的AI能力完成 AI产品开发或AI赋能。中国AI开放平台的发展主要受政策红利推动与下游应用领域需求影响,随着“新一代人工智能开放创新平台”、 “新型基础设施建设”等政策的落实与下游应用领域渗透率的不断提高,AI开放平台的市场规模将保持快速增长。2019年中国AI开放 平台市场规模(按营收计)约为185.0亿元,预计在政策与需求的推动下,市场规模将在2024年达到1,512.9亿元。AI开放平台将成 为人工智能与企业服务中的重要组成部分。 政策红利将推动AI开放平台快速发展 政府从国家层面全面推进中国AI平台建设,建设“新一代人工智能开放创新平台”。截至2019年,包括科技部、发改委在内的15个部门构成 的新一代人工智能发展规划推进办公室已宣布将依托百度、阿里云、腾讯、科大讯飞与商汤科技分别建设自动驾驶、城市大脑、医疗影 像、智能语音与智能视觉五大领域的首批国家新一代人工智能开放创新平台。 平台与企业、开发者共建充满活力的AI生态体系 AI开放平台为企业与开发者提供AI功能接口的同时,逐渐担当起AI集市的角色,给予了企业与开发者销售渠道,与企业、开发者一同构建 了富有活力的AI市场化生态。以百度为例,已有超过400家服务商入驻百度AI市场,并有超过500个AI上下游商品在百度AI市场发布。百度 AI市场已成为企业采购AI服务,实现一站式AI赋能业务的首选平台。 中国AI开放平台呈现寡头垄断的竞争格局 中国AI开放平台市场集中度高,竞争激烈,大型AI厂商占有市场超过80%的份额。形成该现象的主要原因包括以下三点:(1)大型厂商 的数据积累帮助其取得算法优势;(2)大型厂商拥有全栈AI生态布局,为企业与开发者提供更多附加服务;(3)大型厂商具有高议价 能力,与小型平台服务商相比,客单成本更低,具有定价优势。 企业推荐: BosonNLP、合合信息、捷通华声 概览摘要3 2020 LeadLeo 名词解释 - 05 中国AI开放平台行业概述 - 08 定义与分类 - 08 平台功能与应用案例 - 09 接入方式 - 10 市场规模 - 11 中国AI开放平台产业链分析 - 12 平台建设成本分析 - 13 底层技术框架分析 - 14 上游基础设施分析 - 15 中游技术开发分析 - 16 中游经营模式分析 - 17 中游销售模式分析 - 18 下游应用分析 - 19 中国AI开放平台行业政策分析 - 20 国家政策分析 - 20 地方政策分析 - 21 中国AI开放平台行业驱动因素分析 - 22 上游芯片行业的高速发展 - 22 新型基础设施建设 - 23 目录4 2020 LeadLeo 中国AI开放平台行业发展趋势分析 - 24 市场化 - 24 免费化 - 25 全栈化 - 26 中国AI开放平台行业竞争格局分析 - 27 中国AI开放平台行业头部企业分析 - 28 各头部企业主要技术对比 - 28 各头部企业商业化程度对比 - 29 头部企业排名 - 30 中国AI开放平台行业投融资分析 - 31 中国AI开放平台行业投资建议 - 32 中国AI开放平台行业投资企业推荐 - 33 早期企业推荐BosonNLP - 33 中后期企业推荐合合信息 - 35 后期企业推荐捷通华声 - 37 中国AI开放平台行业投资风险分析 - 39 专家观点 - 40 方法论 - 41 法律声明 - 42 目录5 2020 LeadLeo QPS:每秒查询率(Queries-per-second),是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准,可理解为每秒并发请求数, 1QPS约86,400次调用。 机器学习:是一门涉及计算机科学、概率论、统计学、逼近论、凸分析等学科与理论多领域交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或 技能,重新组织已有的知识结构使之不断改善自身的性能。 计算机视觉:是通过机器学习模拟人类视觉功能人工智能技术,实现对图像或视频的识别、标记、分类与处理,是人工智能技术的重要研究方向之一。 语音识别:是通过机器学习模拟人类听觉功能的人工智能技术,实现对音频的识别、标记、分类与处理,是人工智能技术的重要研究方向之一。 自然语言处理:是一门融语言学、计算机科学、数学于一体的科学,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是人工智能技术的重要研 究方向之一。 TFlops: 1万亿次浮点指令每秒,可简单写为T/s,是数据流量的计数单位,是衡量一个电脑计算能力的标准。1TFlops=1,024GFlops,即1T=1,024G。 API:应用程序编程接口(Application Programming Interface),是预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又 无需访问源码,或理解内部工作机制的细节。 SDK:软件开发工具包(Software Development Kit),是辅助开发某一类软件的相关文档、范例和工具的集合。 深度学习:是机器学习的研究方向之一,是通过学习样本数据的特征规律与层次关系使机器具分析、归类、预测等人类智能行为的一项技术。 SKU:库存保有单位 (Stock Keeping Unit),是计量商品种类的单位,不同属性的同类商品也被分为不同SKU。 GPU:图像处理单元(Graphics Processing Unit),是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作 的微处理器,也可用于为人工智能模型训练提供算力。 SaaS:软件即服务(Software-as-a-Service),指通过网络等基础设施提供的软件服务,用户可在各种设备上通过客户端界面访问,如浏览器。消费者不需要管理或控 制基础设施,包括网络、服务器、操作系统、存储等等。 FPGA:属于专用集成电路中的一种半定制电路,是可编程的逻辑列阵。 UI设计:用户界面(User Interface)设计,是指对软件的人机交互、操作逻辑、界面美观的整体设计。 NLP:是自然语言处理的英文缩写(Natural Language Process) 名词解释(1/36 2020 LeadLeo IPS:每秒处理图片数(Image Per Second),是芯片算力的一种计量单位,表示在同一运算框架下,芯片算力的大小。 F1值:F1值=正确率*召回率*2/(正确率+召回率),用于评价不同AI算法之间的优劣势。 Bug:指系统或算法中存在的漏洞。 GitHub:著名开发者社区,同时是代码储存与交流平台。 深度学习框架:是一系列深度学习工具与代码的集合,能帮助开发者节省开发时间。 C+:一种主流编程语言,相对于其他语言,拥有计算机高效运行的实用性特征。 Python:一种主流的编程语言,相对于C+等语言而言更简单易懂,被广泛应用于人工智能、软件开发、量化投资、模型分析等领域。 R语言:是一种主流的编程语言,广泛应用于金融、统计领域。 Linux:全称GNU/Linux,是一套免费使用和自由传播的操作系统。 Model Zoo:Caffe2深度学习框架中的模型库。 卷积:通过两个函数f和g生成第三个函数的一种数学概念,表征函数f与g经过翻转和平移的重叠部分函数值乘积对重叠长度的积分。 SLA:服务级别协议(Service Level Agreement)的缩写,指提供服务的企业与客户之间就服务的品质、水准、性能等方面所达成的双方共同认可的协议或契约。 私有云:为一个客户单独使用而构建的云服务,因而提供对数据、安全性和服务质量的最有效控制。 新基建:新型基础设施建设的简称,指以5G、人工智能、工业互联网、物联网为代表的新型基础设施,也是信息数字化的基础设施。 LibriSpeech:人工智能学界语音识别领域重要赛事。 MOS值:通信术语,是衡量通信系统语音质量的重要指标。 ResNet-50:计算机视觉界一重要算法,是众多算法的基础。ResNet代表残差网络,而ResNet-50代表50层的残差神经网络。 ImageNet:计算机视觉界含金量最高的赛事之一,同时也指赛事所提供的数据集。 MegaFace:华盛顿大学人脸图像资料集,包含一百万张图片,代表690,000个独特的人像,是第一个在一百万规模级别的面部识别算法测试基准,是计算机视觉领域算法 的权威测试。 名词解释(2/37 2020 LeadLeo ICCV:指国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。 IEEE:指电气和电子工程师协会,是美国的电子技术与信息科学工程师的协会,是世界上最大的非营利性专业技术学会,其会员人数超过40万人,遍布160多个国家。 LFW:是著名的人脸数据集(Labled Faces in the Wild)的简称。 SQuAD:是斯坦福大学于2016年推出的文章数据集,是测试自然语言处理算法的阅读理解数据集,以榜单的形式在官网实时更新算法排名,是自然语言处理领域的权威 技术榜单。 Switchboard:是一个电话通话录音语料库,作为语音识别系统的基准,其已被使用超过20年,人类记录在Switchboard中的成绩为5.9%的词错率。 ICDAR:指国际文档分析与识别竞赛,是计算机视觉界的重要赛事之一。 PascalVOC :是著名的图像数据集。 PAI 3.0:指第三代阿里巴巴机器学习平台,是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。 Angel 3.0:是腾讯发布的第三代机器学习平台,由腾讯与北京大学联合研发,兼顾了工业界的高可用性和学术界的创新性。 名词解释(3/38 2020 LeadLeo 9 2020 LeadLeo AI开放平台的定义 来源:头豹研究院编辑整理 中国AI开放平台行业概述定义与分类 AI开放平台通过接口调用的形式 为用户提供AI算法、算力与开发工具,解决了以往企业 或个人部署AI时成本高、难度大、效率低与周期长的痛点 数据积累 数据积累 算法研发 算法研发 算力升级 算力升级 传统AI应用方式 传统AI应用方式 最终形成软硬件产品或解决方案 最终形成软硬件产品或解决方案 时间成本高 人力成本高 物力成本高 通过AI开放平台实现 通过AI开放平台实现 数据 数据 AI开放平台 AI开放平台 调用平台AI能力, 实现快速部署 时间快 成本低 最终形成软硬件产品或解决方案 最终形成软硬件产品或解决方案 AI开放平台解决传统AI应用方式“时间长、成本高”的痛点 AI 开 放 平 台 AI 开 放 平 台 应 用 平 台 应 用 平 台 技 术 平 台 技 术 平 台 开 发 平 台 开 发 平 台 开放能力面向垂直领 域配套多样化的解决 方案,如园区无人驾 驶系统,智能客服等 开放人工智能基础算 法或框架,如语音识 别、人脸识别、机器 学习等 开放机器学习、深度 学习、训练模型等开 发架构,同时提供开 发所需的算力支持 AI开放平台根据开放能力的不同分类 代表企业 AI开放平台的诞生背景:人工智能是科技部、国务院等政府机关所强调的重要国家发展战略与新型基础建设。 随着数据的不断积累、技术的逐渐成熟与底层算力的持续提升,人工智能正在进入应用落地阶段。但企业组 建人工智能团队独立开发人工智能的成本高、难度大、效率低、且开发周期长,制约了中国企业大规模应用 人工智能。因此,AI开放平台应运而生,其不仅降低了企业AI赋能的成本,同时提升了效率,使AI能力得到快 速部署且在不同行业中实现大规模应用。 AI开放平台的定义:AI开放平台是集成了AI算法、算力与开发工具的平台,通过接口调用的形式使企业、个 人或开发者可高效使用平台中的AI能力实现AI产品开发或AI赋能。以讯飞开放平台为例,个人可通过调用平 台中的语音识别功能完成录音到文本的转换,开发者或企业可通过API接口完成某APP语音输入功能的开发。 平台分类:AI开放平台根据其开放的能力不同可分为 三层,分别是应用平台、技术平台与开发平台。三层 平台分别为用户提供底层算力与开发工具、基础算法 与功能、垂直领域AI解决方案。 全栈平台:由于三层平台之间相辅相成,应用端数据 积累帮助训练底层算力工具升级,导致算法得到优化, 从而反哺应用端。因此AI开放平台多往全栈方向发展, 构建底层技术到应用的生态闭环。 AI开放平台的分类 训练算法模型 提供算力支持10 2020 LeadLeo 来源:百度AI开放平台官网,头豹研究院编辑整理 中国AI开放平台行业概述平台功能与应用案例 A I开放平台所开放的产品包括基础A I开发工具、A I技术能力与垂直领域定制化A I解决方 案,可满足企业与开发者的多样需求 百 度 大 脑 : 百 度 AI 开 放 平 台 应 用 平 台 语音技术 技 术 平 台 开 发 平 台 自然语言处理 人脸与人体识别 图像技术 知识图谱 视频技术 文字识别 数据智能 AR与VR 飞桨 智能创作平台 视频监控开发平台 AI Studio 智能对话定制平台 语言自训练平台 EasyDL 计算模型生成平台 IOCR自定义文字 识别 Apollo自动驾驶 智能教育 智能政务 Duer OS语音平台 智能农业 智能医疗 智能云 智能教育 AI开放平台功能与产品示例:百度AI开放平台 面向垂直领域:AI开放平台面向不同的垂直领域开放定制化解决方案,使传统企业 能快速实现产业AI赋能。以百度AI开放平台为例,平台开放了包括智能工业、智能 零售与企业服务在内的十大行业应用解决方案。 应用案例:对于江苏银行而言,贷款催缴是一件艰难的工作,上千人的团队每日需 外呼超过十万通催缴电话,真正有效的电话只有极少部分,且外呼人员流动性大, 需要经过培训方能上岗,对人力资源造成了极大的浪费。江苏银行通过接入百度企 业服务的智能外呼系统,颠覆了传统人工呼叫方式,可瞬间批量拨打,支持定时呼 叫以及智能化的统计分析与评价,大幅度提升了客户服务效率。 通用的AI功能:AI开放平台面向企业或开发者开放行业间通用的AI能力,使企业或 开发者在产品开发中无需独自开发AI功能,可直接通过API或SDK调用平台功能。以 百度AI开放平台为例,平台开放了包括语音技术、图像技术、文字识别在内10个大 项,171个小项的AI技术能力。 应用案例:中通快递通过接入人脸识别功能完成快递员的快速身份核准,快递员仅 需上传身份证照片与扫描脸部信息即可完成认证,解决了以往多次出现的员工卡被 盗用导致用户信息泄露的问题。 开发工具:AI开放平台为开发者设计了众多可帮助降低开发成本的开发工具与框架, 例如AI数据集、AI模型与算力等。开发者可利用平台的数据集训练自己的模型,或 利用平台中的算法框架定制出自己所需的功能。 应用案例:品览基于百度飞桨与AI Studio的开发能力,打造了“AI亿览通”,可通过 AI物品识别全面审核门店终端货架陈列,实现全国动态查看全国1,400家门店情况。 AI亿览通的SKU识别准确度高达97%,审核周期缩短、节省95%的核查人力资源,提 升50%以上的工作效率。 AI开放平台为帮助企业或开发者快速实现产业赋能或产品开发,已将AI功能或工具进行产品化改造,使企业或开发者能快速调用,可调用的能力包括语音技术(智能语音助 手,语音唤醒等)、视频技术(短视频审核、动态人脸识别等)与图像技术(车牌识别、图片搜索等)等。以百度AI开放平台为例,目前百度大脑已开放228项AI能力,拥有 超过150万开发者,日调用量已经超过万亿次11 2020 LeadLeo AI开放平台的主流接入方式 来源:头豹研究院编辑整理 中国AI开放平台行业概述接入方式 中国A I开放平台的主流接入方式包括A P I与S D K,两者均可完成功能调用,但在对接周 期,稳定性等特性上有所区别,因此接入方式的选择因开发需求而异 SDK API 对接周期 通常1-2天,需要理解文档再进行开 发使用,同时测试联调也需要时间 最快仅需1小时,支持自助式对接测试 稳定性 稳定性相对SDK较差,兼容问题可能 导致Bug的出现 稳定性好,一旦对接成功便不容易出错 安全性 安全性好,数据传输透明,无需授予 权限,不易泄露其他数据 潜在风险高,难以掌控SDK所获得的权限,在安 装前需进行安全检查以防止数据泄露或权限篡改 灵活性 灵活性高,完成对接测试后,可立刻 上线或进行二次开发,功能升级 灵活性差,需要客户端更新版本 客户端 无需改动 安装SDK会增加整体包的体量,通常在上百KB或 更高,轻量级应用若需安装多个SDK需权衡其带 来的体量影响 服务器端 需要服务器端的技术支持,同时需要 较强的开发实力 不需要服务器端的技术支持 价格 参考某头部AI开放平台的人脸关键点 识别API调用费用为0.03元/次 同样参考某头部AI开放平台的人脸关键点识别 SDK(联网授权),费用为20,000元/50,000元 /100,000元,分别对应授权1,000台/10,000台 /100,000台设备在一年内无限次调用 AI开放平台API与SDK接入方式的对比 API SDK API :应用程序编程接口(Application Programming Interface),是预先定义的 函数,目的是提供应用程序与开发人员基 于某软件或硬件得以访问一组例程的能力, 而又无需访问源码,或理解内部工作机制 的细节。 SDK : 软件开发工具包(S o f t w a r e Development Kit),是辅助开发某一类软 件的相关文档、范例和工具的集合。 AI开放平台主流的接入方式包括通过API或SDK,或是 通过私有化部署,但由于私有化部署需配套完善的算力 基础设施(高性能显卡、服务器、带宽、运维团队等), 同时无法完成实时升级优化,与AI开放平台低成本与便 捷的目的相违背,因此私有化部署除部分企业有特殊安 全需求外,不是行业主流接入方式。API与SDK由于方 便、高效且无需算力基础设施等优点,成为中国AI开放 平台的主流接入方式。开发者根据开发需求选择,API 适合定制化需求强、灵活性需求高的中小型项目,而 SDK更适合对稳定性要求高且流量大的大型项目12 2020 LeadLeo 来源:专家访谈,头豹研究院编辑整理 中国AI开放平台行业概述市场规模 2019 年 中 国 A I 开 放 平 台 市 场 规 模 达 1 85.0 亿 元 , 在 政 策 红 利 、 行 业 渗 透 率 提 高 与 芯 片 性 价比提高的推动下,预计中国AI开放平台市场规模将有望在2024年增长至1,512.9亿元 34.5 60.4 105.7 185.0 342.3 496.3 719.6 1,043.4 1,512.9 0 200 400 600 800 1,000 1,200 1,400 1,600 2016 2017 2018 2019 2020E 2021E 2022E 2023E 2024E 亿元 中国AI开放平台市场规模 年复合增长率 2016-2019年 75.0% 2019-2024年预测 52.3% 中国AI开放平台市场规模预计(按营收计),2016-2024年预测 政府从国家层面全面推进中国AI平台建设,建设“新一代人工智能开放创 新平台”。截至2019年,包括科技部、发改委在内的15个部门构成的新一 代人工智能发展规划推进办公室已宣布将依托百度、阿里云、腾讯、科 大讯飞与商汤科技分别建设自动驾驶、城市大脑、医疗影像、智能语音 与智能视觉五大领域的首批国家新一代人工智能开放创新平台。 政策红利 根据信通院发布的2018世界人工智能产业发展蓝皮书,AI在传统行 业的渗透率仅4%,仍有巨大提升空间。随着AI开放平台的出现,政府、 企业部署AI时的成本显著降低,更多的企业能使用AI技术实现信息化、 智能化转型,提高生产与服务效率。预计AI的渗透率将在5年内提升至 20%,将显著推动AI开放平台市场规模的上升。 下游应用领域扩大 政策红利、下游应用领域的扩大与算力成本的下降将推动中国AI开放 平台市场规模持续上升 中国AI开放平台的发展主要受政策红利推动与下游应用领域需求影响,随着“新一代人工 智能开放创新平台”、“新型基础设施建设”等政策的落实与下游应用领域的渗透率不断提 高,AI开放平台的市场规模将保持稳定增长。2019年中国AI开放平台市场规模(按营收 计)约为185.0亿元,预计在政策与需求的推动下,市场规模将在2024年达到1,512.9亿元。 芯片场景化与高性能化使算力成本显著下降 过往以传统GPU为主的AI芯片存在价格高、功耗高、性价比低的痛点, 导致AI开放平台的算法训练周期长,成本高。随着芯片设计开始针对不 同场景进行定制化与高性能化升级,AI芯片性价比得到显著提升,以探 境科技推出其语音AI芯片“音旋风611”为例,该芯片售价低于2美元,可 大规模应用于语音领域AI开放平台,进一步降低平台成本并提高服务质 量,提高平台的盈利能力。 在疫情背景下,政策推动人工智能等数字 化新基建行业的发展,AI开放平台将在其 中扮演重要角色,市场规模有望加速增长13 2020 LeadLeo 来源:头豹研究院编辑整理 中国AI开放平台产业链分析 中国AI开放平台产业链可分为上游基础设施与资源提供商、中游平台服务 商与 下游 应用 领域企业或开发者,其中大型综合性平台是产业链中话语权最强的主体 下游 中游 上游 基础设施与资源提供商:上 游主体包括芯片与传感器等 基础零部件供应商,与数据 提供商等 AI开放平台:中国AI开放平台按开放功能的种类可分为综合性平台与垂直领域平台。 中游市场由百度、阿里巴巴、腾讯与华为等大型AI厂商垄断,市场集中度高,前四名 占据超过80%的市场份额。细分领域厂商以创业公司为主,议价能力相对较弱,但通 常具有在细分领域的技术优势 应用领域企业:中国AI开放平台的主要下游应用领 域包括金融、安防、制造、医疗与教育等行业, 2018年中国AI在传统行业的渗透率仅为4%,其下游 应用领域仍有巨大增长空间 中国AI开放平台产业链结构 中国AI开放平台产业上游主体为基础设施与资源提供商,中游主体为AI开放平台服务商,下游主体为各应用领域企业。 计算机视觉 智能出行 智能医疗 智能金融 智能安防 智能教育 智能客服 智能制造 智能营销 语音识别&自然语言处理 细分领域平台 机器学习 芯片 传感器 数据中心及服务 综合性平台 智能终端 综合布局 14 2020 LeadLeo 来源:专家访谈,头豹研究院编辑整理 中国AI开放平台产业链平台建设成本分析 中国AI开放平台的建设流程可分为底层架构搭建、算法研发与产品封装三 个环 节, 其中 算法研发需要的时间与成本最大,也是平台建设中最核心的环节 中国AI开放平台的建设流程主要分为三个环节:(1)搭建底层架构;(2)算法研发; (3)产品封装。按20-40人左右研发团队估算,整体平台建设需要约6个月的周期。 搭建底层架构:AI开放平台的底层架构主要以AI开源框架为主体搭建,开源框架包 括谷歌研发的TensorFlow、Facebook研发的PyTorch与百度的PaddlePaddle等。通 过使用开源框架,可帮助厂商减少平台前期研发与设计成本,同时缩短搭建流程, 按5-10人团队估算,预计仅需要2-5周的时间。 算法研发:算法研发是AI开放平台建设流程中的核心环节,也是其AI功能的核心部 分,需要投入整个研发流程中最多且薪水最高的的工程师团队与最长的时间,按 10-20人团队估算,预计需要2-4个月的研发周期,同时存在研发失败,算法准确 率不达标的可能。 产品封装:产品封装是整个平台建设流程中最简易的环节,包括UI设计、调优测试 与最后的封装上线等,普通Java、API工程师即可完成。按5-10人左右团队估算, 需要2个月左右的时间。 中国AI开放平台的建设与维护成本主要包括三部分(不包括场地费用):(1)基础 设施成本;(2)人力成本;(3)数据成本。 基础设施成本:基础设施成本主要包括算力设施(GPU、FPGA等)、服务器、带 宽、电力等。算力设施上,由于单独购买设备的性价比远低于使用云服务,多数中 小厂商选择云服务的方式构建计算环境。按中小规模平台数据量估算,每月基础设 施成本约在3-8万元左右。 人力成本:不包括行政、管理等人力成本,核心研发团队须包括算法工程师、数据 工程师、架构工程师等,其中核心软件算法工程师成本最高,约为2-4万元/月,核 心研发团队工程师平均薪水约为2万元/月左右。 数据成本:算法研发需要数据支持,研发环节需要大量数据以供模型训练、纠错与 优化。除自有数据积累外,通常平台在算法研发环节需向第三方购买数据样本库, 以语音识别、合成等算法研发为例,平台除使用自有数据与开源语料库外,需购买 第三方语料库,成本通常为20-40万元。 AI开放平台的建设流程 AI开放平台的建设成本 搭建底层架构 算法研发 产品封装 按20-40人左右研发团队估算,整体平台建设需要约6个月的周期 人力成本 按20-40人左右研发团队估算,整体平台建设约需要410万元的成本 底层架构工程师:月薪约为1.5-2万元 算法研发工程师:月薪约为2-4万元 产品封装工程师:月薪约为1-2万元 数据及资源成本 开源框架:免费 数据库:语料库、人脸库等, 售价约20-40万元 平台建设成本 基础设施成本 以下以中小规模平台为例 算力:通常选择使用云计算,约2-5万/月 带宽:通常使用云服务器,约3-5千/月 电力:约3-5千 平台建设周期 平台建设流程 AI开放平台的建设流程与成本15 2020 LeadLeo 来源:专家访谈,各框架官网,GitHub,头豹研究院编辑整理 中国AI开放平台产业链底层技术框架分析 底层技术框架是AI平台搭建与算法研发的重 要基础,其中深度学习框架是底层技术框架 中最重要的组成部分 AI开放平台的底层框架 AI开放平台建设初期需要搭建底层技术框架,主要指深度学习框架。根据中国工程院院士高文提供的数据,全球深度学习框架90%以上的市场份额由谷歌开发的TensorFlow与脸书开发的 Pytorch占领。在搭建平台底层框架时,平台运营商可选择自主研发或使用外部框架,两种方式各有优缺点,由于自主研发的技术门槛高,多数厂家使用外部开源框架。 自主研发:自主研发的优势在于平台将不会受到生态限制,以谷歌的TensorFlow为例,平台运营商若使用TensorFlow作为深度学习的底层框架,其硬件API将只能接入TensorFlow上,而 TensorFlow部署在谷歌云上,就导致平台需要依赖谷歌的生态体系。自主研发的深度学习框架将赋予平台运营商更自由的发挥空间,减少对外部生态的依赖。但框架开发的门槛高,周期 长,成本大,以百度为例,百度在2013年成立深度学习研究院,期间大量相关科学家与工程师参与研发,耗时三年才发布深度学习框架PaddlePaddle。 使用外部框架:使用外部框架的主要优点在于多数外部框架是开源的,平台运营商可直接使用,可有效降低平台建设成本,缩短研发周期,省下的多余时间与成本可用于其配套工具的开 发。缺点是使用外部框架需要依赖外部生态,不益于平台自身生态的建设。 全球AI开放平台底层技术框架(深度学习框架)市场份额,截止2020年3月 接口简洁:更简洁,更简单的API 资源丰富:丰富的教程和可重复使用的代码 简单灵活:更多部署选项,更简单的模型导出 支持多GPU训练 TensorFlow是在GitHub、谷歌搜索、招聘热词中 最热门的深度学习框架 可视化:自带tensorboard可视化工具,能够让 用户实时监控观察训练过程 性能强悍:支持多GPU、分布式训练,跨平台 运行能力强 多用途:具备不局限于深度学习的多种用途, 还有支持强化学习和其他算法的工具 简洁易用:更少的抽象,更直观的设计,建模 过程简单透明,所思即所得,代码易于理解 细节化:可为使用者提供更多关于深度学习实 现的细节,如反向传播和其他训练过程 活跃的社区:提供完整的文档和指南,作者亲 自维护的论坛供用户交流和求教问题,但与 Tensorflow的社区相比还是更小 由谷歌开源 由脸书开源 由谷歌工程师Franois Chollet开源 由百度开源 由亚马逊开源 由伯克利人工智能研究小组开源 由蒙特利尔大学开源 由微软开源 适合业界:核心程序用C+编写,因此更高效, 适合工业界开发 直接易懂:网络结构都是以配置文件形式定义, 不需要用代码设计网络 资源丰富:拥有大量的训练好的经典模型 高质量的GPU代码 干净整洁:设计干净,没有太多的abstraction 分布式:支持CPU/GPU的单机和分布式模式 使用友好:带有比较强的业界特征,包括NLP和 推荐等应用场景 直接命令:支持命令式和符号式编程模型以最 大化效率和性能 多语言:支持七种主流编程语言,包括C+、 Python、R、Scala、Julia、Matlab和JavaScript。 MXnet是唯一支持所有R函数的构架 高效优化:Theano可高效地处理用户定义、优 化以及计算有关多维数组的数学表达式 已不再更新 系统友好:CNTK支持64位的Linux和Windows 系统,在MIT许可证下发布 向量运算:与 TensorFlow 和 Theano 同 样 , CNTK使用向量运算符的符号图网络,支持如 矩阵加/乘或卷积等向量操作 TensorFlow与 PyTorch, 90.0% 其他, 10.0% 其他典型 框架代表16 2020 LeadLeo 来源:专家访谈,阿里云,腾讯云官网,头豹研究院编辑整理 中国AI开放平台产业链上游基础设施分析 AI开放平台运营商在搭建平台基础设施时可 选用云服务或自建服务器,其中云服务适合 对成本敏感的中小平台,而自建服务器适合数据量大,已具规模的大型平台 AI开放平台在前期建设与后期维护中都需要用到大量基础设施,包括算力设施与其他设施(网络带宽、数据中心等)。算力设施决定了平台算法研发 的准确度与响应时间,其他设施决定了平台的稳定性、兼容性与拓展性等,两者直接影响平台产品与服务的质量。算力设施与其他设施均可通过云服 务搭建,与自建相比各有优缺点。 云服务(公有云):相比自建服务器,通过云服务调用基础设施如云计算、云服务器等,平台运营商可省去前期选购、安装、架构设计与调试的时 间。云服务由于规模效应的原因,使用成本远低于自建服务器。云服务的收费标准包括按量计费与包月包年,两种模式均为平台运营商提供了更大 的弹性,因此非常适合用户量较少的初创平台。另一方面,自建服务器在AI芯片的选择上存在局限性,通常只能购买普通市售的GPU板卡,如英伟 达Tesla V1000,而部分性能更领先的AI芯片如阿里含光800与华为昇腾910均不开放市售,仅支持通过云服务调用相关算力。 自建服务器(私有云):相比于云服务,自建服务器由于数据、算法、程序都部署在本地,因此在稳定性、数据安全性与调用速度上均有优势。但 由于成本明显高于使用云服务,自建服务器的方式更适合已具有用户规模的成熟平台,通过规模效应摊销自建服务器的高成本。 云服务与自建服务器的优缺点对比 云服务 自建服务器 性价比 使用弹性 接入便捷性 数据安全性 稳定性 注:某一搭建基础设施方式的矩形更长代表其在该指标上与另一方式相比更具优势 云服务接入价格远低于自建服务器,同时其性能上限更高,可调用如阿里含光800的业界领先AI芯片 云服务接入价格远低于自建服务器,同时其性能上限更高,可调用如阿里含光800的业界领先AI芯片 云服务采用按需按量计费与包月包年的模式为主,同时可随时按需升级或更改服务器型号或版本,相比自建服务器有更高的使用弹性 云服务采用按需按量计费与包月包年的模式为主,同时可随时按需升级或更改服务器型号或版本,相比自建服务器有更高的使用弹性 接入云服务可为平台运营商省去前期选购、安装、架构设计与调试的时间 接入云服务可为平台运营商省去前期选购、安装、架构设计与调试的时间 由于数据及应用部署在本地,且私有云通常搭建在防火墙后,其数据安全性要高于云服务 由于数据及应用部署在本地,且私有云通常搭建在防火墙后,其数据安全性要高于云服务 由于数据及应用部署在本地,其SLA相比于云服务更稳定,不受网络宽带影响 由于数据及应用部署在本地,其SLA相比于云服务更稳定,不受网络宽带影响 AI开放平台的建设流程17 2020 LeadLeo 来源:CSDN,头豹研究院编辑整理 中国AI开放平台产业链中游技术开发分析 算法是AI开放平台的核心也是技术开发的重点,同时也解释了AI开放平台的规模效应现 象,规模较大的平台拥有更多的样本去优化算法并训练模型 AI开放平台所开放的技术包括算法与开发工具,与行业应用产品,其中算法作为其核心产品可分为通用技术与行业定制化技术。通用技术算法包括 计算机视觉、语音识别、自然语言处理等基础人工智能技术。行业定制化技术包括车牌识别、自动驾驶、智能语音客服等。 算法是平台的核心。由于数据库与模型均可从外部获得,平台产品之间的核心差别在于算法的效率与准确率,算法直接决定了人工智能技术想的响 应速度与精度,是技术开发中最主要的环节。 语音数 据库 语音数 据库 文本数 据库 文本数 据库 字典 字典 特 征 提 取 特 征 提 取 模 型 训 练 模 型 训 练 特 征 提 取 特 征 提 取 模 型 训 练 模 型 训 练 特征提取 特征提取 搜索 算法 搜索 算法 声 学 模 型 声 学 模 型 语 言 模 型 语 言 模 型 语音 解码 算法 语音 解码 算法 语言 处理 算法 语言 处理 算法 语音输入 文本输出 数据 输入 结果 输出 可外部购买 可使用开源模型 可使用开源模型 可外部购买 需内部开发 需内部开发 需内部开发 平台核心技术 核心算法:该部分算法代表了平台产品技术的竞争力。 以语音识别为例,语音解码算法、搜索算法与语言处 理算法的效率直接决定了语音识别产品的响应速度, 同时算法的精度直接决定了识别准确率 规模效应:该模型再次体现了规模效应在AI开放平台 中的作用。具备规模的平台拥有更多的数据输入,意 味着大型平台拥有更多的样本去训练自己的模型并优 化自己的算法,从而提高其产品性能与服务质量 人工智能技术流程模型,以语音识别技术为例 数据 输入 结果 输出 数据 输入 结果 输出 算法是平台的核心也是技术开发中最重要的环节18 2020 LeadLeo 来源:专家访谈,头豹研究院编辑整理 中国AI开放平台产业链中游经营模式分析 中国AI开放平台主要通过免费模式、调用量计费与包月包年计费三种模式经营,平台经 营的核心之一是实现规模化,从而提高利润率与竞争力 用户量 客单成本 A B 客单成本随规模增长而下降 中国AI开放平台客单成本随规模 增长而减小,同样的用户量增长, 企业在q阶段所需的成本B要远低 于q阶
展开阅读全文