资源描述
2021-2022中国云原生 AI开 发平台 研究报告 摘要 行业背景: 近年来,国内人工智能技术成熟度持续提升、服务种类不断丰富,在企业 经营管理各环节的价值已得到市场的初步验证。然而,当前国内甲方企业在进行人工 智能开发和应用时仍然面临着技术 人才储备不足、 AI应用部署存在困难、投入产出比 不达预期 等问题,亟需能够帮助企业解决这一问题的高效 AI开发和应用工具。 产品 &关键技术: 云原生 AI开发平台融合了成熟的人工智能开发框架以及云原生工具 灵活调用云资源、高效部署云应用的能力,一方面帮助企业开发者 提高算法模型的开 发效率 ,另一方面 提升交付、部署、运维环节的效率并降低 TCO。横向对比甲方企业 可能采用的诸多获取人工智能能力的平台和方式之后,我们认为云原生 AI开发平台在 AI开发应用全生命周期视角下具备一定的综合优势。 应用场景: 云原生 AI开发平台在诸多人工智能密集应用的下游场景和行业具备通用性, 包括 互联网、金融、自动驾驶、政务、制造、营销 等。本报告挑选了部分应用场景, 梳理了上述场景下企业进行 AI开发和应用过程中面临的实际需求和难点,展示了典型 云原生 AI开发产品的服务架构以及对企业经营管理的价值。 发展趋势: AI开发平台还将朝着易用性、专业化、综合性、产用协同等方向发展,我 们认为在这一过程中, AI开发平台的 产品广度将进一步提升 ,并有望集成 DevOps、 AIOps等运维方法和工具,全方位融入企业的数字化经营体系。同时, AI开发平台的 服务业态还将向 软硬一体化 方向演进,深度融合技术交流社区等平台,形成 学用一体 化 的技术传播与升级环境。 来源:咨询研究院自主研究及绘制。 行业背景与产品综述 1 2 3 云原生 AI 开发场景与实践 云原生 AI开发平台发展展望 3 AI应用背景 在企业数字化转型的客观需求以及政策对发展前沿 IT科技的支持下,我国数字经济 高速发展,为人工智能发展创造了积极的经济环境。近年来,国内人工智能技术成 熟度持续提升、服务种类不断丰富,在企业经营管理各环节的价值已得到市场的初 步验证,伴随云计算的普及和云原生技术的发展,云服务将有望帮助企业解决现阶 段开展人工智能应用存在的难点,提升人工智能的效用。 4 人工智能发展环境( 1/2) 政策引导 AI算法的协同开发与 AI应用的产业化落地 过去数年间,国务院、国家发改委、工信部、科技部以及各省市、地方政府陆续发布了有关推进人工智能算法开发以及应 用落地的政策。在算法开发层面,政策明确倡导开源开放、互助共享的理念,支持具备人工智能资源与技术优势的企业、 高校构建促进 AI能力开源开放的平台,释放优势互补的协同效应,缩小我国人工智能技术与领先国家的差距;在人工智能 应用层面,政策鼓励人工智能等数字化能力在企业层面加大应用力度、在区域层面实现项目落地,通过人工智能等前沿 IT 技术驱动工业化和信息化深度融合。整体来看,国内政策对于人工智能始终保持积极态度,人工智能产业化和规范化的发 展前景会更加明朗。 近年人工智能应用相关政策解读 2 021.2.9 北京市人民政府 2021.1.13 国家工信部 工业互联网创新发展行动计划( 2021-2023年) 2021年市政府工作报告重点任务清单 指出 推动人工智能等科技创新重大项目在京落地 ,推动各方 科技力量优化配置和资源共享,支持包括 人工智能在内的新 型研发机构 发展,健全创新创业服务体系。 重点任务中指出鼓励大型企业 加大人工智能等数字化技术应用 力度 ,全面提升研发设计、工艺仿真、生产制造、设备管理、 产品检测等 智能化水平 ,实现全流程动态优化和精准决策。 2 020.8.7 国家发改委、科技部等 2019.11.13 国务院(修订) 国家创新驱动发展战略纲要 国家新一代人工智能标准体系建设指南 建设内容中,提出支撑技术与产品标准,其中 “ 关键通用技 术 ” 和 “ 关键领域技术 ” 涉及机器学习、知识图谱、自然语 言处理、计算机视觉和智能语音等重要 AI算法和技术的应用。 发展新一代信息网络技术,加强 类人智能 、自然交互与虚拟现 实研究,推动宽带移动互联网、云计算、物联网、 大数据 等技 术研发和综合应用,加快工业化和信息化深度融合。 2 019.8.1 科技部 2017.7.8 国务院 新一代人工智能发展规划 国家新一代人工智能开放创新平台建设工作指引 建设原则指出要以企业为主体,鼓励人工智能细分领域领军 企业搭建 开源、开放平台 ,面向公众开放 AI技术研发资源 , 向社会输出 AI技术服务能力 ,推动 AI技术的行业应用 。 指出要将人工智能提升至国家战略高度,以 开源开放 作为基 本原则之一,促进 产学研用 各创新主体共创共享 ,构建开放协 同的人工智能科技创新体系 。 来源:国务院等,咨询研究院根据公开资料研究及绘制。 人工智能发展环境( 2/2) 人工智能相关产业规模高速增长,市场需求更加明确 随着数字产业化和产业数字化的不断深化,我国数字经济高速发展,在宏观经济中的重要性持续提升。 2020年中国人工智 能核心产业规模超过 1500亿元,至 2025年预计超过 4500亿元, 2021-2025年人工智能核心产品 CAGR为 24%; 2020年人 工智能带动相关产业规模超 5700亿元,至 2025年将突破 16000亿元, 2021-2025年人工智能带动相关产业 CAGR为 22%。 在新产业、新业态、新商业模式经济建设的大背景下,人工智能产业的成长速度令人瞩目,并已逐步展现出从单向的产品 供应向各产业深度双向共建的发展特征,带动相关产业发展,回馈社会经济。在这样的发展环境下,企业对人工智能的需 求逐渐升温,人工智能在企业端的应用成熟度也渐入佳境。 2 005-2020年中国数字经济规模及占 GDP比重 2019-2025年中国 AI产业及带动相关产业规模 CAGR = 25% CAGR = 24% 3 8.6% 36.2% 34.8% 32.9% 6.1% 2 20.3% 14.2% 15.2% 39.2 16.6 35.8 31.3 13.9 27.2 11.4 9.2 16.2 7.4 5.7 9.5 4.5 3.8 3.7 3.0 4.6 2.3 1.9 2.6 1.5 1.1 2005 2008 2011 2014 2017 2018 2019 2020 2019 2020e 2021e 2022e 2023e 2024e 2025e 数字经济规模(万亿元) 数字经济占 GDP规模的比重( %) AI带动相关产业规模(千亿元) AI核心产品市场规模(千亿元) 来源:中国信通院( 2020),咨询研究院根据公开资料研究及绘制。 来源:咨询 2020年中国人工智能产业研究报告。 人工智能应用现状( 1/2) 感知智能相对成熟,认知智能加速发展 一般认为,人工智能可分为感知智能和认知智能两大类。感知智能以智能语音、计算机视觉和部分生物体征识别(如体态 识别)为核心底层技术,对应的上层应用为智能对话、图像识别和人体识别等,分别直接应用于客服机器人、智能安防、 智能监控等解决方案;认知智能以机器学习 /深度学习、知识图谱和自然语言处理等为核心底层技术,对应的上层应用为预 测建模、知识仓库、机器翻译等,分别直接应用于商业决策、智能推荐、全文信息检索等解决方案,二者是互为支持和补 充的关系,同一个 AI解决方案中往往包含多种技术。目前我国感知智能的算法研发和应用落地相对成熟,而认知智能正在 加速发展过程中,未来将有着更广阔的应用空间。 当前 AI感知智能 &认知智能算法及应用 AI感知智能 AI认知智能 智能语音 智能对话 呼叫中心 计算机视觉 生物体征识别 人体识别 监督学习 预测建模 知识图谱 文本匹配 机器翻译 直接应用 直接应用 互为支持 互为补充 图像识别 知识仓库 解决方案 解决方案 智能安防 智能监控 商业智能决策 智能推荐 全文信息检索 人工智能基础设施 算力服务 GPU FPGA 算法服务 数据服务 数据存储 CPU ASIC 人工智能算法模型 数据挖掘 数据治理 来源:咨询研究院自主研究及绘制。 人工智能应用现状( 2/2) 营销、客服、质检、安防等应用的市场价值已获得验证 具体到实际应用中看,人工智能已广泛渗入各行业经营管理的诸多环节,为企业带来更高效的自动化流程、更精准的情报 分析以及更智能的运营管理。当前国内人工智能应用成熟度较高的领域包括:在金融、互联网等需要密集与客户沟通交 流的行业中用于智能呼叫、客服、销售等环节,帮助企业提升触达能力和服务质量,从而提升用户粘性;赋能公安、交 通和企业内部的安防监控以及制造业企业的物流配送、产品质检等环节,代替人眼进行大规模监测并提升监测精准度、从 而提高调度和管理效率。整体来看,感知智能的诸多应用对于企业的应用价值已得到了市场验证,而涉及认知分析、智能 决策的认知领域的应用成熟度也正在逐步提高,已在部分行业展开试水,应用渗透有望加速。 人工智能应用于我国不同行业企业经营管理活动的主要环节 产品设计、采购评估 工艺优化 货仓物流 产能补充 情报研判、客户触达 设备运维 管理调度 质控、风 窗口服务 远程办事 人机对话 定价优化 效率提升 决策支持 营销运营 故损分析 运筹优化 控和安全 远程作业 政府 金融 互联网 医药 交通 零售 教育 制造 能源 电力 电信 计算机视觉 ML&DL 智能语音交互 NLP&知识图谱 图例 行业较少涉及 尝试应用 示范项目增加,形成典型场景 价值得到验证,规模化推进 来源:咨询研究院自主研究及绘制。 人工智能与云服务( 1/3) 云服务平台成为企业获取和应用 AI能力的重要渠道 当前各类前沿信息技术彼此融合促进,界限正逐渐模糊,无论是在技术开发、实施还是应用阶段,包括云计算、大数据、 人工智能等在内的多项技术都互为依托和补充。云计算在我国经历了十余年的发展,目前基础云服务已经进入成熟阶段, 各类上层应用以云服务平台为技术基座和分发渠道,逐步构建起云上的 IT服务生态闭环。具体到人工智能领域,云计算为 人工智能研发和部署提供计算集群、存储阵列等基础设施,通过大数据和 AI算法 PaaS提升企业进行 AI开发的节奏和效能, 而信息安全、敏捷开发等应用则间接提升了企业采用云上 AI能力的稳定性。对于企业的 AI开发和应用工作而言,云平台已 成为他们加强 AI能力的重要助力。 云上人工智能服务品类及应用现状 2021中国云服务产品市场份额 物联网 其他 人脸识别 语音合成 录音识别 机器翻译 文字识别 工业大脑 安全服务 配套服务 3% 2% SaaS 3% 建站推广 19% 小程序 % 信息安全 9 敏捷开发 可视化 资源统计 数据类 PaaS PaaS 算法类 PaaS API 数据仓库 数据治理工具 大数据计算分析 10% 专业服务 7% 1 基础软件 0% AI开发平台 AI开放平台 人工智能 API 1 企业应用 5% AI&大数据 2% 1 1 高性能存储阵列 CPU GPU FGPA IaaS 企业 AI能力使用情况调研 面向人工智能的计算集群 高速通信网络 9 3%的企业使用云上的 AI能力 来源: 1.咨询 2021年中国基础云服务行业发展洞察; 2.德勤( 2020),咨询研究院根据公开资料研究及绘制。 人工智能与云服务( 2/3) 云原生成为业界认可的云计算技术发展方向 以 Docker和 K8s为代表的容器和容器编排技术是云原生应用的典型代表,容器对基础资源的调用相较虚拟机更加轻量、敏 捷、高效,能够直接部署于物理机上作为资源调度器,但在当前的企业用云实践中,无论对于公有化还是私有化部署模式, 容器引擎普遍架构于虚拟机之上,对虚拟化的 IT基础设施实行弹性资源调度、流程自动化以及集群管理。整体来看,云原 生架构具备弹性扩容、敏捷分发、高效易用、兼容适配等主要优势,在云计算成为企业数字化转型标配的今天,云原生带 来了更加灵活的用云模式,能够帮助用户降低用云成本、提高云服务可用性和云端服务的质量,其价值已获得了产业界的 普遍认可,云原生也被认为是云计算未来的技术发展方向,诸多云端服务也被业界证实能够与云原生架构充分融合并带来 使用性能的提升。 容器云计算平台一般系统架构及容器云的主要优势 容器云的主要优势 应用管理 DevOps 微服务 监控管理 Serverless 应用测试 应用部署 版本控制 发布管理 订购管理 升级管理 镜像仓库 镜像打包 流水线 微服务架构 微服务治理 灰度发布 系统监控 系统日志 告警管理 应用服务 容器引擎 资源调度 集群管理 自动化部署 安全策略 负载均衡 服务管理 弹性伸缩 容器管理 API管理 虚拟化(云服务器) 云服务器 物理机 ARM架构 X86架构 来源:中国信通院( 2021),咨询研究院根据公开资料研究及绘制。 人工智能与云服务( 3/3) 云原生融合分布式计算性能更具优势,应用前景广阔 伴随着数据量的大爆发和数据应用的丰富,传统的集中式计算架构已无法支撑超大规模的数据处理需求,现今 AI应用主要 部署在以分布式为基础的云平台之上, AI模型开发以及应用事实上也是以分布式计算为基础。分布式计算通过将数据负载 分配到不同的终端进行统筹处理,以异步、并行、多线程的方式提高计算效率,同时,分布式系统的复杂化带来了环境一 致性下降、可用性不足、容错能力降低等问题,对于复杂的模型训练和超大规模的应用部署尤其突出。作为云计算未来的 总体发展趋势,云原生自诞生之始就以轻量的模块组合以及分布统筹为核心理念,其性能优势可以帮助使用者应对分布式 计算架构带来的诸多问题,从而为云原生与人工智能的融合提供了广阔的应用前景。 分布式计算系统架构带来的一般性问题 &云原生潜在性能优势 CAP“ 不可能三角 ” 环境一致性 C下降 Serverless 屏蔽异构环境 应用可用性 A不足 轻量化运行 微服务 分区容错性 P需求 横向扩展 编程协作摩擦 DevOps 颗粒度开发 安全性挑战 应用 &平台分离 灾备需求 容器化 集中计算概念 分布式计算概念 云原生组件 运维复杂度提高 伴随大数据的爆发、 AI应用在各场景不断渗透和云计算 的普及,基于分布式计算架构进行人工智能模型训练和 应用部署既存在客观需求,也具备了技术条件 相较于传统模式,分布式计算带来了计算能力整体的提升,但系统 复杂度随之增加,带来包括 CAP难题在内的一系列负面影响,而云 原生理念不仅与分布式概念天然契合,其应用架构和性能恰在一定 程度上为分布式带来的问题提供了解决方案,二者相辅相成 来源:咨询研究院自主研究及绘制。 企业 AI应用困境 尽管人工智能技术成熟度正在不断提高,但目前国内甲方企业进行人工智能应用仍 然面临着技术人才储备不足、 AI应用部署存在困难、投入产出比不达预期等问题。 我们认为,企业通过配备适宜于 AI开发的高性能软硬件基础服务,有望能够利用底 层技术的复用和 IT资源的灵活配置优化 AI开发和部署流程,提升 AI的价值创造能力。 1 2 AI人才仍短缺 人才短缺限制企业进行 AI开发和落地的步伐 作为前沿 IT技术的代表,人工智能产业近年来高速发展,带动了市场对 AI人才的集中需求。与许多发达国家相比,我国的 AI人才总数仍处于短缺状态,而在企业微观层面上, AI人才市场表现出人才相对集中于互联网科技公司,且技术人才缺口 更加显著等问题。人才短缺导致企业的 AI需求无法得到及时满足,而人才的培养也非一日之功,长期来看这依赖于 IT教育 的转型和结构调整,而在短期则更需要产业端通过复用成熟能力、降低应用难度、促进技术交流等方式来提升业内人员的 整体素质。 我国人工智能人才处于短缺状态 2 020年中国普通大型企业实际 我国整体 AI人才积累相对缺乏 020年多国 AI研究人员数量 AI岗位之中纯技术类人才缺口显著 2020年中国人工智能人才供需比 14% 释放岗位结构 2 其他 30% 7 1 88.3 4 52% 3 44% 86.2 泛 AI 9 8% 3 5.4 4 5% 2 2.2 3% 17% 13% 传统 IT 3% 4传统技术 3% 销售 产品 高级 实用 高端 应用 算法 经理 管理 技能 技术 开发 研究 2 美国 印度 英国 中国 企业 AI岗位空间比例较低 人数(千人) 人才供需比( %) 来源 : 1.Element AI( 2020),咨询研究院根据公开资料研究及绘制; 2.咨询 2020年中国人工智能产业研究报告; 3.工信部人才交流中心, N=2224,包括人工智能公 司和互联网、软件及传统公司,咨询研究院根据公开资料研究及绘制。 应用部署障碍 生产环境对 AI基础设施、算法及数据质量要求更高 企业在实际应用人工智能的过程中主要面临基础设施、 AI算法及数据等方面的阻碍。在基础设施方面,企业的 IT基础设施 在海量数据参与运算和采取分布式架构的条件下可能面临算力不足以及不兼容问题,从而降低企业 AI应用的可用性;在算 法领域,以 “ 大模型 ” 为代表的人工智能算法模型体现出模型参数的数量不断增加的趋势,高度复杂化的模型融入应用程 序后可能带来应用延迟的增加,而在交付和部署后对模型的修改也会给用户带来服务中断等问题;此外,由于训练 /测试环 境和生产环境存在差异,实际应用中的数据存在较多噪音、与模型匹配度较低,也会降低 AI应用的质量。总体来看,尤其 是中小企业在应用和部署 AI应用过程中所遇到的障碍更需要高质量的软硬件平台提供支持,降低开发者在基础配置和运维 方面的消耗的精力,并帮助开发者提升模型优化能力。 人工智能应用在生产环境中面临的应用和部署障碍 生产环境中数据质量存在波动,导致模型准确度 噪音数据较多 模型匹配度低 下降或出现错误 数据 工作环境中的数据带来的问题 历史数据( training data)和工作环境中的实 际数据结构差异较大,导致模型出现偏差 由后台模型的大规模更新带来 的前端应用中断、可用性降低 模型变更引起应用中断 算法 AI模型和软件本身导致的问题 模型过于复杂的设计会消耗更 多计算资源,增加系统延迟 模型过于复杂带来高延迟 特定的模型往往在部分硬件 设施上表现更好 硬件环境对应用的兼容性不佳 算力限制不足以支撑规模应用 基础设施 硬件及系统架构带来的问题 大数据应用规模不断提升,算 力资源池不足可能导致可用性 下降 来源:咨询研究院自主研究及绘制。 投入 -产出比不足 企业应用人工智能的回报尚不及预期 据统计,目前我国企业,尤其是非科技类甲方企业应用人工智能的效果还不尽如人意,许多企业表示人工智能落地后并未 达到预期的投入产出比。在成本和支出方面,企业进行 AI开发所需的人才和 IT资源价格较高并处于相对稀缺状态,引入 AI 给企业业务更迭和内部管理等带来的隐性成本也可能成为降低企业应用 AI效果的因素;在价值回报方面,尽管人工智能应 用在许多领域和场景已经得到验证,但对于不同的企业和具体工作环境,其效能可能并不稳定。因此,成本和效能两方面 原因共同提高了 AI应用对于甲方企业的门槛,导致企业不能充分享受人工智能带来的红利。 企业应用人工智能回报不及预期的现状及原因分析 2020年中国甲方企业 AI应用 ROI 成本和支出 企业应用人工智能的投入的资金成本包含人力和 IT资源支出,前者主要为 AI和数据专家 的工作报酬,后者包含自建或购置云服务资源的成本,二者均位于较高水平 在实际工作中,模型产出周期长、完成度低等问题给企业带来管理和运维方面的额外投 入,构成了企业进行 AI投入的隐性成本 完成全部 ROI 达成部分 9 .8% ROI指标 未完成 ROI 效能和价值 由于经验的缺乏和模型的不足,企业应用 AI于生产环境中面临模型精度不足这一直接问题 在生产环境中,负载的动态变化、场景的快速迭代都将给模型的架构和设计带来考验 4 3.9% 1 2.2% 2 020年我国就业年薪估算 2019年部分 AI模型训练成本(美国) 5 0 AI模型 Transformerbig ELMo 硬件 碳排放 lb 云计算成本 P100 x8 P100 x3 192 262 $635 $953 1 8 BERTbase NAS V100 x64 P100 x8 1438 626155 - $8161 $2072348 27955 9 未设定明 确 ROI 3 4.1% AI技术 IT行业 平均年薪(万元) 其他行业 GPT-2 TPUv3x32 来源: 1.咨询 2020年中国人工智能产业研究报告大中型企业 CTO/CIO调研, N=41, 2020年 9月; 2.专家访谈,国家统计局,咨询研究院根据公开资料研究及绘制; 3. Energy and Policy Considerations for Deep Learning in NLP, Emma Strubell等, 2019年 6月。 云原生 AI开发平台 云原生 AI开发平台以云原生容器服务为基础架构调用云资源,配合大数据计算、人 工智能计算以及分布式计算框架,服务于企业的数据分析、模型训练以及 AI应用部 署需求。借助容器、微服务、无服务器等云原生优势,企业和开发者得以在 IT成本 优化的条件下实现 AI算法高效训练、应用敏捷开发、程序灵活部署和全生命周期管 理。 1 6 云原生 AI开发平台架构 以云原生的敏捷高效赋能人工智能应用开发与部署 云原生 AI开发平台以云计算为基础,因为考虑到信息安全和数据隐秘性,该类项目在实践中通常以私有化部署和专有化部 署的云服务器为基础,通过容器组件进行 IT资源的调用,以微服务架构指导应用设计和开发,并配置分布式、大数据和人 工智能计算框架作为底层计算平台。云原生 AI开发平台内置数据智能标注、智能模型开发、 API开放平台管理以及云原生 应用部署等功能模块,辅以包括数据挖掘、网络安全等在内的数据资源管理系统,帮助企业敏捷、高效、安全地利用数据 进行人工智能应用开发,并在应用部署过程中实现成本优化和灵活的版本控制。 云原生 AI开发平台产品和服务架构 数据资源管理 行业应用场景 面向金融、安防、互联网、医疗等的行业的 AI SaaS服务 数据挖掘和清洗 高性能数据存储 基于知识图谱的数 据资产盘点 数据智能标注 模型开发和管理 API开放平台 API网关 云原生部署 图像、视频、文 模型编辑器 蓝绿部署 灰度发布 A/B测试 云基础资源弹 性伸缩 模型部署优化 AIOps/DevO ps高效运维 本、语音标注 多场景模板:图 像检测、分割、 综合标注 大数据建模组件 API插件 智能搜索与查询 可交互数据可视化 监控全链路数据使 用,保障数据信息 安全 行业场景化模板 可 视 化 拖 拽 模 型 构建组件 模型仓库 API编译器 行业及场景化 API应用模板 人工智能机器 学习平台 数据集管理 主动学习 智能预标注 兼容 AI框架 API后台管理 数据资产 ROI评估 兼容大数据引擎 云原生分布式人工智能开发平台 机器学习框架( TensorFlow/PyTorch/Caffe/Alink etc ) 分布式计算框架 云原生容器服务 云计算虚拟化平台 大数据计算引擎 云计算 -云原 生基础设施 基础硬件( CPU/GPU/FPGA/NPU)及网络通信设施 来源:咨询研究院自主研究及绘制。 相关应用图谱 云原生 AI开发平台相关应用图谱 云原生 AI开发平台 PAI 智能模型效率化生产 SageMaker ModelArts TI AI Station Brain+ 深泉 先知 AI 云 BML TempoAI Open Data Hub AI&大数据计算框架 云原生应用部署 容器引擎 OAM 容器编排 云计算基础设施 注释:本图谱企业排名不分先后。 来源:咨询研究院自主研究及绘制。 核心技术优势 资源灵活运用,模型敏捷开发,应用高效部署 我们着眼于企业在云上进行 AI开发的各个主要环节,可以发现这一过程也符合著名的 “ 2-8法则 ” ,在 AI应用中模型设计和 算法精度才是决定其应用价值的核心关键,但企业和开发者实际上将大部分的时间和精力投入了平台搭建、系统调试、团 队磨合、监控运维等 “ 非核心 ” 的工作中,云原生与 AI开发平台的结合帮助开发者减少对基础 IT资源的关注,并通过底层 技术复用、开发流程可视化等方式提高开发效率,因而在 IT基础设施调用、模型编写和测试优化、模型和应用封装、应用 交付及运维等领域更具备成本效率优势。 企业应用云原生 AI开发平台的优势与价值 8 020 随着数据量的增大和应用规模的横向拓展,人工智能在运行过程中易遇 成本高、可用性不足等问题 随着系统的复杂化,各类系统故障也易发生,通过日志分析、云原生智能 运维等,能够更快定位问题,快速恢复服务 运行维护 通过 蓝绿部署、灰度发布 等功能,云原生组件帮助企业在进行人工智能应用 发布时更加灵活和敏捷,帮助企业在时刻变化的市场环境中快速应对,缩短 应对的窗口期 人工智能应用开发也 发布 /交付 遵循普遍的 “ 2-8法 则 ” ,通常认为最有 价值的部分是模型设 计及算法精度,但实 际工作中大量的成本 被用于平台搭建、系 统调试等,云原生组 件在这一领域帮助企 业和开发者节省大量 的时间和精力 容器镜像用于保存程序代码及运行环境,与人工智能算法融合用于封装 AI算 法和应用,便于模型的 部署交付以及版本更迭 ,也便于通过云原生技术 社区 进行交流学习 镜像仓库 人工智能模型训练需要对模型进行反复运行、评估、修正,通过 pipeline等 云原生带来的自动化流程组件,能够提高参数选择、超参调优等过程的 自动 化水平 ,提升模型产出速度 模型测试优化 人工智能开发框架为开发者提供可视化、可拖拽的编程模型,使开发者能够 实时对模型运行过程进行把握, 提高模型质量,节约开发时间 微服务架构配合 DevOps开发工具,使得开发团队能以敏捷的方式进行复 杂人工智能应用的 协同开发 ,提升企业 IT效率和市场竞争力 敏捷化模型编写 由于数据资产的隐私性,实践中 AI开发平台多以公有 /私有化部署结合的形 式存在,容器及容器编排组件能帮助企业 更高效地利用各类基础设施性能 IT基础设施调用 结合 Serverless无服务器架构,能够 免去企业开发者用于配置平台的繁 琐工作 ,提升企业创造力 来源:咨询研究院自主研究及绘制。 核心技术优势:模型敏捷开发 多种开发模式,赋能人工智能低门槛、高效能开发 云原生 AI开发平台配备多种人工智能模型开发模式,其中较为典型的是可视化建模和编程式建模。前者利用 JavaScript脚 本等组件对算法进行封装,使得用户能够通过拖拽等图型界面进行模型开发,帮助对编程语言不熟悉的甲方企业的开发者 乃至业务部门进行定制化开发;另一方面,编程式建模一般基于 Tensorflow、 PyTorch、 Caffe等 AI开发框架,利用 Python等通用编程语言进行模型开发,由于上述开源框架普遍具备完备的功能,能够赋予开发者更多的开发选项和进行 编程优化的空间。云原生组件如容器和微服务框架也能够从底层架构方面对编程、测试等过程进行支持,进一步提升开发 者的开发效率。 可视化 &编程式建模为开发者提供多种 AI开发方式 可视化建模视图 利用 JavaScript脚本等组件对算法和计算过程进行 封装,让使用者能够通过图型界面进行人工智能算 法的开发 降低了 AI开发门槛,提升了模型编写效率 尤其适合甲方企业内部、对 AI开发框架熟悉度较低 的开发者乃至业务人员 编程式建模视图 Worker: replicas: 3 restartPolicy: OnFailure template: metadata: annotations: sidecar.istio.io/inject: false spec: containers: - name: tensorflow image: gcr.io/your-image command: 通过软件开发者熟悉的 Python等通用编程语言进行 人工智能模型的开发,融合 Tensorflow、 PyTorch、 Caffe等人工智能开发框架等 能够 调用人工智能开发框架成熟的底层能力,拥有 相对完备的功能和更高的自主性 更适合有编程以及人工智能开发经验的熟练开发者 - python - - - -m trainer.task -batch_size=32 - -training_steps=1000 来源: Kubeflow,咨询研究院根据公开资料研究及绘制。 核心技术优势:云原生部署 云原生发布、部署、运维组件提供便捷的 AI应用管理渠道 除人工智能算法编写开发之外,云原生 AI开发平台利用丰富的云原生组件赋能企业更好地对 AI应用进行发布、部署、运维 等方面的高效管理。除前文所提及的蓝绿部署、灰度发布和 DevOps运维等功能之外,云原生环境中常用的 API接口和网关、 便捷移植和扩容、边缘侧部署功能均对人工智能的规模应用形成支撑,帮助企业提升用户的使用体验,并降低企业的 IT经 营成本。 云原生在 AI应用部署及运维管理方面的优势 云原生 AI应用部署 & API接口 运维 运维管理 API接口和网关传统是用 于服务的调用和彼此交互, 在云原生环境中,可以用 于实现大量微服务组件的 集中管理、示例变更、负 载均衡等功能 云原生提供了便捷的日 志工具以及如 DevOps一 类的运维环境,便捷复 杂 AI应用的维护,提高 应用的效率 对于 AI应用而言,云原生理念和组 件在应用部署管理方面的功用相较 于在开发侧或更加显著 移植 /扩容 敏捷迭代 在人工智能的行业场景实践中,服务 商需要面临突发的负载高峰,云原生 提供灵活的横向扩展能力,从而提高 应用的可用性,也减少了配置和管理 底层资源的成本 为了适应市场需求变化与生产环境中数 据质量与维度的改变,企业对尤其是人 工智能应用设计和算法模型的迭代更新 频率较高,云原生更新组件帮助企业提 升迭代效率、降低迭代摩擦 来源:咨询研究院自主研究及绘制。 产品应用价值 经横向对比,云原生 AI开发平台更具成本效用优势 甲方企业获得 AI能力有多种渠道和方式,其中,从零开始进行自主研究能够最大程度贴合企业自身需求,但考虑到一般甲 方企业的 AI人才有限,此方法无论是从 IT成本角度还是从最终应用水平角度上看都不合算,如果直接购买产品化的软件, 虽免去了开发流程,但未必能够完全满足企业自身的特殊需求。目前,通过 AI开发平台进行自主订制化开发是企业常规的 选择,在此基础上考虑各类基础资源服务平台,则基于云原生架构的 AI开发平台在 IT成本优化、开发和部署效率、运维效 果等方面具备较好的表现。尤其对于中小企业而言,云原生 AI开发能够帮助企业在更大程度上弥补由资金和人才短缺带来 的技术水平限制,利于企业平衡 AI成本收益,打造符合企业需求的 AI产品。 甲方企业 AI开发模式效果对比 AI开发模式 完全自主研究 购买商业化软件 开源平台 IT成本优化 客制化 开发 /部署效率 运维效果 AI性能 - - 基于 AI 开发平 台进行 研发 纯公有化商业平台 纯私有化商业平台 云原生商业平台 注释: 1.本对比不代表具体产品性能及特点,仅代表行业一般水平; 2.图中开源平台的部署模式考虑为私有化 /非云部署。 来源:咨询研究院自主研究及绘制。 行业背景与产品综述 1 2 3 云原生 AI 开发场景与实践 云原生 AI开发平台发展展望 2 3 互联网娱乐场景的 AI需求分析 AI提升用户体验,并帮助企业实现精准营销 互联网娱乐行业的成长植根于各类前沿 IT技术,其产品服务和商业模式的演进与 IT技术的发展紧密相关。近年来随着人工 智能技术的进步,互联网娱乐产品的形式和内容也在不断迎来创新,互联网企业运用各类智能组件为用户带来了更强的沉 浸感、交互感和趣味性,同时也利用用户画像和智能营销系统充实客户群体、提高用户粘性。总的来说,人工智能在互联 网娱乐领域的应用非常广泛,同时,互娱企业在应用人工智能的同时也面临着设备、用户体验、推荐模型精度等方面的不 足,仍有较大的改进空间。 人工智能在互联网娱乐场景的应用需求和难点 互联网娱乐主要场景中的 AI应用需求 影视 +直播领域 音乐领域 游戏领域 通用 智能特效 美颜 /滤镜 高并发访问 自动标签 智能音效 真人 K歌 平滑切换 听歌识曲 音乐鉴权 防沉迷系统 反作弊系统 高并发访问 动作捕捉 用户画像 关联交友 语音交互 负载均衡 智能客服 低时延交互 画质重塑 音质优化 风格识别 智能创作 外语转译 低时延交互 AR/VR 个性化推荐 内容分发 智能运维 视频摘要 操作评估 机器人玩家 互联网娱乐场景中的 AI应用难点 包括互联网厂商的服务器、网络 基础设施、用户使用的终端在内, 设备本身的性能限制了包括 AI在 内的应用的性能,对于游戏、超 高清视频应用尤其如此。 无论是直播互动、音视频增强还是机 器人玩家,在互娱场景, AI应用始终 需要关注的是用户体验,目前许多领 域的 AI应用仿真度、实时性等并不能 让用户完全满意,还有很大提升空间。 互联网娱乐行业对流量逻辑有着 较强依赖,利用 AI进行精准用户 画像和智能营销已成为企业重要 的获客手段,然而目前这一领域 的算法精度还有待提高。 设 备 体 验 精 度 来源:咨询研究院自主研究及绘制。 互联网娱乐场景应用案例:南瓜电影 智能推荐助力打造私人定制影院,提升差异化服务体验 南瓜电影是专注于影视精品化运营的垂直类视频产品,通过移动互联网、 OTT等客户端提供精品化、差异化的内容运营 服务。随着互联网娱乐行业对用户时间和关注度的持续争夺,通过智能算法对用户进行精准画像并提供内容推荐成为行 业趋势,但在实践中存在推荐精度不足、算法参数复杂等问题。阿里云智能推荐为南瓜电影 APP提供了 “ 南瓜为你推 荐 ” 、 “ 根据您看过的 XX推荐 ” 、 “ 类似影视 ” 板块的推荐服务,结合电影语义分析、内容关联以及用户行为分析, 融合多目标优化,包括停留时长、点击率、消费等指标,可根据不同用户的习惯智能生成用户画像、结合用户长短期兴 趣喜好进行个性化推荐。 南瓜电影 阿里云:长 /短视频智能推荐服务 业务难点 解决方案 &产品价值 阿里云智能推荐产品架构 长视频推荐需兼顾多目标: 电 影、连续剧作推荐具备时长、 集数等概念,需要兼顾点击率、 停留时长、播放数量等目标和 参数 推荐精准度要求高: 需要结合 电影的素材、主题、核心内容、 片段内容等包含语义理解、深 度解读等特征来丰富物料画像 曝光过滤设置: 有时用户缺少 完整的时间段来完成一次长视 频观看,平台需考虑用户的重 复触达需求,设置合理的曝光 过滤时间 长短视频的多样性结合: 短视 频板块将电影中的精彩画面集 中呈现,为用户带来独特的观 影体验,推荐需要根据用户的 需求、习惯,融合不同视频类 型的特点、目标,多方位激发 用户兴趣,增强用户粘性,增 加用户停留时长 丰富的电影标签: 结合电影题材介绍、 影评等内容,通过语义分析和自动打 标来丰富电影标签,并通过专业的运 营、剪辑团队,将这些标签作为物料 的重要特征输入到推荐系统中,提高 推荐的精准度 时间因素分析: 经试验分析,计算出 将曝光过滤时间设为 3天较合理。对 于用户群体而言,可将内容适当重复 触达,达到提升推荐效果的作用 打造短视频专区: 南瓜电影为用户打 造了电影片段(短视频)的推荐专区, 既能为用户的碎片时间提供别致的观 影体验,又能将电影精彩片段快捷呈 现,引导一次完整的观影行为 用户习惯全方位打通: 通过长短视频 的智能算法接入,将用户的兴趣全方 位打通,根据用户习惯,喜欢观看的 电影题材,实现进一步的精准推荐。 同时,兼顾推荐电影的多样性,让用 户拥有新发现,促进观看时长的增加 控制中心 行
展开阅读全文