资源描述
摘要来源:咨询研究院自主研究绘制。受监管合规与商业内驱的合力推进,可信AI已然成为人工智能产业的发展趋势与研究重点。 此外,尽管大模型的研发取得了较大进展,各家厂商纷纷入局加码,但大模型实际落地应用 面临诸多卡点,未来或呈现大小模型云-边-端协同发展模式。同时,继AI民主化之后,AI工 程化走入大众视野,旨在提升从算力、数据、模型到上层应用的普惠性、兼容性、敏捷性、 经济性和高效性,打通AI全链路管理能力,助力AI企业实现落地赋能与商业变现的双赢。艾 瑞认为,未来AI技术的多项突破与基础层建设的进步可进一步促使人工智能产业的规模化落 地与健康发展。近年来,人工智能技术及产品在企业设计、生产、管理、营销、销售多个环节中均有渗透且 成熟度不断提升。随着新技术模型出现、各行业应用场景价值打磨与海量数据积累下的产品 效果提升,人工智能应用已从消费、互联网等泛C端领域,向制造、能源、电力等传统行业辐 射。数字经济的高速发展为人工智能发展创造了良好的经济与技术环境;同时,人工智能作 为关键性的新型信息基础设施,也被视为拉动我国数字经济发展的新动能。2021年,人工智能核心产业规模预计达到1998亿元规模,而到2026年,相应规模将超过6000亿元,2021-2026年CAGR=24.8%,计算机视觉仍是AI技术赛道中贡献最大的市场, 而以决策智能为主要类型的机器学习产品市场也将随着数据这一模型生产要素的重要性的提 升而得到巩固,并获得一定程度的增长。除AI技术赛道外,作为底层算力支撑的AI芯片的训 练与推理需求推动给人工智能产业规模增长带来较为强劲的推力。需求侧来看,各行各业以高频高价值场景为落点做持续AI泛化,愈多业务场景的泛化升级将 带来企业AI应用的数据连通与业务协同等加成效应,反哺加速企业的智能化转型进程;供给 侧来看,AI企业在过去一年中纷纷加快上市动作,多家企业已在2021年成功实现上市。本报 告详细剖析了人工智能企业商业化的价值路径,从轻量标准化产品、定制化解决方案、AI平 台等策略角度探讨人工智能企业未来发展方向,为行业参与者提供价值参考与有益见解。行业背景行业规模商业化探讨趋势展望数字经济时代人工智能产业社会经济价值1人工智能产业的持续增长力2人工智能产业的供需天平3人工智能行业标杆企业与新锐势力4人工智能产业趋势展望5人工智能产业化发展进程技术能力创新、应用规模突破、产业地位跨越随着2016年AlphaGo战胜人类棋手,开启了新一波人工智能浪潮,人工智能技术及产业进入加速发展期;2021年DeepMind团队开源AlphaFold2数据集,其利用人工智能技术解决蛋白质结构预测问题,供全世界科研人员使用。AI技 术应用于生物领域取得的前瞻性进展有力推动了生命科学发展,也代表随着AI算力提升及算法的不断突破创新,AI技术在 各行业领域的增量式技术改进、系统性前瞻性研发等重要产业改造环节提供价值。人工智能产业化进程发展至今,已逐步 从AI技术与各行业典型应用场景融合赋能阶段向效率化、工业化生产的成熟阶段演进。作为智能化转型工具,AI技术所带 来的创新增量价值引人瞩目,产业应用规模不断突破,数字经济加速器的产业地位逐步稳固。来源:咨询研究院自主研究绘制。产业角色相对稳定 技术价值稳步提升人工智能产业成为国际竞争焦 点,承担国家经济发展引擎功 能依托算法开发平台、AIDC算 力资源、数据基础服务等基础 层资源,多环节提效AI技术价 值的释放,解决需求方人工智 能生产力稀缺问题 AI产业社会化分工的出现,逐 步进入各产业深度参与、双向 共建的效率化、工业化生产阶 段各行业需求侧推动供给端 人工智能技术研发进步, 如自然语言生成技术、多 模态识别等人工智能技术应用于各行 业的集成化创新,如AR/VR/MR、物联网、5G 通信、半导体产业等决策类人工智能技术应用 突起,企业尝试依赖AI解 决主流业务问题人工智能技术真正能解决 需求侧某些应用场景痛点, 且符合经济效益人工智能技术在部分应用场景实现标准化应用计算机从数据中学习算法深度学习在语音图像领域 大获成功落地实验阶段应用普及阶段AI赋能百业阶段效率化、工业化生产阶段雏形期发展 轨迹时间起步期赛道孵化中部分赛道成形产品形态与商业模式探索龙头企业跑出 赛道竞争加剧 商业模式多元中国人工智能产业化发展进程现处于向成熟期跨越阶段 人工智能成为数字经济发展的基础设施数字经济的华章2020 39.22019 35.82018 31.32017 27.22016 22.62015 18.6企业云端迁移进程加速,数字经济高速发展数字经济是以数据为关键生产要素、以现代信息网络为重要载体、以数字技术应用为主要特征的经济形态。发展数字经 济,微观上可能重塑传统的企业经营模式和经营理念;宏观上,数据作为生产要素的重要性不断提升,将对现有基于要素 比较优势而形成的国际分工格局带来影响。发展数字经济,将打通供应链上下游、产业链的不同环节与服务链的各个节 点,通过产业的数字化升级,实现效率变革、动力变革、质量变革,助力新发展格局的形成与发展。近年来,我国数字经 济发展迅速,2020年我国数字经济规模为39.2万亿元,占GDP比重达到38.6%,较2019年提升2.4pct,对整体经济产值 的影响进一步加大。在我国“十四五规划”中,国家也首次明确提出要将数字经济核心产业增加值占GDP比重由2020年 的7.8%提高到10%。未来,随着网络传输速度,海量数据积累,云计算、人工智能、物联网等代表性技术的成熟,数字 经济将在各行业开启更大的想象空间。2015-2020年中国数字经济规模及占GDP比重38.6%36.2%34.8%32.9%30.3%27.5%中国数字经济规模(万亿元)中国数字经济规模占GDP比重(%)来源:中国信通院中国数字经济发展与就业白皮书(2020年),咨询研究院自主研究及绘制。数字经济下的人工智能产业升级AI成为数字经济时代的核心生产力,驱动数字经济纵深发展2021年3月我国十四五规划纲要出台,提出“打造数字经济新优势”的建设方针并强调了人工智能等新兴数字产业在提高 国家竞争力上的重要价值。规划纲要指出要充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合, 赋能传统产业转型升级,以数据驱动生产过程优化,催生新产业、新业态、新模式。数字经济的高速发展为人工智能发展 创造了良好的经济与技术环境;同时,人工智能作为关键性的新型信息基础设施,也被视为拉动我国数字经济发展的新动 能。随着新基础设施计划的实施、消费互联网的升级和产业互联网的发展,人工智能科技产业开始步入全面融合发展的新 阶段,成为数字经济时代的核心生产力和产业底层支撑能力,是激活数字经济相关产业由数字化向智能化升级的核心技术。人工智能成为数字经济时代核心生产力企业将扩大人工智能资源引进规模,加大自主研发投入,将人工智能与 主营业务结合,提高产业地位和核心竞争力工业建筑与地产批发零售金融农林牧渔 交通 物流 教育 110万亿元2- 数字经济产业深度共建 通过AI能力输送,AI 新基建成为“电/路/通信”级基础设施,广泛回馈数字经济相关产业。假定产生1.6%的损耗降低及产能扩大价值,则增益 近1.76万亿元2021年中国各行业数字化、信息化与专业技术服务投入+Top投入行业1- 固有业务主线延续人工智能现有产值占比约4.1% 约2000亿元工业医疗卫生共管理教 育 公金融其他4. 9万亿元人工智能技术助力数字经济相关产业质量变革、动力变革与效率变革2021年中国GDP+Top贡献行业来源:咨询研究院根据国家统计局、工信部及自主研究积累绘制。人工智能助力产业经济价值实现人工智能于各环节提升经济生产活动效能近年来,人工智能技术及产品在企业设计、生产、管理、营销、销售多个环节中均有渗透且成熟度不断提升。同时,随着 新技术模型出现、各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等泛C端 领域,向制造、能源、电力等传统行业辐射。以计算机视觉技术主导的人脸识别、光学字符识别(OCR)、商品识别、 医学影像识别和以对话式AI技术主导的对话机器人、智能外呼等产品的商业价值已得到市场充分认可;除感知智能技术 外,机器学习、知识图谱、自然语言处理等技术主导的决策智能类产品也在客户触达、管理调度、决策支持等企业业务核心环节体现价值。来源:咨询研究院自主研究绘制。人工智能技术广泛渗透进经济生产活动主要环节产品设计、 采购 定 价 及 组 评 估 合优化工艺 优化货仓产能补充 情报大数 物流与作业效 据研判、率提升决策支持管理调度 运筹优化质控、风 控和安全窗口远程办事 人机对话 服务远程作业交互客户触达 设备运维 营销运营 故损分析该行业较少涉及该场景尝试应用AI AI价值得到验证, 进入规模化落地AI示范项目增加, 形成典型应用场景图例政府 金融 互联网医疗与制药交通 零售 教育 制造 能源 电力 电信人工智能助力产业经济价值实现来源:咨询研究院自主研究绘制。市场规模A. 2020年市场规模B. 2021年市场规模C. 2026年市场容量D. 2021年融资热度场景效果A.场景定义清晰度B.场景效果价值C.客户期望价值技术水平A.算法成熟度B.算法可增量空间C. IT信息化程度数据质量A.行业数据规模B.数据治理水平C.反馈数据可用性人才储备与产业基础A.技术人才储备B.产业数字化基础成熟度总览图例制造能源电力电信人工智能助力产业经济价值实现分行业成熟度泛安防政府金融互联网 医疗与制药零售教育颜色由浅至深表示水平由低至高颜色由浅至深表示水平由低至高人工智能助力产业经济价值实现人工智能产业发展将打开新一轮城市与区域竞争变局在产业数字化和数字产业化浪潮下,城市经济转型和升级过程中创造出的智能化需求,是促进创新资源聚集和产业发展的 关键因素。以智能化需求为导向,构建和培育富有活力的创新生态,是区域人工智能科技产业发展的前提和基础。人工智 能产业发展也打开了新一轮的城市与区域竞争变局。根据中国新一代人工智能发展战略研究院2018-2021年针对区域人 工智能科技产业竞争力评价指数的追踪研究表明,2021年长三角总评分首次超过京津冀位列第一。人工智能和实体经济 融合发展进程的加速和北方人工智能科技产业创新资源的“南移”是改变区域竞争力发展格局的重要因素。因此,各区域 应加速补全人工智能及面向各行业的产业链、积极建设示范性智慧应用场景、前瞻布局人工智能相关标准及管理体系、推 动公共研发等资源共享、强化科研与人才培育建设、鼓励系统性超前研发布局等以把握人工智能产业发展的重大历史机遇。注释:构建的人工智能科技产业区域竞争力评价指标体系包括6项一级指标和10项二级 指标。在二级指标之下,再从数量和质量两个维度设立相应的24项三级指标。采用层次 分析法计算各级指标的权重。来源:中国新一代人工智能发展战略研究院中国新一代人工智能科技产业区域竞争力 评价指数(2021年),咨询研究院自主研究及绘制。中国四大经济圈人工智能企业数量与 人工智能科技产业区域竞争力评分京津冀100.52分企业数量656(29.75%)NO.1 长三角101.90分企业数量672(30.48%)珠三角65.50分企业数量596(27.03%)川渝24.71分企业数量76(3.45%)中国四大经济圈人工智能企业层次数量分布540 561 536 6897 93 719 18 50 10 1京津冀长三角珠三角川渝应用层(个)技术层(个)基础层(个)来源:中国新一代人工智能发展战略研究院中国新一代人工智能科技产业区域竞争力 评价指数(2021年),咨询研究院自主研究及绘制。具体到中国四大经济 圈,人工智能企业分 布仍主要集中在应用 层企业京津冀及长三角地区基础层及技术层企业占比高于珠三角及川 渝地区。体现了前两 者在人工智能产业布 局完善、发展动力及 潜力强劲的区域优势11数字经济时代人工智能产业社会经济价值1人工智能产业的持续增长力2人工智能产业的供需天平3人工智能行业标杆企业与新锐势力4人工智能产业趋势展望51157 1585 1998 2476 3106 3859 4869 60503821 5687 7695 9396 173621404411605 210772019 2020 2025e 2026e2021e 2022e核心产品市场规模(亿元)2023e 2024e带动相关产业规模(亿元)人工智能产业规模视觉市场筑起主要版图,头部规模聚集效应显现人工智能产业正从发展期向成熟期过渡,除AI芯片外的细分技术赛道产业已跨过高速增长期,步入了稳步增长阶段。2021年人工智能核心产业规模预计达到1998亿元规模,相应规模将于2026年超过6000亿元,2021年到2026年的CAGR 为24.8%,计算机视觉仍是AI技术赛道中贡献最大的市场。然而,随着下游各方数字化发展的意识不断加强,其对数据这 一AI模型生产要素的要求也在不断变高,采购含有机器学习技术的数据类产品的需求暴露与凸显,在一定程度上带动了机 器学习市场。除AI技术赛道外,AI芯片作为底层算力资源的关键硬件,其2021-2026年的CAGR在维持40%以上,是拉动 整体产业规模增速的重要拉力。从参与者类型看,我们判断大约30%-45%的市场仍为人工智能创业企业所占据,且随着 头部人工智能企业冲刺科创板或港股市场的进步,其市场份额会进一步扩大,市场份额的高地也会进一步为头部人工智能 企业所占领。从外围赛道入场的互联网公司、云服务公司、大数据公司、信息技术服务公司、通信设备公司以及个别科研院所则切分其余市场。注释:核心规模包括计算机视觉、智能语音、对话式AI、机器学习(含自动驾驶)、知识图谱、自然语言处理、AI芯片等核心产业;带动规模为为达到AI应用目的而连带采购的、具 有相关性的软硬件产品、服务。来源:咨询研究院根据专家访谈与桌研自主建模研究绘制。CAGR=24.8%CAGR=22.3%2019-2026年中国人工智能产业规模人工智能产业图谱注释:以企业主营业务为主。图谱中所展示的公司logo顺序及大小并无实际意义,不涉及排名。 来源:咨询研究院根据公开资料研究绘制。2021年中国人工智能产业图谱人工智能基础层人工智能技术层AI 框架AI 开放平台商用版 AI 应 用模型效率 化生产平台AI 算力基础AI 芯片 (Fabless)智能服务器与高性能计算中心智能云技 术 及 应 用 标 准 与 规 范科 研 学 术 机 构 与 各 层 次 人 才通 信 与 信 息 网 络数 据 存 储 设 施物联网 与微型传 感器关键通用技术机器学习知识图谱关键领域技术计算机视觉语音识别自然语言处理人工智能应用层城市公共事业、企业级客户、消费者AI 基础数据服务AI 数据资源管理大数据治理与数据智能方舟 先知Brain+AI 模型生产SenseParrots AI +工业自主无人系统AI +金融计算机视觉流程智能计 算 机视觉 知识 与决策预 维测 护与对话式AI AI +零售AI +政务AI +泛互联网视觉与图像规划与推荐智 能 汽 车智 能 机 智能搜索器人 无 人 机业务决策智能客户服务AI +泛安防AI +医疗计 算 机 视觉 大智 数能 据化医 辅 学 助 影 诊 像 断大 决 数 策据 辅 及 助辅 制 助 药机器学习本章赛道内容分为以下四个部分:赛道背景解读:在数字经济大背景下,机器学习作为数字产业化的商业应用与产业数字化 的技术工具,迎来了难得的发展机遇;从资本情况看,融资事件与金额增多,且轮次靠前。产业规模解读:核心产品市场规模与带动相关产业规模处于增量爬升阶段,存量市场尚未形成,大数据类产品与机器学习平台的软件部分为主要核心产品类型,下游市场以金融、工业、医疗、自动驾驶及互联网为主。商业模式趋势解读:中短期内,业内玩家以决策智能为发力点,构建机器学习平台,提供 定制化解决方案,服务于甲方企业生产经营的决策管理。未来,机器学习平台与数据治理 类产品的边界将被打破与连接,二者将以一体化的趋势向前发展;MLOps作为机器学习的DevOps,将服务于机器学习生命周期全流程,提升模型敏捷开发效率与管理运行效率。大模型落地方法论探讨:大模型作为新兴的通用化产品形式而广受追捧,但其应用落地存 在诸多卡点,因而大小模型云-边-端协同的发展模式被提出。 Machine Learning数字经济为机器学习创造发展机遇注释:数字产业化为数据要素的产业化、商业化和市场化;产业数字化指利用现代数字 信息技术、先进互联网和AI技术对传统产业进行全方位、全角度、全链条改造,使数字 技术与实体经济各行各业深度融合发展。来源:咨询研究院根据中国信通院发布数据自主研究绘制。来源:咨询研究院根据公开资料自主研究绘制。 产业数字化步伐逐渐加快,主导地位凸显 电子商务、API经济、平台经济等数字化商业模式涌现机器 学习数字经济时代来临,企业数据意识觉醒数字技术的发展与应用,使得各类社会生产活动能以数字化方式生成为可记录、可存储、可交互、可分析的数据、信息与 知识,数据由此成为当代社会的新生产资料和关键生产要素。与传统经济相比,数字经济的蓬勃发展为生产要素、生产力 和生产关系赋予了新的内涵与活力,其在推动劳动工具数字化的同时,也构建了共享合作的生产关系,如API经济、平台 经济等合作模式得到广泛认可与推广。在此背景下,加快推动数字产业化、推进产业数字化转型成为了企业顺应时代发 展、打造数字化优势的主动选择,而机器学习作为数字产业化的商业应用与产业数字化的技术工具,迎来了难得的发展机 遇。这一机遇体现在企业的数据意识觉醒并采购数字解决方案或应用中。诸多企业开始构建数仓、数据中台、数据平台等 与数据治理有关的项目,并基于已治理好的数据,构建各类“数字+AI”应用。而无论是数据治理这一过程,还是“数字+AI”应用,都离不开机器学习这一最基础的AI算法工具。2015-2020年中国数字经济内部结构变化机器学习应用于企业数据业务多源 异构 数据企业 数据外部 数据结构化 数据业务应用新数 据数据采集 与清洗数据治理价值化 数据数据 应用产生入库74.3% 77.0% 77.4% 79.5% 80.2% 80.9%25.7% 23.0% 22.6% 20.5% 19.8% 19.1%2015 2016 2017 2018 2019 2020产业数字化数字产业化融资情况工业赛道收获高度资本青睐,总体轮次靠前2018年到2021年11月,中国机器学习累计总融资事件数为221起,总融资金额为294.9亿元。相较于往期,2021年中国 机器学习的融资情况为统计期内融资事件最多、金额最大的时间节点。十四五规划发布以来,新基建作为国家的重点战略 发展方向驱动着工业互联网的发展,机器学习则作为工业互联网的必要支撑技术获得了众多资本的青睐,其中代表性融资 案例为国家级的工业互联网公共服务平台企业航天云网,于2021年3月获得26.3亿元的大额融资,该金额占2019年 融资总额的77.6%。此外,中国机器学习的融资轮次主要集中在A+轮及以前,占累计融资事件数的49.8%,这意味着机 器学习市场并未定型,赛道中还活跃着诸多新参与者。在13.9%的C轮及以后融资事件中,不乏数据治理企业(含数据中 台与数据平台)、新药研发企业,也有以机器学习为行业标签的头部玩家。来源:咨询研究院根据各融资网站数据调整与处理绘制。来源:咨询研究院根据各融资网站数据调整与处理绘制。2018-2021年11月中国机器学习融资事件数与融资金额情况75 29 8355.9 34 33.9 72.7 132.42018 2019融资事件(起)2020 2021.1-11融资金额(亿元)49.8%23.6%13.9%2018-2021年11月中国机器学习融资轮次情况12.7%A+轮及以前C轮及以后PreB轮到B+轮战略、并购、股权及未公开细分赛道融资热度注释:融资热度根据事件数计算;细分赛道热度与细分赛道业务表现不完全成正比。 来源:咨询研究院根据各融资网站数据调整与处理绘制。金融、医疗、工业为热门赛道TOP3在统计时间内共有215家企业获投,金融、医疗、工业为热门赛道TOP3。金融赛道率先领跑的原因有以下两点:1)丰富 高质的数据积累是机器学习发挥作用的基础,而金融领域的银行、保险公司、证券公司等本身就具备良好的信息化基础与 数据积累,因此,金融与机器学习各类模型的契合度高,为机器学习产品提供了生长发育的天然土壤。2)金融机构普遍 存在营销获客难、风险防范难、用户管理难的业务痛点,对精准营销、智能风控、反欺诈、反洗钱等机器学习产品有强烈 需求。2021年医疗赛道机器学习的大热得益于新药研发与手术机器人。新药研发首先要收集各类药物分子数据、临床试 验数据,而后将数据输入机器学习平台计算药物结构;手术机器人则需要机器学习增强人机手术协作、改善手术决策链的 各个环节,提升数字手术的精度与准确度。在工业领域,除工业机器人外,工业互联网平台亦需要机器学习进行数据分析 以完成质检、安全事故监测、业务流程优化等。2018-2021年11月中国机器学习融资赛道热度情况215家获投47.0% 32.6% 24.2% 15.3% 12.1% 10.7% 10.2% 7.4% 4.7% 4.7% 3.7% 3.3% 2.8% 0.9% 0.9% 0.9% 0.5% 0.5%167 224 275 329 399 477 578 7003766315826472179180914681025 44212019 2020 2025e 2026e2021e 2022e核心产品市场规模(亿元)2023e 2024e带动相关产业规模(亿元)机器学习产业规模注释:核心产品市场规模为机器学习平台、大数据平台与数据中台中的机器学习模块部分以及应用解决方案中的机器学习模块等。带动规模为为达到机器学习应用目的,而连带采购 的、具有相关性的软硬件产品、服务。来源:咨询研究院根据专家访谈与桌研自主建模研究绘制。核心规模超270亿元,带动规模超1800亿元机器学习是人工智能的核心内容,也是各类算法的根源,其本质是函数,可基于大数据来推算实际业务中事件的可能性, 从而帮助甲方企业进行分析、判断与决策。在数字经济背景下,金融、制造、医药等具备数字化基础优势的行业对数据应 用的认识正在逐步加深,政务、教育、农业等数字化水平低的行业也意识到数字化发展的必要性,可以说,各行各业都正 在计划、启动或进行数字化工程,而该工程是机器学习发挥价值、拉动机器学习产品及服务的业务点所在。以此为出发 点,进行了机器学习市场规模测算。2021年,我国机器学习产品服务的核心市场规模将达到275亿元,并以20%以 上的年均增速发展,2026年有望达到700亿元,核心规模在2021-2026年的CAGR为20.6%。而在2021年,我国机器学 习产品服务的带动市场规模将达到1809亿元,2026年将达到4421亿元。2019-2026年中国机器学习核心产品及带动相关产业规模CAGR=19.6%CAGR=20.6%机器学习核心行业规模注释:核心产品市场规模为机器学习平台、大数据平台与数据中台中的机器学习模块部分以及应用解决方案中的机器学习模块等。80 98125 150决策智能带动金融市场,L1L2为自动驾驶市场主要产品从行业横向对比,信息化建设完备、数据标准相对统一的金融领域无疑是最先起跑、市场空间较为可观的赛道。在数据燃 料准备充分的前提下,银行、保险公司、证券公司以及基金展开了决策智能产品的引入之路,以克服营销获客难、反交易 欺诈与非法集资等业务痛点,且因业务的多变性、复杂性,其会叠加采购不同业务的解决方案。2021年,金融领域的机 器学习规模可达125亿元,2026年将超过270亿元。工业整体的数字化程度较差,汽车制造业、电子设备制造业、电力热 力供应三大细分子行业率先树立起数字化建设的标杆,采购嵌入机器学习技术的大数据产品与机器学习解决方案,服务于 生产线故障排查与质检、电路故障排查与检修等业务。自动驾驶领域,核心规模主要来自L1L2等级的产品,2021年L1L2等级产品的比例高达72.8%,未来占比将由L3及以上等级的产品扩充。2019-2026年中国机器学习核心产品在主要行业应用规模27224020818142 49 58 82 12032 17 68 47 99 89 13530 17 63 49 59 6812 9 13 32 24 17 36 32 20 41 23 27 32 362019 2026e2020 2021e金融领域市场规模(亿元)自动驾驶领域(亿元)2022e 2023e 2024e 2025e工业领域市场规模(亿元)医药领域市场规模(亿元)互联网领域市场规模(亿元)中短期发展焦点:决策智能来源:咨询研究院结合公开资料自主研究绘制。来源:咨询研究院结合公开资料自主研究绘制。股市预测金融精准营销反欺诈、反洗钱01零售店铺选址商品定价销量预测02医疗科研新药研发基因检测03 04自动驾驶环境观测目标定位物体检测AutoML提升流程自动化,机器学习平台为主要产品形式随着线上线下数据量的增长与变化,企业在日常工作中要面临大量的分析决策问题,在短时间内做出准确判断,依赖传统 的经验决策与人力计算显然难以满足企业需要,计算速度快、自动化程度高、分析精准的决策智能应用由此走入企业视线。 决策智能指使用机器学习等技术,对企业的内外数据进行治理,挖掘和利用数据背后的信息,让机器具备自主分析、预测、 选择的功能,从而解决生产经营过程中的决策管理问题,其本质是一个数据消费的过程,属于认知计算的领域之一,亦是 机器学习的一项代表性应用,其流程步骤需经过数据收集、数据清洗、模型训练、基于验证或测试错误或其他评价指标选 择最佳模型四个阶段。就算法类型而言,在整个应用开发流程中,AutoML可让一些通用步骤自动化,如数据预处理、模 型选择、参数调整等,来简化模型生成的过程;而在具体的模型中,可结合业务,选择合适的机器学习算法,一般在决策 智能中常见的代表算法有迁移学习、强化学习、分类与回归树等。就产品形式而言,因挖掘决策信息、搭建决策模型往往 需要一个集成类的模型开发与训练工具,机器学习平台正是可实现数据闭环、模型自动构建及更新的工具型产品,故决策 智能应用常以机器学习平台的形式出售。目前,决策智能已在金融、零售、制造、医疗、自动驾驶等领域获得应用,但产 品的渗透广度与深度主要停留于金融领域,产品尚未实现“完全人格化”,业务开拓与技术进展仍有较大的开拓空间。决策智能发展情况决策智能主要应用场景前决策智能有限决策智能完全决策智能超级决策智能将知识迁移到计 算机系统,输入 数据,与系统中 的规则匹配,实 现辅助决策决策初步自动 化,决策引擎 可进行数据预 测性分析、模 拟分析等现通过机器学习自阶 段动分析潜在规则,实现自我更新迭 代,实现“半人 格化”通过机器学习全 自动完成规则挖 掘、数据治理、 模型更新,实现 “全人格化”趋势:厂商的数据与应用业务补全数 据 生 命 周 期 管 理数 据 安 全 与 隐 私ML模型规则搭建数据分析与可视化数据资产主数据与元数据数据标准化数据质量 数据分类与存储数据汇聚与接入机器学习应用厂商转向数据治理业务开发数据治理与ML应用开发将逐渐走向一体化ML应用厂商补全数据治理业务、数据治理厂商补全ML应用开发业务成为了一大发展趋势。机器学习应用厂商在进行决策 智能应用开发时,往往面临模型与数据无法拉齐的问题,所以需要溯源到前置环节,从一开始就把数据治理的工作做好, 构建模型特有的数据资产,这也是典型的业务导向型数据治理方法论的体现。数据中台、数据平台、数据解决方案等数据 治理厂商完成数据治理后,本就对客户的业务数据有了深入了解,能够较为顺利地进入到下一轮的模型开发业务中,且模 型应用开发可增加新的业务收入,故不少数据治理厂商投身于ML应用部署的业务中。这意味着数据治理与机器学习平台 产品的边界将会被突破并连接,数据治理与ML应用开发将逐渐走向一体化。数据治理与应用厂商业务补全示意图数据治理厂商转向ML应用开发数据治理与ML应用开发一体化ML应用ML模型训练整合企业数据汇聚数据治理模型开发与应用缺失,需开发已有,具备一定的数据积累与业务优势ML模型模型部署到模型与业务 数据治理不符业务线割裂合模型要求数据治理缺失,需开发已有,对模型所需的数据内容、标准更清楚来源:咨询研究院自主研究绘制。机器学习新范式:MLOps构建可通用、复用的模型生产流水线MLOps即机器学习开发运维一体化,包含项目设计、模型开发、模型运维三大步骤,融合了业务、数据、算法、运维的 业务人员,以更好更快地试验、开发、部署、管理ML模型,保证ML模型的交付与运行质量为目标,是机器学习服务模式 与技术的新兴领域,相当于机器学习领域的DevOps,其核心是构建一条可通用、复用的模型生产流水线。总体上讲,机 器学习生命周期全流程复杂且耗时长,只有在部署的模型与现有业务充分整合后,各业务线才能从模型中获得效用与价 值,而实际情况是业务开发与模型部署常常脱节。细分而言,放大生命周期全流程的各个环节,会发现更多的问题:工具 链碎片化、各业务人员的专业知识存在短板且团队之间缺乏协作、ML就绪数据匮乏、集成开发环境缺失、模型可解释性 差等。为改善甚至消除这些障碍,MLOps这一概念应运而生。实施MLOps可更好地衔接模型开发运维的全流程,通过自 动化、可重复的工作流与可复用的数据与模型资产来提升开发运行效率,从而加速机器学习生命周期;同时,通过监督管 理模型的指标与数据,找到并分析模型出故障的原因,提升模型的可解释性,克服“黑箱”困扰。来源:咨询研究院根据公开资料自主研究绘制。来源:咨询研究院根据公开资料自主研究绘制。数据库数据输入预处理清洗数据分析特征抽取特征工程模型训练模型运作测试结果模型预测过程输入模型保存模型输出模型监控数据和特征管理模型开发、运作与监控需求收集场景设计数据检验模型开发数据工程模型工程评估验证模型运维模型部署 CI/CD/C T模型监控 MLOps缩短模型开发部 署的迭代周期使业务、数据、 算法、运维各个 角色高效协作促进模型生产与 管理流程自动 化、标准化提升模型交付效 率与质量,深化 模型管理MLOps的步骤原理及价值机器学习生命周期全流程项目设计*每一环节都有涉及数据流、小工具、业务人员操作等应用落地思考:大模型争论大小模型云-边-端协同发展大模型,即超大规模预训练模型,其对运算速度与算法的要求极高,因而需要充足的芯片资源支持与复杂的机器学习算法 支撑。自2020年6月OpenAI发布GPT-3以来,各大学术机构与科技企业争先参与到大模型竞赛中,大模型于2021年迎来 了大爆发。尽管大模型的研发取得了较大进展,其发展却面临诸多卡点:1)数据方面,国内可用的中文数据集有限,这 意味着开发者使用的数据集可能会重复,进而导致各家的大模型能力相近。 2)算法方面,参数越多、模型越复杂,模型 越难以解释,复杂的大模型成为了“黑箱”,让业务使用者甚至是研发者都无法获知模型的结果与特征之间的关系。3) 投入产出方面,成本与回报难匹配,训练所需的芯片成本过高、训练时间过长、碳排放量过高,而训练出的模型可能局限 于某些行业业务、普适性差,让大模型沦为一次性的模型,浪费大量资源。4)应用使用方面,客户更注重模型的实用性,很多中小企业研发的小模型即可满足客户的业务需求,且成本更低,性价比更高。然而,宏观经济运行与监管、航空 航天量子计算、医药研发、细胞分类等社会与自然科学领域的重大分析任务,以及跨行业的通用模型研究又恰恰需要大模 型这一先进工具。对此,大小模型云-边-端协同发展的模式被提出:云端提供充足的算力与数据存储空间,容纳大模型的 训练与演变,云端大模型为边、端小模型输送通用知识与能力;而在边与端侧,小模型快速执行推理任务,专注于特定场 景的极致化,并向云端大模型反馈数据、成效,解决大模型数据集单一的问题,最终实现功能独立的大模型的全社会共享。来源:咨询研究院结合公开资料自主研究绘制。来源:咨询研究院结合公开资料自主研究绘制。现有大模型列举发布时间发布者与模型名称参数量级2020年5月2021年1月2021年2月2021年4月2021年6月2021年9月2021年10月2021年11月2021年12月OpenAI:GPT-3 Google:Switch Transformer 快手:参数推荐精排模型鹏城:盘古 智源:悟道2.0 华为:盘古英伟达&谷歌:威震天-图灵阿里达摩院:M6 鹏城&百度:文心1750亿1.6万亿1.9万亿2000亿1.75万亿30亿5300亿10万亿2600亿已有大模型列举Cloud边缘Edge端 Device模 型 能 力 双 向 输 送训练推理若干业务小模型,上传业务数 据、模型成效大模型大模型对边、端输送通用知识与能力大小模型云边端协同发展模式云知识图谱与自然语言处理本章赛道内容分为以下四个部分:赛道资本情况:一方面,融资事件与金额相当,且轮次靠前,多处于早期;另一方面,融 资热度较高的行业为金融与医疗。产业规模解读:大数据基座类产品价格高、硬件比例大,产品整体上偏沉重,企业一般进 行一次采购,后续升级维护。随着数字化转型的加速与渗透,此类产品未来将步入存量封 顶阶段,新的增量市场则由垂直行业的知识图谱与NLP应用或解决方案所替代。知识图谱的产品趋势及落地困难探讨:互联网领域的通用知识图谱不断朝着精准化、便捷 化的方向发展,产品已步入成熟期,各大供应商将垂直行业知识图谱纳入研究探索的范畴。 在垂直行业知识图谱落地的过程中,会遇到商业拓展与技术上的难点,阻碍技术产品化、 产品商业化的进程,对此,我们提出了三点方法论建议。 NLP的金融商业生态圈及发展热点:金融NLP商业生态圈主要由银行、与金融机构存在血缘关系的第三方科技公司/生态服务商、垂直领域的NLP公司以及互联网大厂组成,金融机 构与NLP公司存在共生关系。低代码、无代码软件的进步使大规模部署NLG模型成为可能, 而在部署时,模型的常识性差又催生了多模态NLG模型这一发展热点。 Knowledge Graph and Natural Language Processing融资情况融资事件与金额规模相当,融资多处于早期阶段统计时间内,有关知识图谱或NLP的融资事件共214起,合计获投302.1亿元,分别占人工智能总融资事件数与总融资金额(不包含自动驾驶与AI芯片)的27.6%与20.7%;两类技术赛道的融资轮次靠前,知识图谱类产品多处于研发孵化阶段。2018-2021年11月中国知识图谱融资概况61.0%19.0%A+轮及以前PreB轮到B+轮C轮及以后来源:咨询研究院根据各融资网站数据调整与处理绘制。战略融资2018-2021年11月中国知识图谱融资轮次情况6.0%14.0% 55.0%18.0%14.4%A+轮及以前PreB到B+轮战略、收购及其他来源:咨询研究院根据各融资网站数据调整与处理绘制。C轮及以后2018-2021年11月中国NLP融资轮次情况12.6%18.8 57.0 49.9 40.229 27 16 292018 2019 2020 2021.11融资金额(亿元)融资事件(起)16.8 37.3 23.12018-2021年11月中国NLP融资概况59.030 22 14 472018 2019 2020 2021.11融资金额(亿元)融资事件(起)细分赛道融资热度64.4%50.7% 26.0% 23.3% 21.9% 20.5% 15.1% 13.7% 9.6% 8.2% 6.8% 4.1% 2.7% 1.4% 1.4% 1.4% 1.4%金融与医疗热度高,融资业务广泛在统计时间内获投的164家企业中,以金融与医疗为热门赛道。金融赛道中,银行的风控、营销、反欺诈、反洗钱等应用需基于NLP进行知识挖掘,基于知识图谱实现多层关系挖掘,对业务有较高的实用价值;医疗赛道中,CDSS、智慧病案
展开阅读全文