资源描述
2023.4 iResearch Inc.ChatGPT 浪潮下,看中国大 语言模型产业发展22023.4 iResearch I前言 ChatGPT 的横空出世拉开了大语言模型产业和生成式 AI 产业蓬勃发展的序幕。艾瑞将撰写 AIGC 系列报告,包括此篇 ChatGPT 浪潮下,看中国大语言模型产业发展、AIGC 系列-中国生成式 AI 基础层行业研究报告、AIGC 系列-中国生成式 AI 应用层行业研究报告 等,为市场描绘 AIGC 产业全景与辨析产业发展价值与空间。此篇专题将着重分析“OpenAI ChatGPT 的成功之路”、“中国类 ChatGPT 产业发展趋势”、“ChatGPT 应用场景与生态建设”、“ChatGPT 浪潮下的 危 与 机”四个问题。聚焦国内市场,辨 析中国自研通用基础大语言模型的重要意义、分析中国大语言模型产业参与角色分化路径及原因、梳理呈现中国大语言模型产业受益链图谱。大模型(以大语言模型为主,包含多模态模型等)产业的蓬勃发展将改变数字产业生态,助力 AI 工业化进程、变革海量应用交互方式、创造数字产业新的增长空间。ChatGPT 及大语言模型丰富价值的背后,也隐藏着社会对其及生成式 AI 技术(AIGC)与通用人工智能(AGI)的疑虑,可信、数据与隐私安全、滥用风险、伦理等层出不穷的问题需要规范与解决。但“未来已来”,国家、企业到个体都需立足长远,迎接 AIGC 与 AGI 时代的到来。艾瑞咨询研究院3OpenAI ChatGPT 的成功之路 1中国类 ChatGPT 产业发展趋势 2ChatGPT 应用场景及生态建设 34 ChatGPT 浪潮下的“危”与“机”42023.4 iResearch IChatGPT 生成式 AI 里程碑 生成式 AI 的重大突破,通用基础大模型的胜利 相比之前的生成式对话产品,ChatGPT(Chat Generative Pre-trained Transformer)在大范围连续对话能力、生成内 容质量、语言理解能力和逻辑推理能力上都得到大幅提升,超出了大众对于一款聊天机器人的预期,是生成式 AI(AIGC)极为关键的发展节点。作为一款生成式预训练大语言模型,“Chat”指向它的功能,“Generative”代表它属于生成式算法。生成式算法在过去数年中受制于 RNN 的内生缺陷始终发展缓慢,直到 2017 年“Transformer”架构出现并解决了传统 RNN 模型的问题,生成式 AI 才开始在预训练的 Transformer 架构之上焕发生机,NLP、CV甚至多模态领域通用基础大模型飞速演进。在模型参数量几何级数增长以及多种训练方式的探索之中,ChatGPT 横空出世,也标志着通用基础大模型将突破 NLP 领域以小模型为主导的传统发展范式。来源:艾瑞咨询研究院根据公开资料自主研究绘制。Transformer生成式 AI预训练大模型探索 判别式 AI微调小模型时代 2017ChatGPT引领大模型时代 Transformer 架构在计算上的高效性和良好的迁移能力使预训练的 transformer 迅速取代RNN 成为大语言模型的主流训练框架。生成式 AI 发展历程与 ChatGPT 的突出能力 2022 20231:抽样出在概率上与上文相关度最高的单字形成下文 以小模型为主导的分析型算法是 AI 领域主流,生成式模型受制于 RNN 的顺序计算效率低、长序列处理能力不足等问题,无法得到良好的发展。2:将每个新生成的字与上文所有内容合并成新的上文,再次根据这个上文预测下一个字 低 生成式算法GPT-4生成式 AI 原理(以 ChatGPT 所用自回归算法为例)ChatGPT 的突出能力 更好的语言理解能力:自注意力机制和多头注意力机制可以有效地学习输入序列中的关系和语义信息,使得模型更好地理解和生成文本。提升计算效率:避免了 RNN 中的顺序计算,大大提高了模型的计算 效率。长序列处理能力:Transformer 相 比 CNN,计算两个位置之间的关联所需的操作次数不随距离增长。Transformer 的革命性 ChatGPT VS 微调小模型生成质量大大提升ChatGPT VS 其他大模型更接近商用水准通用性强:回答范围不局限在某 个行业领域,而是几乎所有的人 类知识范围 连续多轮对话:能建模对话历 史,提供持续交互体验(ChatGPT 支持最多 20 轮次问 答交互)生成能力强:生成内容流畅通顺,能够回答从未见过的问题,创作 能力甚至超过部分人类的水平 回答更“类人”:回答更生动 自然有逻辑,符合人类价值观 上文 请告诉我“举头望明月”的下一句:下文 12低 52023.4 iResearch I探秘 ChatGPT 的能力从何而来?RHLF 指令精调+能力涌现,让大模型说好“人话”ChatGPT 具有的惊人效果,是在超大预训练语言模型 GPT-3.5基础上,进一步根据人的需求目标进行模型调优的结果。巨 大的参数量和预训练数据量让 GPT-3.5成为一颗储备了大量知识,并且具备语言生成能力的混沌“大脑”,再使用人类反馈强化学习(RHLF)的方法进行指令精调,将模型的各项能力激活,并以符合人类的需求、偏好和价值观的方式有效释放,同时大大提升了模型应对从未见过的新指令的能力。此外,ChatGPT 在逻辑推理、上下文理解等方面的能力,是模型参数量达到该量级后“涌现”出的,即所谓的“大力出奇迹”,这一现象在其他预训练大模型中也得到了印证。来源:Natural Language Processing with Deep Learning,Jesse Mu,艾瑞咨询研究院根据公开资料自主研究绘制。共 128 层 每层千个节点 ChatGPT 能力实现解析 GPT 采用神经网络架构(如上图所示),由 128层网络和 1750亿参数组成,并使用45 TB 数据进行训练。此时大模型已经具备了许多能力,但是不懂得如何发挥效果。GPT-3.5 模型抽象示意图 模 型 进 化 过 程 语言生成 基础大模型:说胡话的混沌大脑 模型微调:以说人话为目标进行规训 人工对大量问题 形成回答模板供 模型学习 学习回答模板 人工对 GPT 生成 的数个答案进行 排序,建立奖励 模型,自动为后 续生成结果打分 作答 评分 调整 考试提升水平 建立评分机制+从“乱说话”到“说人话”指令精调根本目的是希望模型能够生成符合人类需求和偏好,并且具有较高安全性和正确性的回答。在这一阶段大量使用了 人工标注 的方法,同时通过形成奖励模型,让 GPT 能够脱离人工指引,自动通过不断地“考试”,进行模型调优。指令精调流程示意图 能力激活 Chain of Thought 能力随模型规模增大涌现示意图+逻辑推理能力 大模型具有的部分能力是在模型参数量达到一定规模后突然出现的,随着模型参数指数级增长,这些能力呈明显的线性增长。上图演示了在提问里给出推理过程范例,模型就能给出具有同样推理逻辑的回答(Chain of Thought)这项能力在 LaMDA、GPT 和 PaLM 三个模型上的演变过程。能力涌现:大力出奇迹 大量知识储备 语言理解 对话 翻译 提炼 分类 1 2 3能 力 演 化 创作 代码+举一反三 已具备所有基础能力,但质量差 能够按照人类偏好、习惯和普世价值取向,并保证一定安全性的前提下生成应用度较高的内容 应用指数 应用指数 应用指数+上下文理解能力 由于模型参数足够大带来的“彩蛋”,进一步充实了模型能力,更加接近人类水平62023.4 iResearch I成功背后:秉承初心+巨量资源 ChatGPT 的成功是一场初心+资源加持下的长期主义的胜利,GPT 模型正是在密集烧钱策略后出现的,而 ChatGPT 这一明 确指向商业化的产品则显然受到 OpenAI 从非 营利 向半 营利 转型的发展路径影响。来源:艾瑞咨询研究院根据公开资料自主研究绘制。2018.06 2015.12 2021.05 2022.11OpenAI 成立 非营利阶段 半营利阶段 2015-2018.06阶段成就:发布 AI 工具包和模型训练平台,开始研究 DOTA 对战和语言模型,为后续研究蓄力。在 Sam Altman 上任前,Open AI 的年均资金投 入尚不足 DeepMind 的 1/10,资金短缺造成了高 端人才流失,也使得模型研发进展较为缓慢。2019.02 2020.06 2023.03GPT-1GPT-2 GPT-3基于 GPT-3的视觉模型 DALL-E和 CLIP基于 GPT-3的对话模型ChatGPTGPT-4模型研发 商业化 参数量 117M 1.5B 175B训练数据量 4.6G 40G 45TB在这一阶段,OpenAI 调整经营模式,吸纳巨量资金,大模型研发飞速进展并达到一个令人满意的智能程度,随后 OpenAI 开始通过定向微调模型,依 次推出面向图片生成和文本生成的大模型,并直接达到了商用水平。2019.03马斯克退出 OpenAI,SamAltman成为 Open AI 首任 CEO。OpenAI 成立有限合伙公司OpenAI LP,成为半营利模式。资金投入与发展策略为 ChatGPT 成功带来至关重要的影响 资金:数十亿美元 算力:一万块 A100 打底 人才:全球顶尖人才OpenAI 的几位创始人以造福全人类为宗旨,希望能够研发出能够安全可控,放心使用的高水平 AI 技术。在这一初心的指引下,OpenAI 创始人兼 CTO 不断用第一性原理的思维定位研发方向,走 出技术瓶颈,才让 OpenAI 得以成为今 天通用 AI 领域的重要力量。据国盛证券测算,在不考虑算法优化的情况下,需 要 3万块 A100 芯片才能支持每日 2500万人访问量,在考虑算法优化后保守估计在 1万片左右。微软 Azure 为 GPT-3准备的训练研发平台在 2020年 时共部署英伟达 V100 超过1万块,置换为 A100,则 所需 GPU 算力约为 3000-5000块英伟达 A100。训练 运行 ChatGPT 成本可分为数据、模型训练、模型运营和人工等部分,从 GPT-1开始算起到ChatGPT 诞生,总花费约为数十亿美元。ChatGPT 团队共 87 人,毕业院校以斯坦福、伯 克利、麻省理工为主,其中有 5人被评为2023年度“AI2000全球人工智能学者”。GPT-3训练数据达45 TB,相 当于阅读了数千万本文学巨著。数据:45T2019.07接受微软 10亿美元注资 不仅是多种关键要素的聚合,更突显方向与路径的重要性 初心:实现安全的 AGIOpenAI ChatGPT 成功要素分析72023.4 iResearch I竞品分析:技术能否赶超 ChatGPT?存在赶超机会,但中外差距短期难以追平 与 ChatGPT 功能对标的大语言模型(Large Language Models,LLMs),目前国外主要有 Google 推出的 Gopher、LaMDA以及 Meta 的 Llama 等;国内为百度首发的“文心一言”、360 发布的大语言模型、阿里发布的“通义千问”、商汤发布的“商量”等。虽从对话和文本生成的直观体验看 ChatGPT 略胜一筹,但对于 Google 等国外大厂而言,克隆 ChatGPT 并不存在太高壁垒,当前暂时落后主要是出于公司战略与技术理念差异,选择了不同技术路线,随着各家探索成果和新技术方法的实践不断推进,仍存在对 GPT 系列模型赶超的可能。对百度等国内大厂而言,则在数据、算力、工程化能力等关键要素上存在短板,短期内难以对国外领先大模型实现赶超,为跟随者角色,长期更需要国内 AI 全产业链整体进化。来源:艾瑞咨询研究院根据公开资料自主研究绘制。国内外主要大语言模型研发路径与技术对比 模型 母公司生成方式参数量 技术特点优势能力GPT-3 OpenAI自回归 175B大量采用 RHLF 技术,训练 模型生成符合人类偏好的内 容。内容生成 LL ama Meta 自回归 最大 65B大训练数据+小模型参数的 组合。常识推理与 理解 LaMDAGoogle自编码 340M基于一段话中词汇间的关系 和重要程度不同的思想进行 建模;在微调阶段采用合理 性、针对性、趣味性和安全 性四个标准进行评分。语言理解 T5Google 序列到序 列 11B实验了 NLP 领域多种主流训 练技巧并进行了对比,相当 于一个大一统 NLP 框架。能力相对均 衡 GopherGoogle自编码 280B用 RMSNorm 取代 layerNorm,将绝对位置编 码改为相对位置编码。知识密集型 任务 影响大语言模型应用效果的公认可见因素主要是训练数据、模型规模(参数 量)以及选用的生成算法和调优技术,但这些因素是如何决定大模型效果,目前尚处于探索阶段,对于何种数据和技术组合能产生怎样的训练效果并无 定论。当前这些世界一流水平模型之间并未在技术水平上拉开明显差距。秉承 AGI 目标,始终基于 GPT 主路径分化演进 GPT-1 GPT-2 GPT-3Training on codeInstruction tuningGPT-3.5ChatGPTText-davinci-002浓厚学术精神,创新能力强,同时探索多条路径 T5LaMDAGopherPaLM提出transformer架构BERTFLAN T5PaLM-EALBERT ELECTRAERNIE 1.0(对标 BERT)ERNIE 2.0 ERNIE 3.0 文心一言 对话 PLATO搜索 信息抽取 代码 跨语言 图网络 志不在 AGI,重点培养面向应用的全栈模型能力82023.4 iResearch I竞品分析:企业商业化路径 服务于各公司战略业务拓展,形成差异化商业路线 商业模式上,ChatGPT 已经明确指向 API、订阅制和战略合作(嵌入微软 Bing、Office 等软件)三种营收方式,且已在用户数据积累、产品布局和生态建设层面充分领先;Google 虽有意追赶,但由于聊天机器人这样的产品形态对于其主营的搜索引擎业务的助益有限,因此在与搜索引擎结合方面较为审慎,更希望借助大模型能力开展“模型即服务”范式,开拓其当前市占率较低的云服务业务的市场空间。作为国内大模型的标杆企业,百度的选择与 Google 更为类似,“文心千帆”产品剑指 B端市场,意图带动云服务营收。来源:艾瑞咨询研究院根据公开资料自主研究绘制。订阅制 TO C 能力集成 API 调用 Office BingLaMDA拉动 B端业务意图明显,多款模型能力形成组合拳 存量巩固 增量拓展 Bard搜索 引擎 PaLMTOC能力集成 Google workspaceMaaSGoogle cloud增量 增量 BertGPT-3GPT-4MaaS战略布局 plugins0.02$/1000token20$/monthC端生态 B端生态 u 在 C端生态上,ChatGPT 一方面通过“引进来”的方式,兼收上游插件增强多种应 用能力,打造 super APP 吸纳用户;另一方面“走出去”,通过革新软件交互方式 将用户收入囊中,从而实现完整的 C端生态布局。u 在 B端生态上,Open AI 通过合作微软 Azure,间接实现“模型即服务”,又通过 直接提供大模型 API 能力调用,服务小 B开发者,勾勒 B端生态雏形。变现主要依靠 C端,在微软加持下形成强有力生态布局 主推 B端,基于全栈优势构建全链能力 ChatGPT基础模型:文心一言 框架 平台:飞桨 行业模型 MaaS企业级云服务市场 增量拓展 垂类厂商 fine-tune开发工具 独立开发者 TO C 能力集成 界面引入 chat 功能 底层支持检索 Super APP 成为应用的平台 国内外主要大语言模型厂商商业路径对比9OpenAI ChatGPT 的成功之路 1中国类 ChatGPT 产业发展趋势 2ChatGPT 应用场景及生态建设 34 ChatGPT 浪潮下的“危”与“机”102023.4 iResearch I中国自研通用基础 LLMs 的重要意义 大厂的绝对战略优先级,但也是一场重投入的持久战 2023年 3月中,OpenAI 宣布 ChatGPT 整合 GPT 4,实现多模态交互、大幅提升复杂长文本理解与生成能力、可控性增强,引起全球科技界震动。在国内科技及投资各领域的高度关注下,百度举办了“文心一言”产品发布会,虽说从产品功能、成熟度、支持用户并发等维度距 ChatGPT 还有不足,但也是中国在这新一轮“科技军备竞赛”中的勇于尝试与发声,目 前百度也已启动 API 接口开放测试,瞄准 B 端市场。紧随其后,360、阿里、华为、商汤、京东、科大讯飞、字节跳动等巨头企业也动作频频。从自研通用 预训练大语言模型 的必要性角度分析:在全球政治经济局势下,自主可控 是保障网络安全、信息安全的前提,自研基石模型具有高度战略意义;从自研的可行性角度分析:基于前文讨论的通用基础 LLMs 研发所需的算力、数据、算法、人才、资金储备等,中国仅有少数头部互联网企业具备研发“入场券”。宣布入局的头部企业基于自身业务生态选择的战略路线也不尽相同。但可以大胆假设,未来若形成大模型能力领先,谁拥有通用 基础 大模型与生态和流量入口,谁就更有可能拥有从应用层到算力层的营收话语权。注:大语言模型(LLMs)研发正向多模态领域推进。来源:艾瑞咨询研究院根据公开资料自主研究绘制。卡点:高端 AI 算力、数据、算法、人才、资金储备 价值:自主可控的战略意义、大模型的商业价值 v s 调用国外大模型将涉及数据跨境的合规风险、中国中大型企业与政府部门均存在私有化部署需求、以及受美国科技保护主义影响。种种原因,国内必将且必需产生自主可控的通用基础大模型产品与服务“滚雪球效应”使通用基础大模型的门槛越来越高,但 其可以提供“超级大脑”一样的价值。OpenAI 与微软的成功路线表明,依托 ChatGPT 有望打造新的个人与企业应用开发生态以及拉升云厂商业务营收 美国芯片禁令下高端 AI 算力资源不足,算力资金投入上还需支撑智算集群的训练与运营成本 互联网中文高质量数据资源小于英文,差距 20-30 倍,需要高质量数据清洗 通用基础大模型开发是一个系统工程,需具备分布式训练、模型蒸馏等各类技术能力与工程化能力 如何把 know-how 数据转化成 Q&A 的能力,需要大量提示(人与机器进行交互的指令语言)工程师通用基础大语言模型的价值与自研卡点112023.4 iResearch I应用开发厂商:不具备充足算力和资金的厂商,可基于 API 进行 AIGC 相关应用产品开发,依托巨头生态打磨产品与拓客中国 LLMs 产业厂商类型与定位逻辑 垂直基础大模型厂商与应用开发厂商需在窗口期加快建立“数据飞轮”壁垒此轮基于 ChatGPT 的大模型浪潮兴起伊始,结合我国 AI 产业链与竞争格局现状,一种判断是:基于大模型的通用和泛化性提高,未来手握通用基础大模型的巨头企业会逐渐侵蚀垂直领域厂商业务。这种压力长期来看的确存在,但大模型与产品结合,尤其在非检索或开放域交互等场景中,需要依赖垂直领域数据和行业 know-how、应用场景和用户数据反哺、一 站式端到端工程化能力等。在此窗口期,垂直领域与应用层厂商应积极将大模型能力整合入自己的技术栈,服务于产品功能优化,建立“数据飞轮”壁垒。在下游丰富的基于大语言模型、AIGC 应用开发需求的影响下,还将分化出一类工具型或平台型厂商,主要提供基于各类大模型的开发平台服务,帮助客户实现便捷的 AIGC 应用开发与落地。来源:艾瑞咨询研究院根据公开资料自主研究绘制。工具层厂商:负责承担大模型调优工作,服务于应用开发或解决方案厂商,可能逐步向平台型发展垂直基础大模型厂商:具备一定算力、资金和技术实力的垂直赛道厂商,可基于多家开源模型和数据,进行垂直基础大模型自研。一般该类型厂商亦会横跨模型层与应用层通用基础大模型在高商业价值的内容输出方面能力较弱且在产出结果的可信程度上不可控,需要垂直领域 know-how 与数据调优;在数据开放度低的行业领域,如能源、政 务、金融、电力、通信等,通用基础大模型缺少高质量数据集支撑;在落地实施层面上,不具备调优与二次开发能力的企业需要端到端的大模型开发及部署服务,以控制部署成本 未来可能国内只有 1-2家完全跑通,产生类 OpenAI 企业 来自同赛道内部和外部巨头的竞争日益激烈 通用基础大模型厂商 通 过海量数据自研大模型后,一般经过垂直领域数据调优、缩小模型量级首先服务于自身业务,达到降本增效、提高营收等效果。后开放服务,赋能 B端或 C端客户 定位分化原因 大模型改变了 AI 产业的技术流通路径和生产方式。在促进AI 工业化进程的同时,优化了应用的产品功能、拓宽了应用层市场 大模型是AIGC 产业发展的基石 参与应用开发中国大语言模型产业参与厂商类型与定位逻辑122023.4 iResearch I中国大语言模型产业价值链 产业加速发展中,产业价值链格局初显 注释:图谱展示为不完全列举。中国 AIGC 产业链格局与 LLMs 产业链基本类似,详情请见艾瑞即将发布的 AIGC 系列报告。来源:艾瑞咨询研究院根据公开资料自主研究绘制。通用基础大模型 算力基础设施 垂直基础大模型、工具平台 应用产品 芯片 云服务 数据基础设施 国外 中国 通用基础大模型厂商可直接赋能应用层厂商或开发应用产品垂直基础大模型厂商可直接开发应用产品区域智算中心 GPT 模型文心 通义 悟道 盘古 对话式 AI消费级硬件 产品 行业领域 工具软件类(办公生产工具、RPA、视频工具、数据分析、CG 制作)企业服务应用(ERP、CRM、协同 办公软件等)垂直领域产品 辅助编程类 电商 金融 政务 能源 电力 教育 等 各类知识/数据 密集型领域 各云计算厂商 LLaMA 模型LaMDA 模型应用型公司依托 LLMs 将落地场景中的真实数据发挥更大价值各类开源模型巨头企业、高 校或研究机构 在参数量级、通用性上存在差异中国大语言模型产业价值链 混元 数据采标 数据库资源 通用搜索引擎 商量13OpenAI ChatGPT 的成功之路 1中国类 ChatGPT 产业发展趋势 2ChatGPT 应用场景及生态建设 34 ChatGPT 浪潮下的“危”与“机”142023.4 iResearch I大语言模型落地应用对数字产业影响 变革交互方式、丰富产品种类、新兴商业模式、构建生态平台 1)变革人机交互方式:既有软件将接入对话能力,交互界面发生变革,自然语言成为用户发布操作指令的新模态。这一影响将从搜索引擎等知识信息平台拓展到一切人机交互型应用。友好度和功能性的显著提升将激活软件服务的增量用户市场;2)丰富产品种类:将诞生新一批 AI-first 的应用,如创意设计、AI 营销、AI 运营等领域;3)塑造新兴商业模式:AI主导的“模型即服务”商业逻辑将重构应用开发流程,传统企业可享受低成本构建应用模型的便利;4)构建新兴生态平台:超级应用的出现,本质上搭建了用户需求与各类信息服务之间的基于自然语言交互的平台生态,塑造了移动互联网后新的流量入口。来源:艾瑞咨询研究院根据公开资料自主研究绘制。大语言模型将改变数字产业生态 ChatGPT类产品 助力 AI工业化 发展进程 供给侧 需求侧 知识 调用 软硬 件功 能调 用 NLP知识 图谱 变革 人机 交互方式 改变现有数 字产业生态 交互体验升级 交互效率飞跃 搜索 引擎 企业 知识库 教育 办公 软件 数据分 析工具 行业专 用软件 智能 机器人 云服务:MaaS数据 存储 模型 外 围 应用开发效率化 颠覆产品设计思路 增强产品能力 社交娱 乐软件 创造新的 产业空间 大模型能力直接 穿刺到 C端 催生以 大模型 为基础 的海量 应用 ChatGPT集成多功能,成为大模型 时代的 iphone多模态 芯片 CV提升模型能力 降低开发成本152023.4 iResearch IChatGPT 引领 AI 应用热潮与应用革命 ChatGPT 被称为 AI 的“iPhone 时刻”,以 ChatGPT 为代表的生成式 AI 让每个人命令计算机解决问题成为了可能。可对生产工具、对话引擎、个人助理等各类应用,起到协助人、服务人甚至超越人的角色。凭借此革命性突破,ChatGPT 在搜索引擎与各类工具软件中率先掀起应用热潮,引起了广大用户对 ChatGPT 相关技术的关注与学习。海量下游应用也因此捕捉到新的技术与产业机会,希望通过各类大模型与工程化能力,将类 ChatGPT 产品能力输送到原有的应用中,关于应用革命的序幕就此拉开。注释:已渗透应用领域有公开资料支持佐证应用已接入 OpenAI 的 GPT 系列模型,实现 ChatGPT 相关功能应用;或不使用 GPT 系列模型,但具备 ChatGPT 类似功能。来源:艾瑞咨询研究院根据公开资料自主研究绘制。应用革命序幕拉开,应用渗透不断加剧 模型:OpenAIGPT-4通用搜索引擎 办公生产工具 垂直领域应用 企业服务应用 模型:OpenAIGPT-4&GPT-3.5PAIR模型:OpenAI GPT-4&GPT-2,百度文心一言;包含类 ChatGPT应用 模型:OpenAI GPT-4;包含类 ChatGPT应用 对话式 AI模型:OpenAI GPT-4&GPT-3.5&GPT-3;包含类 ChatGPT应用 Intercom Discord通用基础大模型 垂直基础大模型 模型工具平台 人 开发应用 借助 工具 平台 开发 借助工具 平台开发 降解与 调优 开发应用 开发应用 海量应用池:应用产品功能因 LLMs 的介入将产生革命性突破。应 用 价 值 链 已 渗 透 部 分 应 用 服 务 价 值 生成指令:请根据准备好的用户数据与材料起草一份调研问卷,可以结合数据做分析和总结 问卷生成 应用触达 应用举例:可覆盖应用举例:大语言模型产品应用价值链与已渗透部分应用162023.4 iResearch I通用搜索引擎新布局 互动溯源的新搜索方式,各搜索引擎企业对标微软布局加码 集成了 ChatGPT 版搜索引擎的 NewBing 改变了检索引擎的内容呈现逻辑,用户在短时间内可获取更可靠、更完整、更具备创意的答案,且因接入实时网络数据同时满足对数据实时性要求。凭借全新的搜索体验,NewBing 收获了较大的用户流量。与此同时,谷歌与百度虽均发布了与 ChatGPT 对标产品,但并未直接嵌入搜索引擎中,不过谷歌正在测试几款集成了类 ChatGPT 对话式功能的新搜索产品;360 作为国内搜索引擎追赶玩家,发布大模型产品并整合入搜索产品中,意图抢占用户流量。来源:艾瑞咨询研究院根据公开资料自主研究绘制。应用 4:其他生产工具 应用 3 对话式 AI 应用 2:办公生产工具 应用 1:通用搜索引擎 改变用户搜索习惯:从用户角度看,NewBing 对搜索引擎造成两点改变:一是搜索方式从关键词式变成 对话式,二是搜索结果从简单的摘要排列式变成 篇章阅读式。凭借新功能吸引用户,争夺市场:尽管微软基于 GPT-4与 Edge 浏览器数据升级的 NewBing 存在数据准确性错误、链接排版错误等不足,但 凭借个性化交互、内容生成等优势与用户猎奇心理 收获了大量用户流量,争夺搜索引擎市场。接入 ChatGPT 一个月后,微软公布其进展称,Bing 每日活跃用户已突破 1亿,NewBing 预览版的 数百万活跃用户中,大约三分之一是 Bing 的新用户。这 对于 Google 来说造成了技术与市场的双重威胁,Google 拉响“Red Code”警报,启动 Bard 项目应战。1)New Bing功能 GPT-4 Edge 浏览器数据 为用户提供聊天功能和扩展的搜索栏,提升交互性 2)微软布局思考 引流 广告主 追随用户 微软获取广告 主费用 微软广告营收 增长 提供具备时效性与针对性的内容,附上来源与链接 进行内容推荐与提醒,根据需求创作与提供写作模板 微软 New Bing 布局 谷 歌 谷歌 Bard 与谷歌搜索引擎 分开运行,仅支持英语生成答案,访问权限有限。每次提问给出 三种 版 本回答,支持 一键返回 搜索界面。谷歌没有明确表明要在搜索引擎中集成 Bard,但谷歌 正在测试 几 款新搜索产品,将 类 ChatGPT 对 话式功能 集成在搜索产品中。百 度 其他 搜索引擎企业布局 360 百度文心一言是国内首个对标ChatGPT 的产品,可实现 跨模态功能,服务于文学与文案创作、数学计算、多模态生成等场景。目前百度文心一言 尚未接入 搜索引擎,但这可能只是 时间问题。一旦接入,百度搜索引擎有望迎来新用户与商业增长。360 基于大语言模型在 C端推出新一代智能搜索引擎,并将基于搜索场景推出人工智能个人助理类产品 360 大模型战略也将在 ToC、ToSME、ToG&B 方面进行商业化场景落地。搜索引擎与大语言模型结合情况172023.4 iResearch I共生模式下待解决的发展问题 存在机器信任风险、运营成本过高、冲击原有广告商业逻辑 ChatGPT 与搜索引擎不是非黑即白、此消彼长的替代关系,而是相互结合促进的共生关系,ChatGPT 会升级与丰富搜索引擎的功能,推动搜索引擎往下一新阶段发展。在共生关系发展过程中,ChatGPT 主要面临着三方面待解决的难点:1)ChatGPT 回答的可信度存疑,存在机器信任风险。以及为避免数据时效缺陷而频繁引入新数据与知识、进行模型精调会造成原有知识遗忘;2)模型训练与在线推理成本过高,搜索服务的 C端收费与否成为两难决策;3)冲击原有广告系统商业逻辑。来源:艾瑞咨询研究院根据专家访谈、公开资料自主研究绘制。ChatGPT 产出内容准确性的不可控,会让用户陷入 信任与否的两难局面。目前,ChatGPT 已经成为很多用户获取信息的手段,但用户如果没有分辨能力,可能会被误导,带来风险隐患。为避免回复的数据时效性问题,若对 ChatGPT 频繁微调,新数据与知识在模型内的权重过高可能会对原有知识造成遗忘,影响回答准确度。据估算,ChatGPT 生成一条信息的成本约为 1.3美分,是目前传统搜索引擎的三到四倍。即 ChatGPT 每一次生成答案的成本超过搜索引擎。ChatGPT 的训练成本 与 在线推理成本过高。如果完全开放,面向搜索引擎的数以亿计的用户请求,假设继续采取免费策略,OpenAI 将无法承受。虽然ChatGPT plus 版本以订阅制收费,但目前算力仍然制约其用户数量扩张。ChatGPT 在搜索引擎场景中待解决问题 采用 ChatGPT 搜索直接得到对应信息,一定程度上阻止用户点击搜 索引擎界面的广告链接,而 搜索引 擎广告收入 长期以来一直是搜索引 擎巨头的营收主力。若要保留广告 收益,有一种方案设想是在ChatGPT 中嵌入广告链接,将广告优先排序在答案序列中,但这明 显破坏了 ChatGPT 直接回应问题的功能性,与基本的问答逻辑不符。除了检索准确度外,这也是Google 落后 OpenAI 进行尝试的原因。回答可信度存疑频繁微调造成原知识遗忘训练与推理成本过高收费与否成为两难决策冲击原有广告系统商业逻辑应用 4:其他生产工具 应用 3 对话式 AI 应用 2:办公生产工具 应用 1:通用搜索引擎182023.4 iResearch I基础办公软件革新 解放基础性办公劳动力,定价与买单情况尚未落实 2023 年 3月 17 日,微软正式发布 Microsoft 365 Copilot,将 GPT-4与 ChatGPT 能力融入了 Office 365 全栈生产力工具,并推出汇集了 Office 365 数据的 Business Chat 功能,较大提升了数字化办公的智能化水平,可有效解放重复性的基础办公劳动力。目前能与微软 Microsoft 365 Copilot 对标 的成型产品为谷歌的 Workspace,国内的金山办公正在围绕 AIGC 与 LLMs 领域进行类似产品功能的研发。来源:艾瑞咨询研究院根据公开资料自主研究绘制。微软 365Copilot 与谷歌 Workspace金山办公 微 软 接入 GPT-4与 ChatGPTWordPPTExcelOutlookTeams根据指令写 文章和摘要;实现 Excel、PPT 的内容 格式转换;根据需求修改 文风与排版,实现个性化撰写 基于 Word、Onenote 等草稿 直接生成幻灯片;通过自然语言交互 自动修改幻灯片内容与风格,实现特效增减 根据已有数据进行 自动化数据分析 并给出关键信息总结;根据需求 清洗、分析、预测数据,进行数据 可视化 展示 根据用户需求 自动总结邮件核心要点,生成格式化 邮件初稿,灵活切换邮件 语气与风格 根据需求自动 总结会议要点,自动 生成会议纪要 和任务模板,自动生成回顾邮件并为用户答疑解惑 相应地,谷歌推出的 Workspace 加 入了生成式 AI 办公软件套餐(Docs,Slides,Sheets,Gmail,Meet,Chat)。尽管没有明确加入类ChatGPT 产品,但 在 生成式 AI 功能 上 基本上可以实现与微软 365 Copilot的对标 BusinessChat基于 Office 所有应用数据,实现全局信息视角下的交互式问答,自动创建业务流程,提供解决方案与措施建议 谷 歌 收 费 模 式 采用增值收费,但价格尚未确定:基于办公基础软件包之上增加增值包,微软与谷歌还处于内测阶段,尚未确定价格。算力、人力等资源投入高昂,如何将费用合理平摊到每个用户,并保证收益是个复杂的问题。应用落地 思考 产品对标:WPS Office 全套应用 买 单 意 愿 产品错误仍旧存在,用户是否会持续买单存疑:以 Copilot 为例。Copilot 目前无法避免错误,微软在发布会上也强调 Copilot 会和其他 AI 内容生成器一样出现事实错误,需要用户查看、审核与调整生成结果。如果因为产品错误与成本问题影响用户的消费意愿,用户未来是否会在“尝鲜”消费之后继续购买 Copilot 仍旧存疑。ChatGPT 应用于基础办公软件 研发展望:根据 2022 年金山办公财报显示,金山办公围绕AIGC 与 LLMs领域进行研发投入,优化文档数据搜索功能,并在智能辅助写作与排版、表格数据智能分析、PPT 一 键生成与美化等场景进行融合 应用 4:其他生产工具 应用 3 对话式 AI 应用 2:办公生产工具 应用 1:通用搜索引擎192023.4 iResearch I对话式 AI 接入“高知、高情商大脑”对话系统升级以避免对话交互的知识与情感障碍 在 ChatGPT 出现以前,文本机器人、语音机器人、多模态数字人等对话式 AI 产品普遍存在知识结构不完善、只能做简单问题回答、语义与情感理解不到位等问题,较大程度上拉低了用户的交互体验感。将对话式 AI 与大语言模型产品结合,相 当于给对话系统安装了一个更富有人类知识、智慧、情感的大脑,可改善以往对话式 AI 的产品痛点,完善产品功能,添加产品新卖点。注释:对话式 AI 与垂直领域工具存在交叉。来源:艾瑞咨询研究院根据公开资料自主研究绘制。应用 4:其他生产工具 应用 3 对话式 AI 应用 2:办公生产工具 应用 1:通用搜索引擎 应 用 举 例 例 1:智能客服功能,客户服务软件公司 Intercom 基于 GPT-4和 Intercom 自研的 AIchatbot,开发出类 ChatGPT 机器人 Fin。Fin 可进 行多对话轮次的查询,提供回答的出处。例 2:内容创造场景,Snap.Inc 推出了 MyAI 聊天机器人服务,可要求机器人帮忙编写生日祝福,或编辑图片配套的文案,服务网络社交分享场景。例 3:智能助手场景,Discord 推出的 Clyde 机器人通过调用 ChatGPT,帮助用户回答琐事问题、安排会议、推荐播放列表等。金融 互联网 医疗
展开阅读全文