资源描述
请务必阅读正文之后的免责条款部分 1/15 Table_Main 行业研 究|信息 技术|技术 硬 件与设 备 证券研 究报 告 技术硬 件与设备行业研究报告 2024 年 06 月 17 日 Table_Title Apple Intelligence 将 带 动 iPhone 换机需求 Table_Summary 报告要点:苹果将 强 化 AI 功能 在其生 态应用 的落 地,也印 证了 市 场关于 苹果本次 WWDC 的 几个 预期:1)苹 果正 式推 出 Apple Intelligence,不 同于其他 竞争 对手 的地 方在 于苹果 强调 的 AI 不 是人工 智能,而是 个人 智能(personal intelligence),在 运算 方式 上,采用 端 侧算力+私有 云端算力相 结合 的方 式。2)全 新的 Siri 升 级。Siri 能够 开 始理解 用户 的自然语言,并具 备情 境感,还可以“读懂”用户 iPhone 的操 作界 面,更好的处 理用 户需求。当 苹 果自带 模型 无法解 决用户 需求时,可 在用户同 意 下 连接 Chatgpt-4o。3)苹 果对 IOS18、ipadOS、VisionOS、watchOS 和 MacOS 等系统进行 全面 AI 升级,并 基 本实 现了 照片Cleanup 等 类 似在 Android 手机 上的 相 关 AI 功 能。从 Apple intelligence 的技术路线看苹果 AI 发展思 路。苹果 的AI 发展 思路 可以 归纳 为两 点:1)端侧 2)隐 私。预 计苹果 的主 体模 型主要由 端 侧 on-device model 推动,数 据无需 上 传到 服务器,更 好保护用户 隐私。我 们认 为 苹 果在移 动端 侧通过 CORE ML 架构和 Apple Silicon 相结 合,已 形 成自 己独特 的护 城河。苹果自 2017 年开 始引 入Core ML,到目前 为止苹果 基于 自 己的系 统闭环,实现端侧 模型性 能和效率 的提升,多模 态、软 硬件无 缝集 成等 方面 均已 具备很 强的 能力。预计 AI 功能 带动换机潮,端侧 AI 应用 促使 BOM 提升。若使 用iOS 18 的 AI 功能则 要求 芯片达 到 A17 pro 以及 M1 以上 规格,Apple intelligence 的功 能体 验需 求有望 推动 和加 快部 分换 机需求。我们 预计2024Q2 iPhone 出货量 在 3900 万部 左右,达到 相对 谷底,2024 年全年销量 达到 2.23 亿部,25 年有 望达 到 2.39 亿 部。从 BOM 成本 变化上看,预计 今年 的 iPhone 16 全 系列 会搭载 A18 芯片,Pro 系列 搭载A18 Pro 芯片,NPU 算 力 更强大;其 他硬 件 方 面,Baseband 部分 可能升级 到高 通 的 X75;射 频方面 升级 到 WIFI 7;Pro Max 机 型上 的长焦镜头 或 将 升级 到 48M;屏幕尺 寸也 将 从 6.7 英寸 升级 至 6.9 英寸;对电源 管理 和散热 要求 的 提升,以及 电池容 量需 求 增加带 动钢 壳锂电池需求 和电 源管 理部 分的 半导体 价值 量提 升,也 将 带 动对快充 的 需求。投资建议 随着苹 果 在 WWDC 展 示 其在端 侧加 速 对 AI 方面的 布局,将 进一步带动 行业 发展,随着 产 品逐步 落地,硬件 产品 有 望从中 受益,我们持续看 好苹 果产 业链 和相 关公司,建 议关 注:组装:立讯 精密、歌 尔股 份;模拟芯片:圣 邦股 份;微型传动:兆威机 电;快充:安克 创 新;电池:珠 海冠 宇;散 热:中石 科技;显示面板:京 东方;光学零件:水晶 光电 风险提示 上行风险:消费 电子 景气 度加速 提升,AI 设 备渗 透 率加速,AI 应用加速 落地。下行风险:智能手 机需 求不 及预 期,AI 应用不 及预 期 Table_Invest 推荐|首次 Table_PicQuote 过去一年市场行情 资料来源:Wind Table_DocReport 相关研究报告 Table_Author 报告作者 分析师 彭琦 执业证书编号 S0020523120001 电话(021)5109 7188 邮箱-34%-24%-15%-6%3%6/16 9/15 12/15 3/15 6/14技术硬 件与 设备 沪深300 请务必阅读正文之后的免责条款部分 2/15 附表:重点公司盈利 预测 Table_Forecast 公司代码 公司名称 投资评级 昨收盘(元)总市值(百万元)EPS PE 2023A 2024E 2025E 2023A 2024E 2025E 002475 立讯精密 买入 34.35 246635.22 1.54 1.91 2.45 22.37 17.98 14.02 003021 兆威机电 买入 52.37 12537.98 1.05 1.36 1.94 89.51 38.52 26.96 300661 圣邦股份 增持 80 37658.17 0.60 0.96 1.37 133.81 83.53 58.31 资料来源:Wind,国元证券 研究所 1ZAZxOtOmPoPqOsRtOtMoP9P8Q6MpNqQpNnRfQrRtNlOsQqR7NpPwPNZnQoOMYtQpP 请务必阅读正文之后的免责条款部分 3/15 目 录 1.本次 WWDC 的 几个 预期.4 2.从 Apple intelligence 的 技 术路线 看苹 果 AI 发 展思路.5 2.1 Apple intelligence 的 技术路 线.5 2.2 苹果 在端 侧 AI 构建 护 城河.6 3.AI 功能 带动 换机 潮,端侧 AI 应用 促 使 BOM 提升.7 4.行业重 点公 司推 荐.9 5.风险提 示.10 附录:苹果 大模 型内 容介 绍.11 图 表目录 图 1:苹果 股 价 vs 费城 半 导体指 数.4 图 2:Apple intelligence 的技术 路线.5 图 3:苹果 CORE ML 上 的技术 发展.7 图 4:CORE ML 是 端侧 AI 运算的 软体 核心.7 图 5:苹果 的 CORE ML 功能架 构.7 图 6:iPhone 整体 出货 量 预估.8 图 7:苹果 移动 芯片 制程 变化.8 图 8:iPhone16 BOM 成 本拆分(美 元).9 图 9:重点 关 注 公司.10 图 10:重 点关 注公 司营 收 增速.10 图 11:统一 内存 架构 下的 带宽.11 图 12:闪 存随 机读 取吞 吐 量.11 图 13:不 同模 型 1 Token 的延迟.11 图 14:ReALM 对比 其他 模型.12 图 15:Ferret-UI 模型.12 图 16:Ferret-UI-anyres 架构.12 图 17:Ferret-UI 对 比其 他 模型.13 图 18:OpenELM 对比 LLMs.13 图 19:MM1 模型.14 图 20:多 模态 预训 练评 估.14 图 21:MGIE 原理.14 图 22:MLLM 补 充详 细指 令.14 请务必阅读正文之后的免责条款部分 4/15 1.本次 WWDC 的 几个 预期 我们观 察本 次 6 月 11 日 苹果召 开的 2024 年 WWDC(苹果 开发 者大 会),其主要的核 心特 点如 下:1、苹果正 式推 出了 属于 自己 的 AI 应用 Apple Intelligence。苹 果 AI 不同 于其 他竞 争对 手 的 地 方 在于苹果强调 的 AI 不是人工智能,而是个人智能(personal intelligence)。具体 的实 施 方式 为:在 运算 方式上,采 用端侧(个 人手 机、笔 记本等)算力+私有 云端 算力 相 结合的 方式,个人 隐私 和安 全数据 的运 算会 放在 端侧,非隐私 数据 的运 算放 苹果 的私有 云 上。2、全新 的 Siri 升级。Siri 能够 开始理 解用 户的 自然 语言,并具 备情 境感,还 可以“读懂”用 户 iPhone 的 操作 界面,更好 的处 理用 户需 求。当 苹果 自带 模型 无法 解决用户需 求 时,可 在用 户同 意下连 接 Chatgpt-4o。3、苹果 对 iOS18、ipadOS、VisionOS、watchOS 和 MacOS 等系统 进 行全 面 AI 升级,并基本实现 了 照 片 Cleanup,AI 绘图用的 Image Playground 等 类似在Android 手机 上的 相 关 AI 功能。从近期 公司 股价 走势,市 场对苹 果 的 Apple intelligence 的整 体策 略和 前景 呈 现乐观态 度。Apple intelligence 对 移动 芯片 的使 用门 槛要求 达到 A17 pro 以及 M1 以上规格,对 后 继 iPhone 机 型带来 换机 需求。图 1:苹 果 股价 vs 费 城 半导 体 指 数 资料来源:Wind,国元证券 研究所 PL7aD70o8+nQfzWdTiFJxpDzSda0ryHb0G1WUCrSdD4YETo1P8V7U+2M46IPbtRT 请务必阅读正文之后的免责条款部分 5/15 2.从 Apple intelligence 的 技 术 路线 看苹 果 AI 发展思路 2.1 Apple intelligence 的 技术路 线 根 据 苹 果 在 WWDC 上 展 示 的 Apple Intelligence 技 术 图 谱 以 及 公 司 在Foundation model 方 面上 发布的 官方 文章,总 体理 解可以 归纳 为两 点:1)端 侧 2)隐私。图 2:Apple intelligence 的 技 术 路线 资料来源:namuwiki,国元证 券研究 所 预测 1、苹果趟 出了 一条 创新 性的,能在 移动 端跑 大模 型同 时兼顾 效率 和隐 私的 路。2、苹果不 需要 自建 独立 大模 型。通 过 Orchestration 来判断 和调 动本 地或 者私 有云上的模 型,形成 云端 和本 地的模 型协 同工 作,构建 自己的 主体 模型 体系。这 样在大模型 上给 自己 最大 的自 由度,可 以发 展自 己的 Ajax,可以 合作 Chatgpt,也 可以同 Gemini 或者 文心 一言 等合作。3、预计会 大量 倚重 端侧 的这 些 3B 参数的 Foundational model。通 过添 加小型 LoRA adapters 适 配器 模块 来提 升模型 的能 力,兼 具灵活 和效率,这样 在相 对明确 的功能和狭 小范 围上,实 现对 大模型 效能 的追 赶或 者超 越。适配器 技术 可以 在本 地设 备上进 行微 调和 适配,数 据无 需 上传 到服 务器 进行 处理,这样可 以更 好地 保护 用户 隐私。请务必阅读正文之后的免责条款部分 6/15 4、On-device 的 Semantic index 可以 协助 整合用 户在 各应用 程序 之间 的数 据,以 便生成 式 AI 模型 参照 取用,能更好 的理 解分 析用 户的 行为 和 信息。App intents 不 仅使 得 OS 中 Siri 可 以通 过 App intent 来调用 众多 App 的各种功能,同 时能 够实 现 App 间 的无缝 对接,从 事复 杂的 任务流 程,真正 能“懂”你 的AI 助手 正在 到来。5、客户隐 私和 个性 化要 求,预计主 体模 型将 主要 由端 侧 on-device model 推 动。端侧算力 越强,Apple intelligence 的体 验就 会越 好。Apple silicon 所 构成 的端 侧算力优势,将 是未 来苹 果移 动 AI 上的 护城 河。2.2 苹果在 端侧 AI 构 建 护 城河 我们认 为,苹果 在移 动端 侧通 过 CORE ML 架构 和 Apple Silicon 相 结合,形 成自己独 特的 护城 河。苹果自 己 的 CORE ML 机 器学习 架构,最 主要 的特 点包括:可以让 模型 直接 在苹 果设 备上所有 OS 系 统运 行而 不需要 依赖 云端,保 护使 用者隐私。通过把 机器 学习 模型 转换 为 Core ML 格式,并 利用 优化技 术如 量化 和剪 枝,大幅压缩 模型 大小 并提 高推 理速度,实现 本 地学 习的 超低能 耗。同苹果 设备 上的 CPU、GPU 和 Neural engine 无 缝 衔接,充分 发挥 端侧 算力。OS 的 App 可 以根 据需 求 在端侧 或云 端调 用 Foundational Model,实现 强大 的App 应用 体验。市场仍 有声 音质 疑 苹 果入 局 AI PC 有些 晚,但不 要 忘记的 是,苹果 是拥 有自 研操作系 统和 自研 芯片 的综 合性厂 商。早在 2017 年 苹果 就开 始 引入 Core ML 到 iOS 11,发展 到 2024 年,苹果 基于自己的 系统 闭环,来实 现 端侧模 型 的 性能 和效 率,多模态,软硬 件无 缝集 成 等方面,均已具 备很 强的 能力。23 年 X86 架 构尚 未实 现类似 ARM 架构 中通 过 NPU 做 AI 运算的时 候,苹 果 MacBook 上的 M2 中 自研 的 Neural engine 就能 通过 Core ML 执行语音识 别和 图像 处理 等 AI 工作,而不 是通 过 CPU 或 GPU 去完 成。请务必阅读正文之后的免责条款部分 7/15 图 3:苹果 CORE ML 上 的技 术 发 展 资料来源:Infoq,CSDN,diglog,机 器之心,智东西,国元 证券研 究所 图 4:CORE ML 是端侧 AI 运 算 的 软体 核 心 图 5:苹果的 CORE ML 功能 架 构 资料来源:apple 官网,国 元证券 研究所 资料来源:电子 工程专 辑,国 元证券 研 究所 3.AI 功 能 带 动 换机潮,端 侧 AI 应用促使 BOM 提升 苹果 的 AI 侧重 端侧 运算对 终端设 备的 硬件 规格 提出 更高要求,若要使用 iOS 18的 AI 功能 则要 求搭载 A17 pro 以及 M1 以上 规格 芯 片。请务必阅读正文之后的免责条款部分 8/15 Apple intelligence 的 功 能 体 验 需 求 有 望 推 动 和 加 快 部 分 换 机 需 求,我 们 预 计2024Q2 iPhone 出货 量在 3900 万部 左右,达 到相 对 谷底,Q3 和 Q4 出货 量 或 能达到 6260 万 部 以及 7600 万 部,全 年达 到 2.229 亿 部,较 23 年略 下滑 640 万 部。而25 年 有望 达到 2.39 亿部,同比 增 长 7.2%。图 6:iPhone 整 体 出 货 量预 估(百万 部)资料来源:国元 证券研 究所预测 从产业 链调 研来 看,预计 今年 的 iPhone 16 全 系列 会搭载 A18 芯 片,Pro 系列搭载 A18 Pro 芯片。A18 和 A18 Pro 预 计都 会采 用 TSMC 的 N3E 工 艺。A18 Pro 则有可能 搭载 更多 的 NPU 核 心,算 力更 强大,芯 片的 面积也 相应 扩大。图 7:苹 果 移动 芯 片制 程 变化 资料来源:机械 之心,ofweek,eefocus,至顶 网,wallstreetcn,国元证 券研 究所 预测 请务必阅读正文之后的免责条款部分 9/15 其他硬 件 方 面,Baseband 部 分可 能升 级到 高通 的 X75;射 频方 面升 级 到 WIFI 7;Pro Max 机型 上,长 焦镜头 升级 到 48M,即后 摄部分 升级 为两颗 48M 摄 像头;屏幕尺 寸 从 6.7 寸升 级到 6.9 寸。DRAM 部 分,考虑 苹果 在 边缘算 力上 具备 较高 的能 耗控制 能力,以 及高 效的 内存带宽 技术,今 年可 能会 继续保 持 8GB 的配 置。在其他 方向 上,电 源管 理 和散热 要求 的提 升,还 有 电池容 量需 求增加 带 动了 钢壳锂电池 需求 和电 源管 理部 分的半 导体 价值 量提 升,也带动 了快 充需 求。图 8:iPhone16 BOM 成 本拆 分(美元)资料来源:国元 证券研 究所测算 4.行 业重 点公 司推 荐 随着苹 果 在 WWDC 展 示 其在端 侧加 速 对 AI 方 面的 布局,将进 一步 带动 行业 发展,随着 产品 逐步 落地,硬 件产品 有望 从中 受益,我 们持续 看好 苹果 产业 链和 相关公司,建 议关 注:组装:立 讯精 密、歌尔 股份;模拟芯片:圣 邦股 份;微型传动:兆 威机 电;快充:安克创 新;电池:珠海 冠 宇;散热:中 石科 技;显示面板:京 东方;光学零 件:水晶光电 请务必阅读正文之后的免责条款部分 10/15 图 9:重 点 关注 公 司 资料来源:Wind,国元证券 研究所 预测 注:股 价为 2024 年 6 月 14 日收盘 价;未覆盖 公司采用 Wind 一致预期 注 注:图 10:重 点 关 注公 司 营收增 速 资料来源:Wind,国元证券 研究所 预测 注:未 覆盖公 司采用 Wind 一致预期 5.风 险提 示 上行风险:消费电 子景 气度 加速 提升:AI 主要 搭载 于消 费电 子,景气 度上 行将 对业 绩产生利 好。AI 设备渗 透率 加速:市 场 对 AI 产品接 受度 高将 带动 公司加 快 AI 产品 落地。AI 应用 加速 落地:AI 技 术 在端侧 的应 用加 速,将 有望 带动消 费电 子换 机潮,将利好 公司 业绩。下行风险:智能手 机需 求不 及预 期:若苹果 手机 销量 下滑,对 苹果和 其供 应链 的厂 商的营利能 力带 来压 力。AI 应用 落地 不及 预期:苹果 重点布 局端 侧 AI 模型,倘 若模型 落地 慢于 预期,则对公 司的 产品 竞争 力产 生不利 影响。2024/6/15单位:RMB 股票代码 国元评级 目标股价(元)当前股价(元)市值(亿元)2024E 2025E 2024E 2025E 2024E 2025E 2024E 2025E立讯精密 002475.SZ 买入 38.22 34.35 2466.35 20.1%10.1%18.0 14.0 3.52 2.81 20.0%20.0%兆威机电 003021.SZ 买入 85.30 52.37 125.38 34.4%30.2%38.5 27.0 2.70 2.45 7.0%9.1%圣邦股份 300661.SZ 增持 96.00 80.00 376.58 24.1%24.8%83.5 58.3 8.84 7.79 10.6%13.4%水晶光电 002273.SZ-17.70 16.18 225.00 27.3%19.6%28.1 22.8 2.61 2.41 8.7%14.0%珠海冠宇 688772.SH-16.57 13.65 153.87 18.5%19.9%20.0 13.5 2.04 1.80 10.1%13.2%领益智造 002600.SZ-6.92 5.12 358.82 26.0%18.9%15.3 11.5 1.67 1.48 11.3%13.2%鹏鼎控股 002938.SZ-29.13 34.50 799.90 11.4%11.1%21.0 18.2 2.44 2.21 11.7%12.3%歌尔股份 002241.SZ-18.55 17.56 600.05 6.3%13.3%28.6 21.1 1.85 1.71 6.4%8.1%京东方A 000725.SZ-5.14 4.07 1520.63 17.2%11.4%30.4 16.9 1.14 1.08 3.6%5.9%中石科技 300684.SZ-16.51 17.35 51.96 26.4%26.2%36.2 24.2 2.56 2.38 7.2%10.0%安克创新 300866.SZ-82.09 72.78 384.63 20.2%16.9%20.1 17.0 4.00 3.40 20.3%20.4%中位数 376.58 20.2%18.9%28.1 18.2 2.56 2.38 10.1%13.2%销售增速 PE倍数 P/B ROE营收增速 2021 2022 2023 2024E 2025E 21-23CAGR%24-25CAGR%立讯精密66.4%39.0%8.4%20.1%10.1%35.8%15.0%兆威机电-4.6%1.1%4.6%34.4%30.2%0.3%32.3%圣邦股份87.1%42.4%-17.9%24.1%24.8%29.8%24.5%水晶光电18.2%14.9%16.0%27.3%19.6%16.3%23.4%珠海冠宇48.5%6.1%4.3%18.5%19.9%18.0%19.2%领益智造8.0%13.5%-1.0%26.0%18.9%6.6%22.4%鹏鼎控股11.6%8.7%-11.4%11.4%11.1%2.4%11.3%歌尔股份35.5%34.1%-6.0%6.3%13.3%19.5%9.8%京东方A61.8%-18.6%-2.2%17.2%11.4%8.8%14.3%中石科技8.6%27.6%-21.0%26.4%26.2%3.1%26.3%安克创新34.4%13.3%22.9%20.2%16.9%23.2%18.5%请务必阅读正文之后的免责条款部分 11/15 附 录:苹果 大模 型内 容介 绍 LLM in flash:DRAM 带 宽 高但容 量小,限 制模 型大 小,LLM in flash 提 出将 模型存储 于闪 存,通 过增 加 数据块 的大 小和 使用 多线 程读取,弥补 带宽 的不 足,减少闪存到 DRAM 的 数据 传输 时 间,在 闪存 上实 现高 效 的 LLMs 推理。LLM in flash 可 以实 现在 DRAM 有限 的设 备中 运行 比 DRAM 容 量大 2 倍的 模型,通 过此 技术 的优 化,CPU 推理 速度 比标 准 LLM 模型 提高 4-5 倍,GPU 的推理速度提 高 20-25 倍。LLM in Flash 可 帮助 苹果 在设 备端搭 载更 大端 侧模 型的 同时提升模型 的推 理速 度。图 11:统 一 内 存 架构 下 的带 宽 图 12:闪 存 随 机读 取 吞吐量 资料来源:LLM in a flash:Efficient Large Language Model Inference with Limited Memory,国元证 券研究 所 资料来源:LLM in a flash:Efficient Large Language Model Inference with Limited Memory,国元证 券研究 所 图 13:不同模型 1 Token 的延迟 资料来源:LLM in a flash:Efficient Large Language Model Inference with Limited Memory,国元 证券研 究所 Ajax 语言 模型 框架:Ajax 是苹果 独有 的语 言模 型框 架,苹 果通过 Ajax 优化 iOS18,对 Siri、Spotlight 搜寻、Safari 等 现有 功能 与应 用在端 侧进 行 AI 升级。现阶 段 Siri 可接入云 端 Chatgpt 为 用户 提供 AI 服务,未 来苹 果预计 通过 自研 框 架 Ajax 开发 聊天机器人,后 续有望 替换 Chatgpt 在苹 果云 端的 应用。请务必阅读正文之后的免责条款部分 12/15 ReALM:ReALM 用 于 解 决 LLM 与 非 对 话 实 体 之 间 的 指 代 消 解(Reference Resolution)问题。人 类语 言常包 括“他 们”或“那个”的 模糊,所 以让 LLM 理 解上下文至 关重 要。ReALM 模 型会重 建平 台上 的屏 幕关 键信息,对屏 幕指 代位 置 进行标记,以 便大 语言 模型 能够 在上下 文中 了解 指代 出现 的位置 以及 周围 的文 本内 容。ReALM 的 性能 全方 位超 越 同类模 型 MARRS,最小 的模型 与 GPT-4 性 能相 当,较大的 模型 则优 于 GPT-4。ReALM 可 以让 Siri 更 容 易理解 用户 的对 话和 屏幕 上显示的信息,并 做出 更加 精准 的操作。图 14:ReALM 对 比 其 他模型 资料来源:ReALM:Reference Resolution As Language Modeling,国元 证 券研究所 Ferret-UI 模 型:苹果 开发 出 Ferret-UI 模型,是首 个 专门针 对 UI 屏幕设 计的 用于精确 引述 和定 基任 务的 MLLM。Ferret-UI 通过 引 入任何 分辨 率(anyres)概念,其加入 了额 外的 细粒 度图 像特征,将屏 幕分 割成 多 个子图 像,并 对每 个子 图 像放大,从而捕 捉到 更多 细节。Ferret-UI 为 Apple intelligence 跨 APP 操 作打 下基 础,使其可以更 精准 的识 别 APP 界 面。图 15:Ferret-UI 模型 图 16:Ferret-UI-anyres 架构 资料来源:Ferret-UI:Grounded Mobile UI Understanding with Multimodal LLMs,国元证券 研究所 资料来源:Ferret-UI:Grounded Mobile UI Understanding with Multimodal LLMs,国元证券 研究所 Ferret-UI 优化 明显,性 能 表现整 体超 过 Spotlight 和 GPT-4V。基础 版 Ferret-UI 请务必阅读正文之后的免责条款部分 13/15 在 公 共 基 准 和 初 级 任 务 方 面 均 超 过 Spotlight 和 GPT-4V,在 高 级 任 务 中 略 逊 色 于GPT-4V,相较 于未 优化 的 Ferret,性 能提 升明 显。图 17:Ferret-UI 对 比 其 他模 型 资料来源:Ferret-UI:Grounded Mobile UI Understanding with Multimodal LLMs,国元证 券研究 所 OpenELM 是 一款 苹 果 专门 为 手 机 和 电 脑 等 终 端 设备 而 设 计 的 小 模 型,发 布了2.7 亿、4.5 亿、11 亿和 30 亿四个 参数 版本,其 使 用了“分层 缩放”策 略,有效分配 Transformer 模型 的每 一层参 数,从而 提高 准确 率。在约 10 亿 参数 规模 下,与OLMo 相比,OpenELM 的 准确率 提升 了 2.36%,需 要 的预训 练 Token 减 少了 50%。图 18:OpenELM 对比 LLMs 资料来源:OpenELM:An Efficient Language Model Family with Open Training and Inference Framework,国 元证 券研究所 多模态 大模 型 MM1 具 备 高达 300 亿参 数,采用 MoE 架构 优化 性能,拥 有强 大的多模 态学 习和 推理 能力,在 上下 文预 测、多 图像 和 思维链 推理 等方 面具 有较 好的表现,擅 长在 用户 输入 和文 本中寻 找规 则。MM1 让 Siri 变 得更 自然 化、情景 化 和个人化,更 好的 理解 用户 需求。与其他 模型 在图 像描 述和 视觉问 题回 答方 面相 比,MM1-3B 和 7B 在 8 样本 情 况下表现 优于 其他 模型,MM1-30B 则在 8 样本 和 16 样 本情况 下性 能高 于其 他模 型。请务必阅读正文之后的免责条款部分 14/15 图 19:MM1 模型 图 20:多 模 态 预训 练 评估 资 料 来 源:MM1:Methods,Analysis&Insights from Multimodal LLM Pre-training,国 元证券 研究所 资 料 来 源:MM1:Methods,Analysis&Insights from Multimodal LLM Pre-training,国 元证券 研究所 MGIE(MLLM-Guided Image Editing):MGIE 可 以 用于解 决图 像编 辑指 令模 糊的问题,MLLM 会补充更 详细的指令,利用预期目标的潜在想象力执行图像编辑,MGIE 就可 以从 固有 的视 觉推导 中实 现合 理编 辑。例如,当“健康”的 定义 过于模 糊时,MGIE 可 以将“蔬 菜 配料”与 披萨 精确 地联 系 起来。MGIE 让 Apple intelligence在图像 创作 中更 具准 确性 和创造 性。图 21:MGIE 原理 图 22:MLLM 补 充 详细 指令 资 料 来 源:GUIDING INSTRUCTION-BASED IMAGE EDITING VIA MULTIMODAL LARGE LANGUAGE MODELS,国元 证券研 究所 资 料 来 源:GUIDING INSTRUCTION-BASED IMAGE EDITING VIA MULTIMODAL LARGE LANGUAGE MODELS,国元 证券研 究所 声学模 型融 合(AMF):利 用外部 声学 模型 的优 势补 充 E2E 系统 的固 有功 能,达到完善 语音 识别 的作 用。声学模 型融 合解 决了 域不 匹配的 问题,单词 错误 率 也有明 显降低,在测 试中 错误 率降 低了 14.3%,同时 增强 了 对命名 实体 和稀 有词 的识 别。AMF可减少 用户 与 Siri 交 互时 因表达 错误 或稀 有词 而产 生的偏 差。
展开阅读全文