资源描述
行业 报告|行 业专 题研 究 请务必阅读正文之后的 信息披露和免责申明 1 半导体 证券研 究报 告 2023 年 03 月 15 日 投资 评级 行 业评级 强于大市(维持评级)上 次评级 强于大市 作者 潘暕 分析师 SAC 执业证 书编号:S1110517070005 资料来源:聚源 数据 相 关报告 1 半 导体-行 业研 究 周报:荷兰 对 光 刻机出口进一步限制,国产化亟待加速 2023-03-14 2 半 导体-行 业研 究 周报:政策 预 期 升温,关注国产化,周期复苏,与 新技术 2023-03-06 3 半导体-行业研究周报:23Q1 库存持续 去 化,基 本 面 或 加 速 触 底 2023-02-27 行 业走势图 Chiplet:设计引领、封装赋能,助推产业链价值重构和国产芯破局 事件:当地时间 3 月 2 日,BIS 将浪潮、龙 芯等 29 家中国 实体列 入 实体清单。其中 浪潮、龙芯同时被列入脚注 4 实体(即涉 及先进计算类芯片 与超级计算机 的 实体),将限 制其获取 18类软件和 技术。我们看好外部 形势趋紧之下,Chiplet 技术方案由设计公司引领、先 进封装赋能落地,从上游IP、EDA、设计到中游制造,再到 下游封测,革新半导体产业链,重 塑产业链价值,有望助力国 产 芯 实 现 换 道超 车。看好封装 公司 估 值 处 于 历 史 相对低 位,周期 底部 有 望 率 先 复 苏,伴随2D 封装到 3D Chiplet 发展,封装 环节 价值 逐步提升。1、硅片级“解构-重构-复用”,Chiplet 突破三大产业瓶颈 作为硅片级“解构-重构-复用”的 方案,Chiplet 或为破局摩 尔定律、实现产业再度飞跃的关键。其突破 主要体 现在三 个方面,分别带来 百分比 级、翻倍 级和指 数 级的性能 提升:(1)成本&良率 突破:芯片 良率与 芯片性 能之 间存在 矛盾,同构 小芯粒 集成 可以 提升良 率,降低成 本;(2)面积&性 能突破:目 前服务 器 CPU 和 GPU 已逼近 单个芯 片面积 上限,无法 满足高 算力需求,同 构扩展 可以提 高性能,应 对 各场景大 量增长 的算力 诉求;(3)设计&制程 突破:先进 制程芯片设 计成本 高昂,而 异构集 成 下各模块 使用适宜 制程 各司其 职,从我国视 角来看,Chiplet或为打破国产制程瓶颈的 关键方案。同时,Chiplet 可助力超异 构集 成计算的发展,处理器性能&灵活性 同步提 升。2、产业链价值重塑,封装 环节具有“估值处历史 相对低位+周期复苏+产业价值量提升”的投资 逻辑 从全产业链来看,Chiplet 作为一 种全新设 计理念 提升了 设计、IP、EDA 环节 的引领 性地位,有望为中游制造、下游封测带来价 值增量。从具体的落地方案来看,Chiplet 主要依靠高速 互联的设计 和异构 集成先 进封装 技术 的支撑。设计方面,主要通过 Base Die/IO Die/Die to Die 设计实现 核心处理模块之间,及其 他 各模块间的高速互联。封装方 面,Chiplet 封装演进的 本质是在成本 可控的 情况下 尽可能 提升 互联的密 度与速 度,从 2D 封 装到 2.5D Chiplet、3D Chiplet,封装环节 价值量&重要性 有望不 断 提升。我 国封装 厂商技 术积累 深厚,长电科 技、通 富微电、华天科技 已实 现 Chiplet 量产,封 装环节具有“估值处 历史相对 低位+周期 复苏+产业价 值量提升”的投 资逻辑。3、高性能计算(HPC)或为 Chiplet 当前的主要发力点 ChatGPT 是 大数据+大模 型+大算 力的产物,每一 代 GPT 模型的 参数 量高速增 长,根 据人工 智能学家公 众号数 据,2020 年 5 月 发布的 ChatGPT 的 前身 GPT-3 参 数量达到 了 1750 亿(预 训练数据量 达 45TB,远远大 于 GPT 2 的 40GB)。算力需 求方面,训 练 ChatGPT 所耗费 的算力 大概是 3640 PetaFLOPs per day,即用每秒能够 运算一千万 亿次的算 力对模型进行 训练,需 要3640 天完成。随着科 技巨头类 ChatGPT 项目入局,整体 在算力 提升、数据存储 及数据 传输端需求迭起。而随着 摩尔定 律逐渐 趋 缓,我们认 为 Chiplet 有 望成为 支持 高性能计 算 存储 的关键。美国正在 开发的 三个超 级计算 机 Aurora、El Capitan 和 Frontier,CPU 和 GPU 利用 Chiplet 方案,AMD,Intel,华 为的服务 器处 理器芯片 均采 用 Chiplet 方案助 力 算力突破 及性能 提升。4、投资建议 我们看好 Chiplet 重塑半导体产业 格局,为我国半导体产业带来换道 超车的发展机遇。建议关注:(1)封测 板块:长 电科技、通富 微电、华 天科技 等(2)测试 板块:伟 测科技、利扬 芯片等(3)IP 板块:芯原 股份、润欣科 技等(4)EDA 板 块:华 大九天、概伦 电子等(5)封装 测试设备 板块:长川科 技、华峰 测控、金海通、新益 昌等(6)材料板块:兴森科技、南亚 新材、华正新材、方邦股份、德邦 科技、和林微纳、联瑞新材等 风险提示:国际 局 势不确 定性 加 剧;科研进 度不及 预期;需求不 及预期-28%-22%-16%-10%-4%2%8%2022-03 2022-07 2022-11半导体 沪深300 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 2 内容目 录 1.质 的 飞 跃:从 成本 到 性能,Chiplet 突 破 三大 瓶 颈.4 1.1.良率&成 本突破:同构 小芯粒集 成提升 良率,降低 成本.5 1.2.面积&性 能突破:同构 扩展提高 性能,应对算 力的 指数级增 长.6 1.3.设计&制 程突破:模块 化拆分优 化设计,超异 构打 开想象空 间.9 1.4.地缘政治 影响下,Chiplet 加持中国 自主 产业链 的构 建.12 2.产 业 革 新:设 计+先 进 封装 实 现 高速 互 联,产 业链 价值 迎 来 重构.13 2.1.产业环节:Chiplet 革新半导体产 业生态.13 2.2.设计环节:高速 互联设 计实现各 模块“C h i p l e t 化”.14 2.3.封装环节:国内 厂商布 局加速,有望受 益价值 量提 升+周 期复苏 双逻辑.15 2.3.1.从 2D 封装到 3D Chiplet:先进封装 价值量 不断 提升.15 2.3.2.国内头 部厂商:实现 Chiplet 产品量产,掌握核 心 工艺.16 3.应 用 场 景:高 性能 计 算(HPC)为主 战 场.18 4.投资建议.19 5.风险提示.21 图表目 录 图 1:SoC 与 Chiplet 对比.4 图 2:异构集 成和异 质集成.4 图 3:Chiplet 带来的三大突 破示意图 及与性 能提升 的关 系.5 图 4:AMD Zen1 架构 四合 一同构方 案提升 良率.5 图 5:服务器 CPU 和 GPU 芯片尺寸 接近上 限.6 图 6:数据量 爆炸式 增长.6 图 7:算力增 长曲线.6 图 8:机器学 习大幅 提升算 力需求.7 图 9:自动驾 驶算力 需求增 长.8 图 10:苹果 M1-M1 Ultra 芯片面积.8 图 11:特斯拉 Dojo 核心 芯 片.9 图 12:先进制 程芯片 的单 位面积成 本增加(亿美 元).9 图 13:摩尔定 律不断 放缓.9 图 14:Zen1 到 Z e n 2“异构 集成”设 计变化.10 图 15:英特尔 超算芯 片 Ponte Vecchio 结构.11 图 16:处理器 异构集 成发 展.11 图 17:Chiplet 产业链.13 图 18:AMD Zen2 架构中 I/O Die 与 Die to Die 的互联方案及片 上缓存 性能的 提升.14 图 19:中介层 和中介 层通 孔.15 图 20:3D 封装示 意图.16 图 21:长电科 技 XDFOI 技术.17 图 22:通富微 电 VISionS 平台.17 YWCXzQnQoNmNsMpMmRsNpO9P9R9PnPrRsQsReRqQmPjMqRmR8OmNsMMYmQpPxNnPrP 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 3 图 23:华天科 技 3D Matrix 平台.17 图 24:封测板 块估值 处历 史相对低 位.17 图 25:Chiplet 助力服务器 算力提升&性能 优化.18 表 1:苹果 M1-M1 Ultra 芯 片性能.8 表 2:美国政 府对我 国半导 体产业制 裁已久.12 表 3:各业务 板块 Chiplet 相关标的.19 表 4:相关公 司盈利 预测与 估值.21 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 4 1.质的飞 跃:从成本到性能,Chiplet 突破三大 瓶颈 事件:当地时间 3 月 2 日,BIS 将浪潮集 团、龙 芯中科、第四范 式、盛科通 信等 29 家中国实体被列 入实体 清单。其中 浪潮、龙 芯同时 被列入 脚注 4 实体(即涉 及先进 计算类 芯片与超级计算 机的实 体),将限 制其获取 18 类 软件和 技术。部 分 被 限制 企 业业 务 与先 进芯 片 或 超级 计 算机 相 关。被 限制的企 业中,浪 潮集团 旗 下拥有X86 服务器业务,龙芯 中科 是 CPU 设计企业,第四 范 式是一家 AI 独角兽,盛科 通信则是一家以太 网交换 芯片设 计企 业,且浪 潮集团 并非第 一次 遭遇被列 入实体 清单。超 算 产 业发 展 受限、国 际 形势 不 确 定性 加 剧之 下,芯 片国 产 化 亦在 加 速。我们 看 好 Chiplet助 力 突 破制 程 瓶颈,实 现 国产 算 力 芯片 产 业飞 跃。以浪潮为例,其 业务对 英特尔 多 有依赖。2013 年以来,英特尔 始终 为浪潮第 一大供 应商,在服 务器、存 储、AI 解 决方案、云服务等多方面,其 底层技 术均依 赖英特尔 的 CPU。2019 年,浪潮信息 从英特 尔采购 的金 额达到179 亿元,占比 达到 37.53%。在 2021 年财报 中,浪 潮 信息隐去 了前五 大供应 商的 名称,但第一大 供应商 采购的 金额 仍高达 169 亿元,占 比为 23.83%。我们认为 此 类企业 受 限或会束缚我国 先进芯 片及超 级计 算机产业 发展,Chiplet 有望 助力突破 先进制 程及算 力受 限的困境。Chiplet 又 称 芯 粒或 小 芯片,是 硅 片级 别 的“解 构-重构-复 用”,它把传统的 SoC 分解为多个芯粒 模块,将这 些芯粒 分开制备 后再通 过互联 封装 形成一个 完整芯 片。芯粒可 以采用不同工艺 进行分 离制造,可 以显著降 低成本,并实 现一 种新形式 的 IP 复用。其 为 SoC 集成 发 展 到 当 今 时 代,摩 尔 定 律 逐 渐 放 缓 情 况 下,持 续 提 高 集 成 度 和 芯 片 算 力 的 重 要 途 径。相比传统 Monolithic(单一整体)芯片 技术,Chiplet 技术能够在 降低成 本的同 时获 得更高的 集成度。图 1:SoC 与 Chiplet 对比 资料来源:第六 届中国 系统级 封装大 会,长电科 技,天 风证券 研究所 Chiplet 具 体 方 案 包括 同 构、异 构、异 质。同构即对相同制程和 类型的 芯片进 行连 接扩展,如 4 个 7nm,单颗 算力 30 个 tops,4 个堆 为 120tops。异构堆 叠是通 过把大 芯片 分成面积更小的 单元模 块,选 择最 适合的半 导体制 程工艺,从 而实现媲 美乃至 超越传 统 SOC 的性能和各 项表现。异质 主要 指将不同 材料的 芯片集 成为 一体。图 2:异构集成和异质集成 资料来源:第六 届中国 系统级 封装大 会,SCI,天风证 券研究 所 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 5 摩 尔 定 律放 缓 及国 际 形势 不确 定 加 剧下,预期 Chiplet 能 为 半 导体 产 业带 来 三大 突破,海内外有 望同 步 受益,对 我 国半 导 体 产业 而 言,也是 一 次突 破 先 进制 程 和算 力 瓶颈 的产 业 机遇。(1)同构 小芯粒 集成方 案 提升良率,降低 成本,结 合 AMD Zen1 架构 的应用 案例,增 加10%面积,良率提升,降低 了 40%的量产成本。我们认 为在同等 成本下,同构小 芯 粒集成方案有望带 来性能 的百分 比增 长。(2)同构 扩展方 案能够 大 幅提高性 能以应 对算力 爆炸 的时代需 求,结 合苹果 M1 Ultra 将两个 M1 Max 芯片连成一个 芯片,芯 片面积 增加 100%,各项硬 件指标 也实现 了直 接翻倍。我们认为 同构扩 展方案 或可 带来性能 的翻倍 增长。(3)异 构 集 成 方 案 对 芯 片 进 行 了“模 块 化”的 拆 分,各 个 模 块 采 用 其 合 适 的 制 程,在 降低设计成 本和难 度的同 时大 幅提升芯 片性能。同 时 Chiplet 能够助 力处理 器的超 异构 趋势,平衡处理 器的性 能和灵 活性,带来算 力的指 数级增 长。图 3:Chiplet 带来的三大突破示意 图及与性能提升的关系 资料来源:奇异 摩尔公 众号,电脑爱 好 者公众号,摩尔 芯球,半导体 行业观 察,天风证 券研究 所 1.1.良率&成 本突 破:同 构小 芯粒 集成提 升良 率,降 低成 本(1)良 率 方面:将单 一 芯片 分 割 为多 个 面积 较 小的 Chiplet,提升良率(2)成 本 方面:提升 良 率,降 低 成本 瓶 颈:芯 片 良率 与 芯片 性 能之 间 存 在矛 盾,芯 片良 率 提升 遇 瓶 颈。为了提升性能,必须要增 加 芯 片 中 的 晶 体 管 数 量,而 若 要 提 升 良 率 则 必 须 保 证 单 一 芯 片 面 积 不 能 太 大。例 如,150mm 芯片的良 品率约 为 80%,700mm 的设计芯片 合 格率会骤 降至 30%。从 工艺 制造良率的 Bose-Einstein 模型:良 率=1/(1+芯片面 积*缺陷 密 度)n,其中 n 代表 掩膜版 层 数相关系数。单芯 片的面 积越大,良 率越低,对应制 造成本 也越 高。Chiplet 突破案例:AMDZen1 架构增加 10%面积,良率提升,降低了 40%的量产成本。厂商将单 一芯片 分割为 多个 面积较小 的 Chiplet,再把 多个相同 的 Chiplet 集成 在 一起来优化性能。AMD 率先 在其数 据中心处 理器 Zen1 中采用 了该方案。AMD 将 Zen1 分成四个独立的模 块,并 将它们 重新 拼接在一 起。这 种方式让 AMD 在维持 该处理 器整体 性 能不变的基础上,以 10%面积 的增 加,降低 了 40%的量产 成本。图 4:AMD Zen1 架构四合一同构 方案提升良率 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 6 资料来源:祺芯 智能公 众号,奇异摩 尔 公众号,AMD,天风证 券研究 所 1.2.面积&性 能突 破:同 构扩 展提 高性能,应 对算力 的指 数级增 长(1)面 积 方面:单芯 片 做集 成,面积 或可 成 倍 提升 不受 约 束。(2)性 能 方面:面积 提 升,性 能 成倍 增 长。瓶 颈:单个 芯 片面 积 有上 限,无 法 满足 各 场景 高 算力 需求。通常来说,由 于光刻 掩 膜版的尺寸限定 在 33mm*26mm,单个芯 片的面 积一般 不超 过 800mm2,当前 服务器 CPU 和GPU 已逼近 单个芯 片面积 上限。图 5:服务器 CPU 和 GPU 芯片尺寸接近上限 资料来源:芯东 西公众 号,天 风证券 研 究所 人 工 智 能、自 动 驾驶 等 场景带 来 算 力缺 口。互联网普及 下,数据规 模翻倍 增长,未 来算力缺口大。据 IDC 公司 发布 DataSphere 和 StorageSphere 报告,2020 年全 球产 生 了超过64ZB 数 据量;到 2025 年,全球数据 总量将 增至 175ZB,较 2010 年的 全球的 数据 总量增加 175 倍。所谓算 力,就是 设备处理 数据、输出 结果 的 能力。据奇异 摩尔公 众号 预 测,作为提供多 样化计 算能力 支撑 的新型基 础设施,下一 代数 据中心 在 5 年内 将面临 约 1000 倍的算力需 求。图 6:数据量爆炸式增长 图 7:算力增长曲线 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 7 资料来源:奇异 摩尔公 众号,天风证 券 研究所 资料来源:奇异 摩尔公 众号,Intel Architecture Day 2020,天风 证券研 究所 人 工 智 能方 面,深 度学 习 的出 现 带 动机 器 学习(ML)算 力 需 求呈 现 指数 级 增长。2010 年之前其所 需的算 力增长 符合 摩尔定律,大 约每 20 个 月 翻一番。伴随 深度学 习问世,2010后每 6 个月 翻一番,2015 年后大规 模 ML 模型 的出 现,训练 算力的 需求提 高了 10 到 100 倍。其中 代表,ChatGPT 的 总算力消 耗约为 3640PF-days,至少要 7-8 个投 资 30 亿规模数据中心 才能支 撑运行。此 外,据奇异 摩尔公 众号预 测,代表第四 次计算 机浪潮 的 元宇宙将需要至 少 10 的 6 次方倍 于目前的 算力,而元宇 宙的 终极理想 形式,对算力 资源 的需求近乎无限。图 8:机器学习大幅提升算力需求 资料来源:Jaime Sevilla COMPUTE TRENDS ACROSS THREE ERAS OF MACHINE LEARNING,天风 证券研 究所 自 动 驾 驶方 面,现 阶段 大 多单 芯 片 算力 仍 小于 10TOPS,相 对 L3 级别 100TOPS 以上 的 算力 需 求 缺口 大。L0-L5 六个自动驾驶 级别,每 一分 级都 比上一级 有更高 的算力 要求,L2 级别 大 致 需 要 10TOPS 计 算 能 力,L3 需要 100TOPS 以 上 的 算 力,L3+的 算 力 级 别 需 要1000TOPS 以上,到 2030 年 L4+自动驾驶 汽车的 单车 算力将达到 5000TOPS,而 现阶段很多单颗芯 片算力 仍小于 10 TOPS,算力缺 口大。此 外,自 动驾驶催 生端云 协同的 计算 需求,据华为 智能世 界 2030 预测,未 来单个 车厂的 云端 至少需要 10EFLOPS 以上的 算力。行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 8 图 9:自动驾驶算力需求增长 资料来源:佐思 汽车研 究公众 号,天 风 证券研究 所 Chiplet 突 破 案 例:苹 果 M1 Ultra 两个 M1 Max 芯 片 被连 成 一 个芯 片,芯 片 面积 增加 100%,各 项 硬 件指 标 也实 现 了直 接翻 倍。芯片面积越大意味 着 晶体管数 量越多,也代 表着 性能和功能越强,通过多 个芯片 的 片间集成,可以在 封装层 面 突破单芯 片上限,进一步 提 高集成度。苹果 推出 M1 Max 芯片时,市场 普遍以 为这已 达到 了 M1 系列芯片 的封顶 之作,面积高达 432mm。随着 M1 Ultra 的推出,两个 M1 Max 芯片被连成 一个芯 片,芯 片面 积增加到 200%,各项硬件指 标也实 现了直接 翻倍。和 最初的 Apple M1 处理器相比,Apple M1 Pro、M1 Max、M1 Ultra 同样 5nm 制程工艺,但芯 片面积 却 分别提升 了 2 倍8 倍,晶 体管数量也达到了 337 亿、570 亿和 1140 亿,在消费 级处理 器 领域处高 水平。图 10:苹果 M1-M1 Ultra 芯片面积 资料来源:电脑 爱好者 公众号,天风 证 券研究所 2 颗 Apple M1 Max 芯 片 之 间 通 过苹 果 创新 定 制的 多晶 粒 架 构“连 在一 起”,官方 将 这 种连 接 架 构命 名 为“UltraFutI/On”,该架 构拥有 1 万 多个 信号点,芯片 相互之 间的数 据传输速率高达 2.5TB/s,延迟 和 功耗都非 常低。1 颗 Apple M1 Max 的晶体管数量就是 570 亿,由 2 颗 M1 Max 缝合而来的 M1 Ultra 晶体管 数量也 首次突破 千亿大 关,达 到了 1140 亿,整颗芯片 上的统 一内存 最高 可以达到 128GB,内存带 宽 也进一步 提升至 800GB/s。表 1:苹果 M1-M1 Ultra 芯片性 能 型号 晶 体管数 CPU GPU 统 一内存 内 存宽带 Apple M1 160 亿 4+4 7 或 8 16GB 68GB/S Apple M1 Pro 337 亿 6+2 或 8+2 14 或 16 32GB 200GB/S Apple M1 Max 570 亿 8+2 24 或 32 64GB 400GB/S Apple M1 Ultra 1140 亿 16+4 48 或 64 128GB 800GB/S 资料来源:电脑 爱好者 公众号,天风 证 券研究所 Chiplet 突 破 案 例:在 自动驾 驶 领 域,特斯 拉 利用 同 构扩 展 将 其 AI 专 用 训练 平 台 Dojo 的 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 9 性 能 推 向了 极 致。Dojo 是 特斯拉针 对自身 自动驾驶 AI 训练场景所设 计的 AI 专用 训练平台,其技 术核心 芯 片就 是特 斯拉自研 神经网 络训练 芯片“D1”。每个 D1 芯片 以 7nm 工艺制造,包含 500 亿个晶 体管,面积 645 mm。而每个 Dojo 则将 25 个 D1 训练模块和 40个专用 I/O 集 成在一 起,从 而实现超 大算力 支持。Dojo 是目前全 球最快 的 AI 训练 计算机。相比业内 其他芯 片,同 成本 下性能提 升 4 倍,同能 耗下 性能提高 1.3 倍,占用空 间 节省 5倍。图 11:特斯拉 Dojo 核心芯片 资料来源:佐思 汽车研 究公众 号,奇 异 摩尔公众 号,天 风证券 研究所 1.3.设计&制 程突 破:模 块化 拆分 优化设 计,超异构 打开 想象空 间(1)设 计 方面:IP 复用 提升 设 计 效率,节省 设 计阶 段的 研 发 投入(2)制 程 方 面:突 破 摩 尔 定 律 放 缓 的 局 限,特 别 是 对 于 我 国 来 说,可 以 缓 解 先 进 制 程 被限制的 压力(3)超 异 构 方面:助 力提 供异 构 混 合、相 互 协同 的 处理器 解 决 方案,平 衡性 能 和灵活 性。瓶颈:先 进 制程 芯 片设 计 成本 高 昂,单 位 面积 成 本 在 14/16nm 后 陡 增,且 摩尔 定律 不 断放缓。根据奇异摩尔,随着 制程从 28nm 制程演变到 5nm,研发投 入也从 5130 万美元剧增至 5.42 亿美元,2nm 的 开发费用 接近 20 亿美 元,先进制程 已然成 了全球 巨头 的烧钱竞赛。根据 EETOP 公 众号,在 7nm 节点,设 计一款 芯 片的费用 高达 3 亿美 元。且 伴随摩尔定律不断 放缓,晶体管 同时 逼近物理 极限、成本极 限。图 12:先进制程芯片的单位面积成 本增加(亿美元)图 13:摩尔定律不断放缓 资料来源:车东 西公众 号,AMD,天 风 证券研究 所 资料来源:车东 西公众 号,AMD,天 风 证券研究 所 芯 片 制 程并 非“越 先 进越 好”。在一颗 SoC 中,逻 辑计 算单元(CPU/GPU)通常 依 赖于先进制程来 提升性 能,而其 他 的部分(SRAM、I/O 接口、模拟或数 模混合 元件等)对 于制程工艺的要 求并不 高。把这些 对制程要 求不同 的模块 用同 样的先进 制程一 体化制 造会 带来浪费。各类 主要芯 片制程 要求 如下:行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 10 逻辑芯片 3nm 节点:制作工艺复 杂,如 CPU、GPU、AI、MCU。受益于 先进制 程技术的进步,逻辑芯 片依然 沿着 摩尔定律 向前演 进,当前 台 积电 3nm 已量产。存储芯片18/16nm 节点:与逻辑芯 片相 比,内部 结构相 对简 单,主要 分为 DRAM、NAND Flash、NOR Flash 三类。以 DRAM 为例,当制 程到了 18/16nm 以下,继 续缩减尺寸已不再 具备成 本和性 能方 面的优势。模 拟 芯 片 28-65nm 节点:参与感知信息处理的 芯 片就是模拟芯片,无法感知 但客观存在的模 拟信号 处理芯 片,比如微波,电信 号处理 芯片 等,也属 于模拟 范畴。模拟 芯片不受制于摩 尔定律 和高端 制程,强调 高信噪 比、低失真、低耗电、高可 靠性和 稳定性,业界普遍认为 28nm65nm 为其 性能最优 节点,制程 的缩小 反而可能 导致模 拟电路 性能 的降低;而被广泛 地应用 在 IoT 领域 的传感器 和光电 器件,则因 为工艺不 同,无法集 成到 CMOS 中。Chiplet 突破案例:AMD 的 EPYC 处 理器 为 Zen2 架 构,是 典型 的 异构 集 成的 案例。在第一代 EPYC 中,处理器 由 4 个 14nm 工艺的小 芯片 组合 而成。第 二代 EPYC 为 Zen2 架构,处理器由 4 组 共八个 7nm 小芯片和 一个 14nm 的 I/O 芯片组合 而成。8 组 CPU 核 心、1 组I/O 核心堆出 了 64 核处理 器。图 14:Zen1 到 Zen 2“异构集成”设 计变化 资料来源:大半 导体产 业网,SEMI 公众 号,锐杰 微科技 集团总 裁刘海 川,天 风 证券研究 所 Chiplet 异构下 7nm 工艺+I/O 分 离 大 幅 降低 核 心面 积,加 倍 缓 存降 低 延时。从 AMD 公开的数据来 看,7nm 工 艺带来 了明显的 计算效 率,包括 2 倍的晶体 管密度、功 耗降低 50%(同性能下),性 能提升了 25%(同功耗 下)。在 Zen 2 架构中,一个 Chiplet 芯片的 总面积仅74mm2,其中 CCX+16MB L3 缓存的核 心面积 仅 31.3mm2,同比减 少了 47%,一 方 面是因为 7nm 工艺的密度 优势,一方面也与 Zen2 的 CCX 只有 CPU 核心减少了 I/O 单 元有关。这里也可 以解释 为 了降 低延 迟 AMD 为什么 敢于大 幅加 倍 L3 缓存的 原因了,每 个 CCX 翻倍到 16MB L3 缓存后 CCX 核心面积 依然减 少一半 左右。此 外 芯 片配 置 也非 常 灵活,I/O Die12nm 工 艺 降 低 成 本。提升 CPU 核心数 量就堆 CPU 模块即可,因此 锐 龙处 理器可 以从 8 核 16 线程轻松 变成 16 核 32 线程。此外,AMD 这样做也需要生 产小核 心,提 高了 良率,降 低了成 本,而 且 I/O 核心使 用的还 是更成 熟 的 12nm工艺,进 一步削 减了成 本。Chiplet 突破案 例:英特尔使用其 Foveros 3D 堆叠 技术 发 布 了 Ponte Vecchio GPU 助力Aurora 超级计算机,Aurora 超级计算机 旨在成 为美国 首批突破 exaflop 障碍的高 性能计算机之一。Ponte Vecchio 是一个结合 了多个 计算、缓存、网络和 内存硅 片的封 装。Ponte Vecchio 由多达 47 个 Chiplet/(方格 tile)通 过 横、纵向 封 装与 其 他模 块(Tile)连 接 构 成,集 成超 过 1000 亿 个 晶 体管,是特斯拉 D1 的 2 倍。47 个小晶 粒分别 是 16 个Xe HPC(又叫 Compute Tiles 计算核)内核、8 个 Rambo、2 个 XeBase、11 个 EMIB、2个 XeLink、8 个 HBM2。这 47 个小晶粒分 别来自 台积电、三星和英 特尔三 个厂家,Compute 来自台积 电,采 用台积 电 5 纳米工艺。封装 中的每 块 tile 都是使用不 同的工 艺技术 制成。Co-EMIB 芯片将高带宽 内存 和 Xe Link I/O 小芯片横向 连接到“基础芯 片”,其他 芯片采用 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 11 其 Foveros 3D 堆叠技术,在两个芯 片之间 建立了 密集 的芯片到 芯片的 垂直连 接阵 列。图 15:英特尔超算芯片 Ponte Vecchio 结构 资料来源:佐思 汽车研 究院公 众号,天 风证券研 究所 Chiplet 助力超异构 应用:单一的处理器无法兼顾性能和灵活性是行业痛点。CPU 通 用 灵 活 性 是 最 好 的,但 是 如 果CPU 性能 不足,就需要 运行 各种加速。而当 前很多 芯片 的优化方 案,特 别是 AI 芯 片等加速芯片的 优化方 案损失 了灵 活性,是 目前行 业的痛 点之 所在。Chiplet 助力 提 供 异 构 混 合、相 互 协 同 的 解 决 方 案,带 来 算 力 指 数 级 提 升,使 得 Chiplet的 价 值 得到 更 加充 分 的发 挥。2019 年,英特尔提出 超 异构计算 相关概 念:XPU 是 架构组合,包括 CPU、GPU、FPGA 和其他加速 器(即 图中第 四阶段)。超 异构计 算在传 统的异构计算基础 上,通 过更强 大的 模块化 Chiplet 能力,封装 互连能力 和软件 能力,将越 来越复杂的系统 整合成 了宏系 统芯 片 MSOC(Macro-System on Chip)。图 16:处理器异构集成发展 资料来源:硬核 芯时代 公众号,天风 证 券研究所 基 于 超 异构 计 算的 架 构创 新正 在 成 为芯 片 巨头 们 的未 来驱 动 力。通过一连串的收 购 和自研行为,全球三 大处理 器头部 厂商都在 向 CPU+GPU+FPGA/NPU 的方 向靠拢,构 建超 异构计算体系。NVIDIA 拟收购 Arm,其目的 在于增 强其服 务 器 CPU 能力,虽然最 终未 能收购成功,NVIDIA 仍获得了 未来 10 年 Arm 开 发授权。AMD 对赛灵思 的收购,也释 放出 强化异构计算布 局的信 号,成 功弥 补了 FPGA 短板。同 时,赛 灵思在异 构计算 上也有 所积 累,已 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 12 推出 Versal ACAP 异构计算平台,以 缩短车 载多传 感器 同步和融 合所带 来的系 统整 体响应时间。1.4.地 缘政 治影响 下,Chiplet 加 持 中国自 主产 业链 的 构建 站 在 中 国的 视 角看,美 国 政府 对 中 国半 导 体产 业 打压 已久,先进 制 程突 破 及算 力 问题 亟 待解决,Chiplet 在 一 定 程度 上拉 近 了 与国 际 先进 厂 商的 起跑 线,中 国 有机 会 突破 限 制问 题,实 现 弯 道超 车。2019 年以来对华为打 压开始,本 土芯片 企业在芯 片制程 的关键 节点 持续受限,迫使 我国本 土芯片 国产 化进入加 速期。表 2:美国政府对我国半导体产业 制裁已久 时间 事件 对华为打压 2019 年 5 月 15 日 商务部宣布华 为加入实体名单 2020 年 5 月 15 日 限制华为使用美国技术设计和生产的产品 2020 年 8 月 17 日 进一步限制华为获取美国技术 中芯国际制造14nm 及以下芯片受阻 2020 年 12 月 21 日 中芯国际被列入实体名单,限制获取美国技术 2022 年 7 月 1 日 路透社援引五位知情人士的报道称,美国商务部正在研究禁止向中国公司出口芯片制造工具的可能性,即使用 14nm 制 造节点和其他制造节点制造逻辑芯片。目前,中国唯一一家使用其 14nm 制造工艺生产芯片 的公司是中芯国际,该公司在 2019 年底实现了 14m 级芯片的量产。打压中国半导体制造行业 2022 年 8 月 9 日 国会通过 2022 年芯片与科学 法案,计划未来五年提供合计 527 亿美元的政府补贴,且禁止获得补贴的企业 10 年内在中 国或其他相关国家进行实质性扩张 限制 EDA与第四代半导体材料出口 2022 年 8 月 12 日 对四项“新兴和基础技术”纳入新的出口管制。包括两项被称做“第四代半导体材料”的氧化和金刚石;开发 GAAFET(全 场效应晶体管)结构果成电路必需的 ECAD(电子计算机辅助设计)软件。断供高性能 GPU 2022 年 8 月 31 日 美国限制对中国出口高性能 GPU,后发布授权至 2023 年 9 月 1 日。进一步加深对先进计算和半导体制造相关的对华出口管制 2022 年 10 月 7 日 进一步限制与先进计算和半导体制造相关的对华出口管制,在商业管制清单(CCL)中增加 了某些半导体制造设备和相关项目。针对半导体制造,特别指明了三类技术:(1)16/14 或非平面品体管(指 FFET 或 GAA、或更先进的品体管架构)的逻辑芯片(2)128 层或以上的 NAND存储器、(3)18nm 半节距或以下的 DRAM 存储器。对超算领域及相关实体的限制 2023 年 3 月 2 日 BIS 将浪潮集团、龙芯中科、第四范式、盛科通信等 29 家中国 实体列入实体清单(删去被)。其中浪潮、龙芯同时被列入脚注 4 实体(即涉及先进计算类 芯片与超级计算机的实体),将限制其获取 18 类软件和技术 资料来源:美国商 务部工 业和安 全局(BIS)新 闻发布 中心,上 海市集 成电路 行 业协会公 众号,机 器之心 公众号,云头 条公众号,观察者 网公众 号,天风 证券 研究所(1)首 先,由 于 Chiplet 独 特 的 开发 模 式使 得 芯片 创新 的“卡点”从工 艺 转到 系统 集 成,因 而 能 够发 挥 中国 在 应用 创新 的 优 势,为 光刻 机 受制 于人 带 来 缓冲 期。中国计算机互连技术联盟(CCITA)秘书 长在 接受采访 时曾表 示,中国可 以使用成 熟的 28 纳米 节点 生产的芯片,并将 小芯片 封装成 性能 和功能更 强大的 芯片,与先 进的 16 纳米甚至 7 纳 米产 品相当。(2)另外,Chiplet 在 制 造环 节 的 核心 是“先 进 封装”技 术,国 内 Chiplet 封 装 产业 技 术积累深厚,有 望 与掌 握 先进制 程 国 家同 步 受益 甚 至 实 现换 道超车。中国拥有在封装 环节的行业龙头 代表企 业如长 电科 技、通富 微电、华天科 技等 均已实现 Chiplet 量产,能 够引领带动国内 Chiplet 的发展。根据 ittbank 数据,2021 年 全球营收 前十大 封测厂 商排 名中,长 行 业报告|行 业专题研 究 请务必阅读正文之后的 信息披露和免责申明 13 电科技、通富微 电和华 天科 技三家中 国大陆 企业在 榜。2.
展开阅读全文