20230808_中信建投证券_通信行业证券研究报告：网络升级可提升算力效率1.6T光模块有望加速产业化_21页.pdf_报告吧baogao8.com-

资源描述

本报告由中信建投证券股份有限公司在中华人民共和国（仅为本报告目的，不包括香港、澳门、台湾）提供。在遵守适用的法律法规情况下，本报告亦可能由中信建投（国际）证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。证券研究报告行业动态网络升级可提升算力效率，1.6T 光模块有望加速产业化核心观点在 AI 数据中心中，越来越多的客户倾向于选择更大带宽的网络硬件。带宽越高，单位 bit 传输的成本、功耗以及尺寸更有优势。800G 光模块的高增速已经能够反映出 AI 对于带宽迫切的需求，其在 2022 年底开始小批量出货，2023 年和 2024 年的出货量都将有望呈现高速增长的态势。我们认为，1.6T 光模块升级周期有望缩短。我们从上游光电芯片、连接器，中游光模块公司以及下游云厂商客户等维度，分析了目前 1.6T 光模块相关的进展。1.6T 时代，相比较铜缆，光模块是主要方案，光模块中单模是主要方案，单模光模块中硅光和薄膜铌酸锂均有机会取得突破。虽然 2023Q2 海外云厂商的 Capex 下降，但各家云厂商对未来资本开支维持较乐观的指引口径，对 AI 业务发展均给予较高期待。我们认为高速光模块的行业景气度仍在提升。摘要 1、1.6T 光模块加速发展，网络对算力系统的重要性持续提升。2022 年，传统云计算市场光模块已经升级至 800G 速率，在 AI领域，我们认为无论是训练还是推理，2023 年-2024 年期间800G 都将是 AI 数据中心的首选。相较传统的 IB/Ethernet 的网络，GH200 采用的 NVLink 网络部分的成本占比虽然大幅增长，但网络在数据中心中成本占比仍较低，通过提升网络性能来提升算力效率，性价比很高。带宽越高，单位 bit 传输的成本更低、功耗更低以及尺寸更小。1.6T 光模块有望在 2024 年下半年小批量出货，升级周期缩短，预计提早一年左右。2、OSFP-XD 可能为 1.6T 光模块主流的封装方案，光口单通道200G，电口单通道 100G。从上游芯片来看，200G PAM4 EML光芯片目前进展相对比较快，1.6T DSP 电芯片有望取得突破；从上游的光连接器来看，多款不同产品将采用不同的连接器；从下游的客户来看，英伟达、谷歌和亚马逊可能会是 1.6T 光模块的主要需求客户。以英伟达的 GH200 架构为例，假设 PCIe 和NVLink 的下一代带宽增加一倍，那么在训练场景下，非常乐观的情况下 H100 与 1.6T 光模块对应比例有望达到 1:12。3、北美云厂商收入增速有所回暖，各家云厂商对未来 AI 的投资指引乐观。AWS 用于 AI 的超算集群，采用无阻塞网络，AI芯片包括英伟达 GPU 和自研的芯片，AWS 的网络采用 EFA 配合 SRD 协议，因此光模块及交换机预计也采用定制化方案。Meta 的用于训练的超级集群的网络与英伟达的 DGX A100 SuperPOD 胖树三层网络架构非常相似，GPU 与光模块的比例也基本一致。谷歌数据中心探索 OCS（optical circuit switch）光交换机新方向，可取代 Spine 层交换机。基于 OCS 的网络架构中，对光模块用量影响较小，但对光模块 ASP 提升较大。风险提示：AI 需求不及预期；竞争加剧；国际环境变化影响供应链安全；行业前沿技术研发进展不及预期等。维持强于大市阎贵成 SAC 编号:S1440518040002 SFC 编号:BNS315 武超则 SAC 编号:s1440513090003 SFC 编号:BEM208 杨伟松 SAC 编号:S1440522120003 发布日期:2023 年 08 月 08 日市场表现相关研究报告-12%8%28%48%2022/8/52022/9/52022/10/52022/11/52022/12/52023/1/52023/2/52023/3/52023/4/52023/5/52023/6/52023/7/5通信上证指数通信行业动态报告通信请务必阅读正文之后的免责条款和声明。目录一、网络在算力系统中的地位有望继续提升，1.6T 光模块加速推进.1 二、北美云厂商资本开支指引乐观，800G 及 1.6T 光模块需求或爆发.8 三、投资建议.15 四、风险分析.16 图表目录图表 1：英伟达 DGX A100 SuperPOD 系统示意图.1 图表 2：光通信行业光口和电口升级迭代示意图.2 图表 3：英伟达 GH200 VS H100 IB 集群在大内存模型下的表现.2 图表 4：GH200 的网络连接示意图.3 图表 5：1.6T 的 OSFP-XD 封装与 OSFD 和 QSFP-DD 封装的对比.3 图表 6：OSFP MSA 和 4x400G MSA 的 1.6T 主要方案.4 图表 7：OSFP-XD 的 DR8 网络拓扑图.4 图表 8：OSFP-XD 的 4xFR2 网络拓扑图.4 图表 9：OSFP MSA 和 4x400G MSA 的 1.6T 主要方案.5 图表 10：三菱 200G PAM4 EML 结构示意图.5 图表 11：博通 200G EML 及 PD 解决方案示意图.5 图表 12：Marvell 用于光模块中的 DSP 产品升级示意图.6 图表 13：OSFP-XD 封装形式下部分连接器的示意图.6 图表 14：NVLink 不同代际的升级 Roadmap.7 图表 15：在 PCIe 和 NVLink 不同情况下的 GPU 与光模块比例情况.7 图表 16：北美四大云厂商资本开支情况（百万美元）.8 图表 17：亚马逊云收入情况（百万美元）.8 图表 18：亚马逊资本开支情况（百万美元）.8 图表 19：AWS 的第一代 EC2 UltraClusters 的网络架构介绍示意图.9 图表 20：AWS 的第二代 EC2 UltraClusters 的网络架构介绍示意图.9 图表 21：AWS 包含 EFA 的 HPC 软件栈示意图.10 图表 22：AWS SRD 协议示意图.10 图表 23：2020-2023Q2 年 Meta 收入情况（百万美元）.10 图表 24：2020-2023Q2 年 Meta 资本开支情况（百万美元）.10 图表 25：Meta 的 SuperCluster 的网络架构介绍示意图.11 图表 26：Meta 早期发布的数据中心网络架构示意图.12 图表 27：Meta 新的数据中心设备分布示意图.12 图表 28：2020-2023Q2 年谷歌云收入情况（百万美元）.13 图表 29：2020-2023Q2 年谷歌资本开支情况（百万美元）.13 图表 30：谷歌 Spine 层交换机逐步替换成 OCS 交换机.13 WUBYxOtOpMqRtNtQsPtMoPbRaO8OpNoOpNsRfQpPvNlOmMyQ8OqRsPwMnNpNxNnRrN 行业动态报告通信请务必阅读正文之后的免责条款和声明。图表 31：谷歌包含 OCS 的网络架构示意图.14 图表 32：谷歌 Palomar OCS 内部结构示意图.14 图表 33：谷歌内置 Circulator 的光模块结构示意图.14 图表 34：2020-2023Q2 年微软云收入情况（百万美元）.15 图表 35：2020-2023Q2 年微软资本开支情况（百万美元）.15 1 请务必阅读正文之后的免责条款和声明。行业动态报告通信一、网络在算力系统中的地位有望继续提升，1.6T 光模块加速推进算力基础设施是影响 AI 发展与应用的核心因素，优秀的网络性能可以提升计算效率，显著提升算力水平。以 ChatGPT 为代表的 AIGC 技术，依靠强大的 AI 模型和海量数据，能够在多个应用场景下产生优质的内容，有望推动人工智能更广泛地应用。算力作为 AIGC 技术的重要支撑之一，是影响 AI 发展与应用的核心因素。算力基础设施成了目前行业亟需布局的资源，目前除了 CPU/GPU 等算力硬件需求强劲之外，网络端也催生了更大的带宽需求，以匹配日益增长的流量，未来随着 AI 应用的发展，对于流量与带宽的需求有望进一步增长。图表1：英伟达 DGX A100 SuperPOD 系统示意图资料来源：英伟达，中信建投 2022 年开始，北美传统云计算市场的光模块已经开始向 800G 速率升级，在 AI 领域，我们认为无论是训练还是推理，800G 在 2023 年-2024 年，都将是 AI 数据中心的首选。从传统数通市场的发展历史来看，光模块速率已经升级到 800G 的速率。从电口来看，单个 Serdes 的速率达到了 100G，而单个光路的速率也达到了50G Baud（EML 的速率），经过 PAM4 调制后达到 100G 速率。800G 光模块 2022 年底开始小批量出货，2023年需求主要来自于谷歌和英伟达。随着 AI 的快速发展，网络作为重要的组成部分，北美大部分 AI 的客户也是采用目前行业速率最高的 800G 光模块。2024 年，800G 光模块的出货量有望大幅增长。目前，英伟达的 A100 GPU 主要对应使用 200G 光模块，H100 GPU 主要对应使用 800G 光模块。每个A100 GPU 配一张 Mellanox HDR 200Gb/s Infiniband 网卡，每个 H100 GPU 配一张 Mellanox NDR 400Gb/s Infiniband 网卡。英伟达在 H100 SuperPOD 的设计中，采用了 800G 的光模块，在光口采用 1 个 800G 光模块可以替代 2 个 400G 光模块，在电口也可以将 8 个 SerDes 通道进行整合，与光口的 8 个 100G 通道一一对应。因此，在这种设计之下，交换机的通道密度提高，物理尺寸显著降低。2 请务必阅读正文之后的免责条款和声明。行业动态报告通信图表2：光通信行业光口和电口升级迭代示意图资料来源：思科，中信建投增加网络带宽能够显著提升算力，且性价比很高，GH200 便是重要的实例。NVLink 带宽远大于网卡侧的PCIe 带宽，因此若将 NVLink 从服务器内部 GPU 互连拓宽至不同服务器之间的 GPU 互连，将显著提升系统的带宽。2023 年 6 月，英伟达创始人兼 CEO 黄仁勋在 NVIDIA Computex 2023 演讲中宣布，生成式 AI 引擎NVIDIA DGX GH200 现已投入量产。GH200 通过 NVLink4 的 900GB/s 超大网络带宽能力来提升算力，服务器内部可能采用铜线方案，但服务器之间我们认为会用光纤连接。对于单个 256 GH200 芯片的集群，计算侧 1 个GH200 对应 9 个 800G 光模块；对于多个 256 的 GH200 集群，计算侧 1 个 GH200 对应 12 个 800G 光模块。相较传统的 IB/Ethernet 的网络，GH200 采用的 NVLink 网络部分的成本占比虽然大幅增长，但是因为网络在数据中心中的成本占比较低，因此通过提升网络性能来提升算力效率，性价比实际很高。图表3：英伟达 GH200 VS H100 IB 集群在大内存模型下的表现资料来源：英伟达，中信建投 3 请务必阅读正文之后的免责条款和声明。行业动态报告通信网络对 AI 的作用愈发重要，包括带宽，架构和协议层。更高的网络带宽能够在单位时间传输更多的数据量，在内存增加的同时带宽也相应提升，从而变相提升系统的算力水平；无阻塞的网络架构能够保证在数据量飙升时，数据在整个集群中的传输保持顺畅；协议层上的优化，包括 Infiniband、NVLink 系统中的协议、基于RDMA 的以太网协议、云厂商定制化的网络协议，都能保证数据传输时的高稳定性、高可靠性及低时延等。图表4：GH200 的网络连接示意图资料来源：英伟达，中信建投 1.6T 光模块有望在 2024 年下半年小批量出货，比预期提早一年左右。在 AI 数据中心中，越来越多的客户倾向于选择更大带宽的网络硬件。带宽越大，单位 bit 传输的成本更低、功耗更低及尺寸更小。800G 光模块的高增速已经能够反映出 AI 对于带宽迫切的需求，其在 2022 年底开始小批量，2023 年和 2024 年的出货量都有望大幅增长。而 AI 对于带宽的需求是没有极限的，得益于网络较高的性价比，1.6T 光模块有望加速应用。图表5：1.6T 的 OSFP-XD 封装与 OSFD 和 QSFP-DD 封装的对比资料来源：OSFP MSA，中信建投目前 1.6T 光模块的 MSA 标准包括 4x400G 和 OSFP。4x400G MSA 成立于 2021 年 12 月，主要成员包括Arista、博通、英特尔和 Molex 等厂商。4x400G MSA 成立之初，旨在提供单通道 100G 的解决方案，可利用现有的硬件，快速实现量产。但是若 200G 单通道的硬件逐步成熟，4x400G 的方案将会受到比较大的挑战。而 4 请务必阅读正文之后的免责条款和声明。行业动态报告通信 OSFP MSA 成立于 2016 年 11 月，面向 400G 及更高速率的光模块，主要成员已有 100 多家，包括谷歌、Arista、Coherent、中际旭创、思科和安费诺等厂商。OSFP MSA 对于 1.6T 光模块提供了 OSFP1600 和 OSFP XD 等两种封装方式。图表6：OSFP MSA 和 4x400G MSA 的 1.6T 主要方案资料来源：OSFP MSA，4x400G MSA 官网，中信建投目前 OSFP-XD 封装方案为 1.6T 光模块主流的选择。OSFP-XD，即为 Octal Small Form Factor eXtra Dense Pluggable Module，是超高密度封装方式的可插拔光模块。在 2023 年 OFC 会议上，各家厂商展出的 1.6T 光模块基本均为 OSFP-XD 封装的。其中，中际旭创演示了 1.6T OSFP-XD DR8+光模块，单通道 200G，温度范围0-70，功耗低于 23W，传输距离可以达到 2km；新易盛展示了基于 OSFP-XD 的 1.6T 4xFR2 光模块，采用4xSN 接口，电口 16 个 100G 通道，光口 4x400G FR2，采用 1291nm 和 1311nm 两个波长，同时公司的官网上还有 DR8 和 2xFR4 两款产品；Coherent 则展示了基于单通道 200G 的光模块，该技术将成为 800G Gen2 和1.6T 光模块的核心，有望加速未来 1.6T 的发展。此外，华工科技、光迅科技和剑桥科技等也在积极布局 1.6T的研发。图表7：OSFP-XD 的 DR8 网络拓扑图图表8：OSFP-XD 的 4xFR2 网络拓扑图资料来源：OSFP MSA，中信建投资料来源：OSFP MSA，中信建投 1.6T 光模块按照传输距离、通道数和波长可以分为多种产品，下游客户可以根据实际需求定制化相关产品。目前电口的速率为 100Gbps，而光口将逐步从 100G 升级到 200G。以 IM-DD 的调制方式，若光口单通道速率为 100G，则需要有 16 个光通道，包括 DR16（采用一个波长），4FR4（采用四个波长），2FR8（采用八个波长）；若光口单通道为 200G，则需要 8 个光通道，包括 DR8（采用一个波长），4FR2（采用两个波长），5 请务必阅读正文之后的免责条款和声明。行业动态报告通信 2FR4（采用 4 个波长），FR8（采用八个波长）。以相干的调制方式，若单通道速率为 800G，包括 ZR2（采用两个波长）。我们认为，光口单通道 200G 预计是 1.6T 光模块未来的主流选择。图表9：OSFP MSA 和 4x400G MSA 的 1.6T 主要方案资料来源：OSFP MSA，中信建投从上游的光芯片来看，200G PAM4 EML 进展加速。1.6T 光模块的发展，核心元件是芯片，包括光芯片和电芯片。其中 100G Baud EML，或叫 200G PAM4 EML，目前有多家厂商正在加速研发。三菱在 2023 年 3 月发布了 200G PAM4 EML 产品，可用于 CWDM 的光模块中，800G 采用四个，1.6T 采用八个；Lumentum 的200G PAM4 EML 荣获 Lightwave 2023 创新奖，该产品最大限度地降低了输入电压的波动，从而降低驱动芯片的功耗，不仅可以用于 PAM4 调制，同时在 PAM6 和 PAM8 调制上也有应用的潜力。博通的 200G EML 也在加速研发中，2022 年公司已经可以提供相关的解决方案，同时公司可以提供创新的无制冷的 200G EML 激光器方案。图表10：三菱 200G PAM4 EML 结构示意图图表11：博通 200G EML 及 PD 解决方案示意图资料来源：三菱，中信建投资料来源：博通，中信建投从上游的电芯片来看，1.6T DSP 有望迅速取得突破。2023 年 3 月，Marvell 发布了新一代 Nova 系列PAM4 DSP 芯片，采用 5nm 先进制程。Nova 系列的 DSP 中包含 Gearbox，将电口 16 个 100G 的通道与光口 8个 200G 的通道进行适配，能够应用于 1.6T 的 DR8/DR4.2/2xFR4/LR8 光模块中。同时，该 DSP 加入了 SNR 的性能监控、FFE-taps、PRBS 发生器等功能。2023 年 OFC 期间，博通和 Semtech 联合演示了 200G 单通道电光链路，其中采用了博通最新的 112GBd PAM4 的 DSP 产品，为未来 1.6T 网络奠定了基础。6 请务必阅读正文之后的免责条款和声明。行业动态报告通信图表12：Marvell 用于光模块中的 DSP 产品升级示意图资料来源：Marvell，中信建投从上游的光连接器来看，多款不同产品将采用不同的连接器。根据光路的数量和波长的分类，有不同的连接器产品可以适配，包括 LC 连接器、MPO 连接器、MXC 连接器、CS 连接器和 SN 连接器等产品。比如，MPO-12 的双排连接器可以用于八通道的光模块中，上排八个通道用于 Tx 发射端，下排八个通道用于 Rx 发射端；四个 SN 连接器可以用于 1.6T 4xFR2 光模块中。图表13：OSFP-XD 封装形式下部分连接器的示意图资料来源：OSFP MSA，中信建投从下游客户来看，英伟达、谷歌和亚马逊可能会是 1.6T 光模块的主要需求方。英伟达网络带宽的需求非常强劲，在 GH200 中，NVLink 从服务器内部的 GPU 直接连接释放到服务器之间 GPU 的互连。NVLink 4.0 的带宽是目前 PCIe 5.0 的 9 倍，因此需要同等倍数的光模块来支撑如此大的带宽。若采用 1.6T 光模块，则单位bit 的成本、功耗和尺寸都将显著降低，因此 1.6T 的需求可能旺盛。同时，若 NVLink 升级到 5.0，带宽将进一步提升，那么对于光模块的需求将持续增长。我们认为，谷歌作为在数通光模块市场需求的主力，对光模块更新迭代的需求一直走在行业最前沿，加上 1.6T 带来的各种优势，因此 1.6T 也将成为谷歌的主要需求产品。而亚马逊本身的光模块升级计划是从 400G 直接到 1.6T 光模块，因此一旦 1.6T 产品成熟，亚马逊可能会大量采购。7 请务必阅读正文之后的免责条款和声明。行业动态报告通信图表14：NVLink 不同代际的升级 Roadmap 资料来源：英伟达，中信建投以英伟达的 GH200 架构为例，假设 PCIe 和 NVLink 的下一代带宽增加一倍，那么在训练场景下，非常乐观的情况下，H100 与 1.6T 光模块对应比例有望达到 1:12。假设 PCIe 6.0 的带宽增加一倍，那么从 GPU 到网卡适配器的带宽增加一倍，光模块的总带宽也增加一倍。在胖树三层架构的基础上，H100 和 800G 的比例由1:3 上升到 1:6，与 1.6T 的比例则可能达到 1:3。假设 NVLink 下一代 5.0 的带宽增加一倍，在 GH200 的产品中，H100 和 800G 的比例由 1:9 上升到 1:18，与 1.6T 的比例则有望达到 1:9。在多个 256 集群的 GH200 产品中，假设乐观情况下 PCIe 和 NVLink 同时升级到下一代产品，且带宽增加一倍，那么 H100 与 800 光模块比例有望达到 1:24，与 1.6T 光模块比例有望达到 1:12。图表15：在 PCIe 和 NVLink 不同情况下的 GPU 与光模块比例情况资料来源：英伟达，中信建投（假设 PCIe 6.0 的带宽相比 5.0 增加一倍，NVLink5.0 的带宽相比 4.0 提升一倍）8 请务必阅读正文之后的免责条款和声明。行业动态报告通信二、北美云厂商资本开支指引乐观，800G 及 1.6T 光模块需求或爆发北美云厂商收入增速有所回暖，短期资本开支同比下降，但各家云厂商对未来 AI 的投资指引乐观。2023Q2，北美三家云厂商亚马逊、谷歌和微软的云业务收入总计 541.64 亿美元（其中 Meta 的云相关收入未披露），同比增长 15.43%，环比增长 6.41%，增速有所提升。2023Q2，北美四家云厂商的资本开支为 334.2 亿美元，同比下降 9.56%。其中，微软的资本开支为 89.43 亿美元，同比增长 30.16%，Meta 同比下降 18.52%，谷歌同比增长 0.88%，亚马逊同比降低 27.15%。虽然 2023Q2 海外云厂商的 Capex 降幅有所扩大，但是各家云厂商对未来（今年下半年及明年）资本开支维持较为乐观的指引口径，对 AI 业务发展均给予较高期待。图表16：北美四大云厂商资本开支情况（百万美元）资料来源：Wind，中信建投 2023Q2，亚马逊的云业务收入为 221.4 亿美元，同比增长 12.16%，环比增长 3.68%。虽然在过去的几个季度，AWS 客户在云计算业务的开支不断减少，但是目前公司已经看到客户开始将注意力更多放在创新上，同时考虑将新的工作负载放在云上。2023Q2，亚马逊的资本开支为 114.55 亿美元，同比下降 27.15%，环比下降19.37%。公司预计 2023 年的资本开支略高于 500 亿美元，同比有一定的下降，其中用于配送和运输的支出有所下降，但是用于 AI 的技术基础设施投资有所增加。图表17：亚马逊云收入情况（百万美元）图表18：亚马逊资本开支情况（百万美元）资料来源：Wind，中信建投资料来源：Wind，中信建投 AWS 用于 AI 的超算集群，采用无阻塞网络，AI 芯片包括英伟达 GPU 和自研的芯片。第一代 EC2 Ultra-50%0%50%100%150%200%250%050001000015000200002500030000350004000045000亚马逊微软谷歌 Meta 亚马逊YoY 微软YoY 谷歌YoY Meta YoY-10%0%10%20%30%40%50%05000100001500020000250002020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22022Q32022Q42023Q12023Q2AWS收入（百万美元）环比同比-50%0%50%100%150%200%050001000015000200002020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22022Q32022Q42023Q12023Q2资本开支（百万美元）环比同比 9 请务必阅读正文之后的免责条款和声明。行业动态报告通信 Clusters 包含 4000 多张英伟达 A100 GPU，网络部分采用 400G EFA 网卡适配器，单个服务器有 8 张 A100 GPU，用 4 个 100G 的网卡连接，网络带宽有一定的限制。近期，公司推出了第二代 EC2 Ultra Clusters，该集群包含20000 多张英伟达 H100 GPU，采用第二代 EFA 适配器，带宽为 800G，从服务器连出去的带宽为 3.2T，大幅提升，且同样采用无阻塞网络架构，因此光模块用量及速率将大幅提升。Ultra Cluster 除了采用英伟达的 GPU，公司也有自研的 Trainium 和 Inferential 的 AI 芯片方案，最大规模可达到 3 万张 Trainium，算力达到 6EFlops。图表19：AWS 的第一代 EC2 UltraClusters 的网络架构介绍示意图资料来源：AWS，中信建投图表20：AWS 的第二代 EC2 UltraClusters 的网络架构介绍示意图资料来源：AWS，中信建投 10 请务必阅读正文之后的免责条款和声明。行业动态报告通信 AWS 的网络采用 EFA 配合 SRD 协议，因此光模块及交换机预计也采用定制化方案。EFA 是定制化的低延迟网卡适配器，用于支持复杂的 HPC 工作负载，支持内核旁路和 RDMA。相比较 TCP 通信，网络延迟更低，数据吞吐量更高。EFA 允许应用程序直接访问网络接口，而无需让操作系统参与，从而减少开销且使得应用程序更有效地运行。SRD 协议，即 Scalable Reliable Datagram，基于以太网协议，是专门为 AWS 网络构建和优化的协议。在 HPC 中，数据包延迟和丢包会增加时延，降低扩展效率。SRD 可以提供可靠的乱序交付，增加尽量多的网络路径发送数据包，在接收处快速排序，既可以降低传输延迟，也可以提升数据吞吐量。同时SRD 有专门的拥塞控制，保证在各种负载下较高的传输带宽和稳定的时延。AWS 原来的光模块升级计划是从400G 到 1.6T，但我们认为网络带宽需求不断提升，2024 年公司的主要需求为 800G，但 1.6T 需求也有望加速。图表21：AWS 包含 EFA 的 HPC 软件栈示意图图表22：AWS SRD 协议示意图资料来源：AWS，中信建投资料来源：AWS，中信建投 2023Q2，Meta 净利润为 77.88 亿美元，同比增长 16.46%，环比增长 36.42%，业绩表现出色。2023Q2 公司的资本开支为 61.34 亿美元，同比下降 18.52%。公司预计 2023 年资本开支为 270 亿美元-300 亿美元，本年度第二次下调全年预期，主要原因是在非 AI 的服务器上节省了成本，同时由于项目延迟和设备交付推迟，这些减少的资本开支将递延到 2024 年。公司预计 2024 年资本开支将保持增长，驱动力来自数据中心和服务器，尤其用于支撑 AI 方面的发展。公司过去在人工智能基础设施上投入了数十亿美元，目前这些投入已经对公司的相关业务产生了明显的推动作用，包括排序和推荐系统的优化。图表23：2020-2023Q2 年 Meta 收入情况（百万美元）图表24：2020-2023Q2 年 Meta 资本开支情况（百万美元）资料来源：Meta，中信建投资料来源：Meta，中信建投-30%-20%-10%0%10%20%30%40%50%60%0500010000150002000025000300003500040000收入（百万美元）环比同比-40%-20%0%20%40%60%80%100%120%140%0100020003000400050006000700080009000100002020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22022Q32022Q42023Q12023Q2资本开支（百万美元）环比同比 11 请务必阅读正文之后的免责条款和声明。行业动态报告通信 2022 年 1 月，Meta 发布了“Research SuperCluster”项目，旨在部署超大规模的服务器集群。第一阶段公司部署了 760 台英伟达 DGX A100 服务器，总共包含 6080 只 GPU，且采用 200G Infiniband 的 3 层 Clos 网络架构连接。截至 2023 年 5 月，公司在 Meta s AI Infra Scale 活动上表示第二阶段的部署之前也已经完成。目前，Meta 该项目总共包括 2000 台 DGX A100 服务器，总共包含 16000 只 A100 GPU。而网络部分，Meta 采取了当前规模最大的 Infiniband 网络，包含了 48000 条链路和 2000 台交换机。48000 台链路对应 96000 个连接点，每个连接点为 DAC 模块或者光模块，假设全部为光模块，那么在 Meta 的服务器集群中，A100 与光模块的比例为 1：6，与英伟达胖树三层架构计算侧的比例基本一致。我们认为，Meta 的用于训练的超级集群的网络与英伟达的 DGX A100 SuperPOD 胖树三层网络架构非常相似，GPU 与光模块的比例也基本一致。图表25：Meta 的 SuperCluster 的网络架构介绍示意图资料来源：Meta，中信建投追溯 Meta 老数据中心的网络架构，可类比胖树三层 Clos 架构。2014 年，Meta 基于简单模块化的设计思维，为了能够扩展更大的服务器规模，对现有的网络架构做了一定的更新。该网络架构的最小单元为 1 个POD，每个 POD 包含 48 个服务器机架，每个机架上都对应一个 TOR 交换机，每个 TOR 交换机包含 4 个 40G的上行链路，而下行链路可以提供 16 个 10G 的端口。每个 POD 中的 48 个 TOR 交换机，与 4 个 Fabric 交换机相连。而 POD 之间连接则需要再加上 Spine 层的交换机。该网络可以通过部署更多的交换机来实现无阻塞网络，也可以搭设有一定收敛比的网络。若搭建无阻塞网络，则与胖树架构非常类似。当网络数据量飙升的时候，可以灵活地增加更多的交换机，以满足快速增长的流量传输。12 请务必阅读正文之后的免责条款和声明。行业动态报告通信图表26：Meta 早期发布的数据中心网络架构示意图资料来源：Meta，中信建投 2023Q1，Meta 将 2023 年资本开支的预期从 340 亿美元-370 亿美元下调到 300 亿美元-330 亿美元，主要原因是数据中心建设的成本降低，因为新的数据中心架构性价比高，可以同时支持 AI 和非 AI 的工作载荷。从Meta 以往的数据中心网络架构和用于 AI 训练的 SuperCluster

展开阅读全文