20230814_德邦证券_电子行业FPGA万能芯片点燃成长新动力国产替代未来可期_32页.pdf

返回 相关 举报
20230814_德邦证券_电子行业FPGA万能芯片点燃成长新动力国产替代未来可期_32页.pdf_第1页
第1页 / 共32页
20230814_德邦证券_电子行业FPGA万能芯片点燃成长新动力国产替代未来可期_32页.pdf_第2页
第2页 / 共32页
20230814_德邦证券_电子行业FPGA万能芯片点燃成长新动力国产替代未来可期_32页.pdf_第3页
第3页 / 共32页
20230814_德邦证券_电子行业FPGA万能芯片点燃成长新动力国产替代未来可期_32页.pdf_第4页
第4页 / 共32页
20230814_德邦证券_电子行业FPGA万能芯片点燃成长新动力国产替代未来可期_32页.pdf_第5页
第5页 / 共32页
亲,该文档总共32页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
请务必阅读正文之后的信息披露和法律声明 Table_Main 证券研 究报 告|行业深 度 电子 2023 年 08 月 14 日 电子 优 于大 市(首次)证 券 分 析师 陈海进 资 格编号:S0120521120001 邮 箱:chenhj3 陈蓉芳 资 格编号:S0120522060001 邮 箱:chenrf 研究助理 市场表现 相关研究 1.电 子周观 点:关 注顺周期 被动元件,以 及 DDR5 和 汽车智能 化下沉机 会,2023.8.13 2.GPU 龙 头 产 品 迭 代 不 断,产 业链 各环节 持续催 化,2023.8.10 3.天 准 科 技(688003.SH):明 场检 测 设 备 交 付,半 导 体 业 务 迎 里 程碑,2023.8.10 4.电 子周观 点:关 注顺周期 被动元件,以 及 华 为 链 和 4D 雷 达 创 新 方向,2023.8.6 5.电 子周观 点:存储有 望量价 修复,智 能驾驶 强强联 合,2023.7.30 FPGA:“万 能”芯 片 点 燃 成 长 新 动 力,国产替代未来可期 Table_Summary 投 资要 点:灵活性、低功耗、并 行计 算优 势 铸 就不 可 替代 性,FPGA 是 未 来 数 据 中 心的 关 键。FPGA 最 大 的特点 是可编程 性,用户在 使用 过程中 可以通 过软件 灵活地 配置芯 片内部 的资源,以 实 现不同 的电路 功能;同时,FPGA 因 其结 构特点 而适用 于 并 行 计算,且 以更低 的功耗 主打 能 耗 比、性 价 比 优势。我 们 看好 FPGA 在 数 据 中 心 的增 长 潜力主要由于:(1)芯 片 层 面:芯 片 制 造 工 艺 所 遇 到 的 功耗 瓶 颈 问 题 使 得 暗 硅 效 应产生,基于 CPU+GPU 以及 CPU+FPGA 的 异 构成为未 来高性 能计算 的发展 趋势;(2)数 据中心 层面:超 算数 据中心 性能飞 速提升,带来 严重的 能源成 本与散 热压力 问题,相较于 GPU,FPGA 能 够为 数据中 心提供 更高 的 能耗 比和性 价比。市 场 空 间超 行 业预 期,数 据中 心 为 FPGA 市 场 再 添 新 动 力。相较于其 他逻辑 芯片而 言,FPGA 在 灵活性、性能、功耗、成 本之间 具有较好 的平衡,在 工业 控制、网络 通信领 域有广 泛的应 用,两 大领域 合计占 有中国 FPGA 市 场空 间的 73%(2019年)。数据中 心是未 来 FPGA 市 场 增长的 新动力,据 Semico 预测,FPGA 加速器市 场有望 从 2018 年 的 10 亿 美元 增 长至 2023 年 超过 50 亿美元。2022 年,受益于 数据中心行 业 发 展 的 驱 动,FPGA 市 场 规 模 迎 来 爆 发 式 增 长,同 比 增 速 接 近30%,远超 Frost&Sullivan 所 预期的 15.7%增 速 值。根据 FPGA 龙 头厂 商 Intel(Altera)于 2023 年 年 中给 出的市 场预测,2023 年市 场增长 预计将 超过 16%,未来 5 年的 增长势 头向好,预 计将继 续保持 10%以 上的复 合年均 增长率。FPGA 国 产 替 代:从 硬件 实力 到 软 件生 态,关 关 难过 关关 过。国产 FPGA 与 国 际龙 头 实 力悬 殊,主要体现 在:(1)发 展历 史:国际龙头大 多创立 于上个 世纪 80 年代,积累 至今 已 形成全 面覆盖 从数 十 K 至数 千 K 个 逻辑 单元量 级、从 低端到 高端的 全系列、全领 域 产品 线。国产 FPGA 尚 处于 中低端市 场 耕耘 与拓展 阶段。(2)竞争格局:国际龙 头占据 全球 市场 绝 对份额,2019 年全 球前四 大 FPGA 厂 商合 计占据 94.4%的 市场份 额,国产 化率尚 且较低。(3)硬 件水 平:国际龙头 已进入 7nm制 程,且 已采用 更为前 沿的存 储与互 连技术。国产 仍处于 28nm 向 1Xnm 研发 的过 程中。(4)软 件 水 平:海外 FPGA 厂 商已建 立成熟的 EDA 软 件生 态环境,国产FPGA 厂商也有自 研 EDA 工 具,软 件层面 的 研发 投入未 来仍将 占据较 大比重。FPGA 国 产 替 代:机 遇和 挑战 并 存,前 路 漫漫 亦 灿灿。我们看好 FPGA 国 产 替 代的原因包括:(1)国 际 龙 头 未 来 预 计 将 配 合 母 公 司 数 据 中 心 战 略 重 点 发 力 高 端 市场,中端 FPGA 市 场占位 机遇 出现;(2)中国 FPGA 市 场仍以 低端容 量和中 端制程 为主,国产 FPGA 可触 达市 场空间 依然广 阔;(3)国产 FPGA 厂 商开始 崛起,据 我们测 算,主 要国 产 FPGA 设 计 公司 合计营 业收入 自 2018 年的 2 亿 元增 长至2022 年的 33 亿元,中 高端 FPGA 新品 也已 布局研发,国产 替代加 速进行 中。我们认为国产 替 代进 程:短期 内 可关注 国产 FPGA 厂商已 触达的 中低端 市场景 气程度、以及各 家厂商 的客户 拓展,我们认 为中低 端市场 国产 替代 大 有可为;长期来 看,国产 FPGA 厂 商在 28nm 以 下新产 品的研 发进展 对高端 市场的 拓宽至 关重要,有望 成为国 产 FPGA“第二 成长 曲线”。风 险 提 示:数据中 心 对 FPGA 行 业驱动 力不及 预期风险,其他 传统下 游应用 领域需 求不足 风险;国产替 代进展 不及预 期风险;竞争 加剧风 险。-18%-15%-11%-7%-4%0%4%2022-08 2022-12 2023-04沪深300 行业深度 电子 2/32 请务必阅读正文之后的信息披露和法律声明 内 容目 录 1.FPGA:芯 片设计 的“万能”积木.6 1.1.如 何 理解 FPGA 的硬件 结构?.6 1.2.FPGA 特 点:灵 活性高,适用于 并行计 算.7 1.3.前 沿 技术:关注 HBM 高 带宽存 储与 NoC 片上网络 互连.9 1.3.1.HBM:兼 顾高 容量和大 带宽,是弥合 内存层 次结构 中关键 缺口的 存储类 型 9 1.3.2.互 连:片上资 源互连复 杂性催 生 NoC 架 构应用.10 2.市 场空 间超行 业预期,FPGA 迎 来 爆发 时刻.14 2.1.驱 动 力:数 据中心 蓬勃兴 起,FPGA 行业 成长再 添新 动力.14 2.2.其 他 应用领 域:工 业/通信 FPGA 基 本盘 稳健增 长,汽车电 子值得 关注.19 2.2.1.工 业领 域:工 业智能化、无人 化趋势 催生更 多 FPGA 应用.19 2.2.2.通 信领 域:灵 活适配各 类 通信 协议的 应用与 快速迭 代.20 2.2.3.汽 车电 子:解 决方案由 分布式 走向集 成式,FPGA 提 供灵 活性.21 2.3.市 场 空间测 算:“Chat G P T”点燃 AI 热潮,打开 FPGA 想 象 空间.22 3.国 产替 代:从 硬件实 力到 软件生 态,关 关难过 关关过.24 3.1.FPGA 硬 件 已进入 7nm 复杂异 构,高 端领域 国内外 厂商实 力悬殊.24 3.2.AMD、Intel 双 寡 头 主导市 场,中 端市场 国产化 机遇显 现.26 3.3.EDA 工 具 构 筑核心 壁垒,软件生 态与 FPGA 硬件 相辅 相成.30 4.风 险提 示.31 1ZAZuNnQtQpOoQtQnQsNoPaQcM6MnPoOnPtQfQnNzRjMpOqNbRpOnQxNtOtOvPrQyQ 行业深度 电子 3/32 请务必阅读正文之后的信息披露和法律声明 图 表目 录 图 1:FPGA 开发 板结构 以 AMD(Xilinx)FPGA 套件 ZCU102 为例.6 图 2:FPGA 芯片 结构.7 图 3:查 找表(LUT)结 构.7 图 4:FPGA 大致 的发展 历程.7 图 5:FPGA 芯片 属于逻 辑芯 片大类.7 图 6:FPGA 芯片 逻辑功 能实 现过程.8 图 7:CPU 工作 流程.8 图 8:FPGA 与其 他逻辑 芯片 的比较.9 图 9:FPGA 内存 层次结 构 以 Intel Agilex-M FPGA 为例.10 图 10:典型的 总线型 SoC 结构.10 图 11:片 上网络(NoC)架 构 2D-NoC.11 图 12:片上网 络(NoC)架 构 3D-NoC.11 图 13:Achronix Speedster7t FPGA 结构图(2D NoC).11 图 14:NoC 架构 类比城 市街 道系统 上的高 速公路 网络.11 图 15:利用 2D NoC 进 行内 部逻辑 互连.12 图 16:NoC 的每 个交叉 点上 都有两 个网络 接入点(NAP).12 图 17:IO96 子系 统和部 分顶 部硬核 内存 NoC 详解.12 图 18:Intel Agilex-M FPGA 横 向与 纵向网 络 NoC 数据 传输架 构.12 图 19:配备 AI 引擎架 构的 Versal ACAP 概略图.13 图 20:AI 引擎 阵列接 口.13 图 21:2019 年 中国 FPGA 下 游应用 领域占 比.14 图 22:2019-2021 年 Xilinx 公司 FPGA 下游 应用领 域占 比.14 图 23:2018-2023 年 全 球数 据中心 加速器 市场规 模预测.14 图 24:2018-2023 年 全球 FPGA 加 速 器市 场规模 预测.14 图 25:随着时 间推移,暗硅 效应的 影响程 度不断 增大.15 图 26:暗硅效 应示意 图.15 图 27:主流服 务器性 能增长 趋势.16 图 28:GPU 性能 增长趋 势.16 图 29:超级计 算机系 统性能.16 图 30:超级计 算机能 耗轨迹.16 图 31:VCK5000 Versal 开 发 卡与主 流 NVIDIA GPU 指 标 相比.17 图 32:VCK5000 Versal 开 发 卡与主 流 NVIDIA GPU 指 标 相比.17 行业深度 电子 4/32 请务必阅读正文之后的信息披露和法律声明 图 33:英伟达 Grace-Hopper 计 算平台.17 图 34:英伟达 推出 DGX GH200 AI 超 级 计 算机.17 图 35:AMD Instinct MI300 系 列芯 片.18 图 36:AMD Alveo V70 数 据 中心加 速器卡.18 图 37:Intel DCAI 产 品 发展战 略.18 图 38:中国 FPGA 市场规模(按领 域划分).19 图 39:中国 FPGA 市场规模 占比.19 图 40:AMD(Xilinx)FPGA 在 工业 中的应 用.19 图 41:基于 FPGA 的工业伺 服系统.20 图 42:基于 FPGA 的 LED 显 示驱动 系统.20 图 43:AMD(Xilinx)FPGA 在 通信 中的应 用.20 图 44:Intel(Altera)为 5G RAN 提 供 端到端 芯片解决 方案.21 图 45:Lattice FPGA 在 汽车 中的应 用.21 图 46:全球 FPGA 市场规模.22 图 47:中国 FPGA 市场规模.22 图 48:全球 FPGA 市场规模 测算(亿美元,不完 全统计).23 图 49:FPGA 厂 商创立 及并 购史.24 图 50:FPGA 厂 商首款 28nm 节点产 品推出 时间表.26 图 51:2019 年 全球 FPGA 市 场竞争 格局(出货量 口径).26 图 52:2019 年 中国 FPGA 市 场竞争 格 局(销售额 口径).26 图 53:2019 年 中国 FPGA 市 场竞争 格局(出货量 口径).27 图 54:2019 年 中国 FPGA 市 场按逻 辑单元 拆分(销售额 口径).27 图 55:2019 年 中国 FPGA 市 场按制 程拆分(销售 额口径).27 图 56:AMD 宣布 Xilinx 7 系 列产品 的生命 周期将 至少延 长至 2035 年.27 图 57:AvantTM平 台 在容量、带宽、性能上 大幅提 升.28 图 58:Lattice 基于 NexusTM和 AvantTM平 台的 Roadmap.28 图 59:Lattice AvantTM平 台介 绍.28 图 60:Lattice AvantTM平 台相 较于竞 品的优 势.28 图 61:国产 FPGA 厂商产品 线布局(28nm 及 更先进制 程,不 完全统 计).29 图 62:国产 FPGA 公司营收(单位:亿元;口径:FPGA 业 务).30 图 63:FPGA 公 司毛利 率对 比(口 径:FPGA 业务).30 图 64:FPGA 软 件工 具设计 流程.30 图 65:FPGA 软 件工 具研发 投入占 比较大.31 行业深度 电子 5/32 请务必阅读正文之后的信息披露和法律声明 表 1:NoC 传输带 宽计算 以 Intel Agilex-M FPGA 为例.12 表 2:云 服务器 厂商 FPGA 应 用实例.15 表 3:AMD(Xilinx)FPGA 高/中/低端产 品系列 对比.24 表 4:AMD(Xilinx)自 适应 SoC 高/中/低 端产品 系列对 比.25 表 5:安 路科技 PH1A 系 列与 Lattice Avant-E 系 列 对比.29 表 6:FPGA 厂商 软件开 发工 具情况.31 行业深度 电子 6/32 请务必阅读正文之后的信息披露和法律声明 1.FPGA:芯 片 设 计的“万 能”积木 1.1.如 何理 解 FPGA 的 硬 件 结构?FPGA(Field Programmable Gate Array)又称现场可 编程门 阵列,是 在硅 片上预先 设计实现 的具有可 编程特性 的集成电 路,用 户在使用 过程中可 以通 过软件重新 配置芯 片内部 的 资源实现 不同功 能。通 俗 意义上讲,FPGA 芯 片 类似于集 成电路中 的积木,用户可根 据各自的 需求和想 法,将 其拼搭成 不同的功 能、特性的电路 结构,以满足 不 同场景的 应用需 求。鉴 于 上述特性,FPGA 芯 片又被称作“万能”芯片。图 1:FPGA 开 发板 结构以 AMD(Xilinx)FPGA 套件 ZCU102 为例 资料来 源:AMD(Xilinx)官网,德 邦研究 所 据安路科技招股书,FPGA 芯 片 由可编程的逻辑单元(Logic Cell,LC)、输入输出单元(Input Output Block,IO)和开关连线阵列(Switch Box,SB)三个部分构成:(1)逻辑单元:通过 数 据 查找表(Look-up Table,LUT)中 存放的 二进 制数 据 来 实 现 不 同 的 电 路 功 能。LUT 的 本 质 是 一 种 静 态 随 机 存 取 存 储 器(Static Random Access Memory,SRAM),其大小是 由 输入端的 信号数 量决定 的,常用的查找表 电路是 四输入 查 找表(4-input LUT,LUT4)、五输 入查找 表(5-input LUT,LUT5)和 六输入 查找表(6-input LUT,LUT6)。查找表输入端越多,可以实现的逻 辑电 路越 复杂,因此 逻辑 容量 越大,但是查找表的面积和输入端数量成指 数关系,输 入端数 量增加 一个,查找 表使用 的 SRAM 存储电路 面积增 加约一 倍。不同的 逻辑单元 结构可以 使用不同 大小的查 找表,或 者是不 同查找表 类型的组 合。此外,逻辑单 元内部还 包含选择 器、进位 链和触发 器等其 他组件。为了提高 芯片 架构效率,若干逻 辑单元 可 以进一步 组成 逻辑块(Logic Block),逻 辑块内 部提供快速局部 资源,从而形 成 层次化芯 片架构。(2)输入输出单元:是 芯片与外 界电路 的接口 部 分,用于实 现不同 条件下 对输入/输出信号 的驱动 与 匹配要求。行业深度 电子 7/32 请务必阅读正文之后的信息披露和法律声明(3)开关阵列:能够 通 过内部 MOS 管的开 关控 制信号连 线的走 向。图 2:FPGA 芯 片结 构 图 3:查 找表(LUT)结构 资料来 源:安路 科技 招股 书,德邦 研 究所 资料来 源:天野 英晴 FPGA 原理 和 结构,德邦 研究 所 FPGA 从 Xilinx 公司 1985 年推出世界首 款 FPGA 芯片“XC2064”经历过数十年发展,在硬件架构上大致经历了四个阶段:从 PROM 阶段(简单 的 数字逻辑)到 PAL/GAL 阶段(“与”&“或”阵列)再 到 CPLD/FPGA 阶段(超大规模电路),到如 今 FPGA 与 ASIC 技术融合、向系统 级发展的 SoC FPGA/eFPGA 阶段。硬件 水平整 体趋向 更 大规模、更高灵 活性、更 优性能。图 4:FPGA 大 致的 发展历程 资料来 源:OpenFPGA 公众号,德 邦研究 所 1.2.FPGA 特 点:灵 活性 高,适用 于并行 计算 FPGA 芯 片 属于逻辑芯片大类。逻 辑芯片 按功能 可分为四 大类芯 片:通 用 处理器芯片(包含中 央处理 芯片 CPU、图形处理 芯 片 GPU,数字 信号处 理芯 片 DSP等)、存储 器芯 片(Memory)、专用 集成 电路 芯片(ASIC)和 现场 可编程逻 辑 阵列芯片(FPGA)。图 5:FPGA 芯 片属 于逻辑芯片 大类 行业深度 电子 8/32 请务必阅读正文之后的信息披露和法律声明 资料来 源:安路 科技 招股 书,德邦 研 究所 据复旦微招股书,FPGA 兼具灵活性和并行性两大特点。(1)灵活性:FPGA芯片拥有 更高的 灵活性 和 更丰富的 选择性,通过对 FPGA 编 程,用户可 随时改变芯 片内部的 连接结构,实现任 何逻辑功 能。尤其 是在技 术标准尚 未成熟或 发展 更迭速度快 的行业 领域,FPGA 能有效 帮助企 业降 低投资风 险及沉 没成本,是一种兼具功能 性和经 济效益 的 选择。图 6:FPGA 芯 片逻 辑功能实现 过程 资料来 源:安路 科技 招股 书,德邦 研 究所(2)并行性:CPU、GPU 在执行任务 时,执 行单 元需按顺 序通过 取指、译码、执行、访存以及 写回等一 系列流程 完成数据 处理,且多方共 享内存导 致部 分任务需经 访问仲 裁,从而 产生任务 延时。而 FPGA 每个逻辑 单元与 周围逻 辑单元的 连接构造 在重编程(烧写)时就已经 确定,寄 存器和 片上内存 属于各自 的控 制逻 辑,无需 通过指令 译码、共 享内存来 通信,各 硬件逻 辑可同时 并行工作,大 幅提升数据 处理效 率。尤 其 是在执行 重复率较高的大数据量处理任务 时,FPGA 相比 CPU 等优势明 显。图 7:CPU 工 作流 程 资料来 源:半导 体行 业观 察公 众号,德邦研 究所 行业深度 电子 9/32 请务必阅读正文之后的信息披露和法律声明 据润和软件,相较于其他逻辑芯片 而言,FPGA 在 灵活性、性能、功耗、成本之间具有较好的平衡:(1)相较 于 GPU,FPGA 在 功 耗 和灵活性等方面具备优势。一方 面,由 于GPU 采用大 量的处 理单 元并且大 量访问 片外存 储 SDRAM,其计算峰值 更高,同时功耗也 较高,FPGA 的 平均功耗(10W)远低于 GPU 的平均功 耗(200W),可有效改 善散热 问题;另 一方面,GPU 在设 计完成 后无法改 动硬件 资源,而 FPGA根 据特定应 用对硬件 进行编程,更具灵 活性。机 器学习 使用多条 指令平行 处理 单一数据,FPGA 的定 制 化能力更 能满足 精确度 较 低、分散、非常 规深度 神 经网络计算需求。(2)相较于 ASIC 芯 片,FPGA 在 项 目初期具备短周期、高性价比的优势。ASIC 需从标准 单元进 行 设计,当 芯片的 功能及 性 能需求发 生变化 时或者 工 艺进步时,ASIC 需重新 投片,由此带来 较高的 沉没成 本 以及较长 的开发 周期;而 FPGA具 有编程、除错、再 编程和重 复操作等 优点,可 实现芯 片功能重 新配置,因此 早期 FPGA 常作 为定制 化 ASIC 领域的 半定制 电路 出现,被 业内认 为是构 建 原型和开发设计 的较快 推进的 路 径之一。图 8:FPGA 与 其他 逻辑芯片的 比较 资料来 源:复旦 微招 股书,润 和软 件,德邦 研究 所 1.3.前 沿技 术:关注 HBM 高 带宽 存储 与 NoC 片 上 网络 互连 1.3.1.HBM:兼顾高容 量和大带 宽,是 弥合内存层次 结构 中关键缺口 的存储类型 FPGA 逻 辑 结构中的内存大致分为三个层次(以Intel Agilex-M FPGA 为例),包括超本 地化片 上内存、以 HBM2e 堆栈形式提供 的本地封 装内存,以及 DDR5和 LPDDR5 等外部内存 架构和接 口。片上内存(MLAB 模 块和 M20K 模块):最本地 化的内存;封 装 内 存(HBM):弥 合 内 存 层 次 结 构 中 关 键 缺 口 的 内 存,其容量远大于片上内 存(两 个数量 级 以上),同 时带宽 又远大 于片外内 存(两 个数量级以上);片外内存(DDR5、LPDDR5 等):对于超 出 HBM2e 容量的应用,或 对独立内存 的灵活 性 有要 求 时,需 要 DDR5 和 LPDDR5 以及其他 主流的 内存架构。行业深度 电子 10/32 请务必阅读正文之后的信息披露和法律声明 HBM2e 与 FPGA 裸 片集成在同一封装中可以在小尺寸外形规格中实现更高带宽、更低功耗、更低时延。(1)内存容量方面:每个 HBM2e 堆栈可包含 4 层或 8 层,每 层提 供 2GB 内存,因 此单个 Intel Agilex-M 系列 FPGA 可包 含 16GB或 32 GB 的 高带宽 内存;(2)带宽方面:HBM2e 可实现每 堆栈高 达 410Gbps 的内存带宽,较 DDR5 组 件的带宽 提升高 达 18 倍,较 GDDR6 组件 提升 7 倍。两个 HBM2e 堆栈加起来可 提供高达 820Gbps 的峰 值内存带 宽;(3)功耗和时延方面:由于 HBM2e 集成在封装中,因此也 不需要 使 用外部 I/O 引 脚,从 而节 省了电路板空间,并消 除了它 们 会带来的 功耗和 互连时 延。图 9:FPGA 内 存层 次结构 以 Intel Agilex-M FPGA 为例 资料来 源:Intel(Altera)官网,德 邦研究 所 1.3.2.互连:片上资源互连 复杂 性催生 NoC 架构应用 片上网络(NoC,Network on Chip)是 指在单芯片上集成大量的计算资源以及连接这些资源的片上通信网络,用于在可编程逻辑(PL)、处理器系统(PS)和其它硬核块中的 IP 端点之间共享数据。与 之对 应的 概念 片上系 统(SoC)则 是包含一整套多样化和互连单元的单芯片,旨在 解决一 定范 围的任务。传 统上,SoC 包括几个 计算内 核、内 存控制器、I/O 子系 统 以及 它们 之间的连 接 与切 换方式(总线、交叉 开 关、NoC 元 件)。图 10:典型 的总线型 SoC 结构 资料来 源:OpenFPGA 公众号,德 邦研究 所 行业深度 电子 11/32 请务必阅读正文之后的信息披露和法律声明 片上网络 NoC 包括计算和通信两个子系统。计算子系统(由 PE,Processing Element 构成 的子系 统)完成广 义的“计算”任务,PE 既可以 是现有 意义 上的CPU、SoC,也可以是各 种专用功 能的 IP 核或存 储器阵列、可重构 硬件等。通信子系统(由 Switch 组成 的子系统)负 责连接 PE,实现计算 资源之 间的高 速 通信。通信节点 及其间 的互连 线 所构成的 网络 即 为片上 通 信网络。图 11:片上 网络(NoC)架构2D-NoC 图 12:片上 网络(NoC)架构3D-NoC 资料来 源:OpenFPGA 公众号,德 邦研究 所 资料来 源:OpenFPGA 公众号,德 邦研究 所 类比城市高速公路网络,NoC 架构简化互连路径,提高 FPGA 传 输速率。Achronix 基于台积电(TSMC)的 7nm FinFET 工艺的 Speedster7t FPGA 器件包含了 2D NoC 架构,为 FPGA 外 部高速 接口 和内部可 编程逻 辑的数 据 传输提供了超 高带宽(27Tbps)。NoC 使 用 一系 列 高速的 行 和列 网络 通 路(水平 和垂 直方式)在整个 FPGA 内 部分发数据,每 一行或 每一 列都有两 个 256 位的、单 向的、行业标准的 AXI 通道,可 以在每个 方向上以 512Gbps(256bit x 2GHz)的传输速率运行。图 13:Achronix Speedster7t FPGA 结 构 图(2D NoC)图 14:NoC 架构 类比 城 市街道 系统上的 高速公 路网络 资料来 源:Achronix 公众号,德 邦研 究所 资料来 源:21IC 电子网,德 邦研 究所 NoC 为 FPGA 设 计提供了几项重要优势,包括:(1)提高设计 的性能;(2)减少逻辑资源闲置,在高 资源占用设计中降低布局 布线拥塞的风险;(3)减小功耗;(4)简化逻 辑设计,由 NoC 去替代传 统的逻 辑去做高 速接口 和总线 管 理;(5)实现真正 的模块 化设计。行业深度 电子 12/32 请务必阅读正文之后的信息披露和法律声明 图 15:利用 2D NoC 进 行内部逻 辑互连 图 16:NoC 的每 个交叉 点上都 有两个网 络接入 点(NAP)资料来 源:Achronix 公众号,德 邦研 究所 资料来 源:Achronix 公众号,德 邦研 究所 Intel(Altera)利用 NoC 架构实现内存和可编程逻辑结构之间的 现高带宽数据传输。如下图 所示,每 个片上 HBM2e 堆栈通过 UIB 与其 NoC 通信。片 外内存(DDR4、DDR5 等)则通过 IO96 子 系统与 NoC 通信。NoC 通过一个 由交换机(路 由器)、互连 链路(导 线)、发起 程序(I)和目 标(T)组 成的 网络,将 数 据从数据源 传输到 目的地。每个 NoC 都提供 一个横 向网络,通过 AXI4 发起 程序将可编程逻 辑结构 中的逻 辑 连接到集 成 NoC 的目 标 内存。此 外,每 个 NoC 也都提供一个纵 向网络,通过 优 化的路由 将横向 网络路 径 读取的内 存数据 分发到 FPGA的可编程 逻辑结 构深处(可编程逻 辑结构 和/或 M20K 模块)。图 17:IO96 子 系统和 部分顶部 硬核内存 NoC 详解 图 18:Intel Agilex-M FPGA 横 向与纵向 网络 NoC 数据 传输架 构 资料来 源:Intel(Altera)官网,德 邦研究 所 资料来 源:Intel(Altera)官网,德 邦研究 所 表 1:NoC 传 输带宽 计算 以 Intel Agilex-M FPGA 为例 顶部 NoC 底部 NoC NoC 中 256 位发起程序 的数量 20 个 22 个 每个发起 程序的 带宽 256 位 x 700MHz=22.4Gbps 顶部/底部 NoC 带宽 256 位 x 700MHz x 20 个发起程序=3.58Tbps 256 位 x 700MHz x 22 个 发起程序=3.94Tbps 总带宽合计 3.42+3.76=7.52Tbps 资料来 源:Intel(Altera)官网,德 邦研究 所 行业深度 电子 13/32 请务必阅读正文之后的信息披露和法律声明 AMD(Xilinx)在 AI 引擎 和可编程逻辑之间部署 NoC 架构,可 大幅降低功耗。AMD Versal 产品最突出的优 势之一,是能 够 在自适应 引擎中将 AI 引 擎阵列与可编程 逻辑(PL)结 合使用,由 AI 引擎 阵列 接口连接 AI 引擎阵 列和 可编程逻辑。这样 的资源 结合为 在 最佳资源、AI 引擎、自 适应引擎 或标量 引擎中 实 现功能提供了极 大的灵 活性。该 方案与传 统可编 程逻辑 DSP 和 ML 实现方案相比,可将芯片面积 计算密 度提高 达 8 倍,从 而在额 定值情 况下,可 将功耗 降低 40%。图 19:配备 AI 引 擎架构的 Versal ACAP 概略图 图 20:AI 引擎 阵列接口 资料来 源:AMD(Xilinx)官网,德 邦研究 所 资料来 源:AMD(Xilinx)官网,德 邦研究 所 行业深度 电子 14/32 请务必阅读正文之后的信息披露和法律声明 2.市 场空 间超 行业 预期,FPGA 迎 来 爆 发 时刻 2.1.驱 动力:数据 中心 蓬勃兴 起,FPGA 行 业 成 长再 添新 动力 FPGA 芯片具 有灵活 性 高、应用 开发成 本低、上 市时间短 等优势 使其应 用 场景覆盖了包括 工业 控制、网 络通信、消费电 子、数据 中心、汽车电子、人工智能等广泛的 下游市 场。各大应用领域占比整体保持稳定,数据中心更具增长动力。根据 Xilinx 财报,2019-2021 年 下游应 用 占比格局 几乎未 发生大 规 模变动,其中数 据中心 营 收占比分别为 7%、9%、10%,相较于其 他领域 而言具 备 更快的增 长速度。图 21:2019 年中国 FPGA 下 游 应用领域 占比 图 22:2019-2021 年 Xilinx 公司 FPGA 下 游应用 领域占 比 资料来 源:Frost&Sullivan,安路 科 技招股 书,德邦 研究 所 资料来 源:Xilinx 财报,德 邦研 究所 注:A&D 为航空 航天 和国 防、TME 为测试 测量 和仿 真 2022 年,国际龙头 厂商 AMD 和 Intel 的 FPGA 业务 在数据中心领域大放异彩,成为其 业绩增长的有力助推。AMD 对 FPGA 龙头 Xilinx 的收购大大推 动其嵌入式部门 和数据 中心的 业 绩增长,两部 门产品 营收 从 2021 年的 39 亿美元 增长至2022 年的 106 亿美元;Intel FPGA 业务 助推 DCAI 部门(Data Center and AI Group,数据 中心和人 工 智能事业 部)实现 14%的营收增 长。FPGA 在 数 据中心领域 未来 有望占据更多市场份额。英 特尔中 国研究 院院长宋继强曾 表示,2020 年 CPU+FPGA 异构计 算将 占据云数 据中心 市场的 1/3。据Semico 研究公 司预测,全球数据 中心加 速器(包 括 CPU、GPU、FPGA 和 ASIC)市场规模 将从 2018 年的 28.4 亿美元增 长到 2023 年的 211.9 亿美元,年复 合增长率高达 49%。其 中 FPGA 加速 器 在 2018 年只有 10 亿美元,到 2023 年将超过50 亿美元,其增长 驱动 力主 要来 自企业 级数据 负 载加速应 用。图 23:2018-2023 年 全球 数据中 心加速器 市场规 模预测 图 24:2018-2023 年 全球 FPGA 加 速 器 市场规模 预测 资料来 源:Semico,德 邦研 究所 资料来 源:Semico,德 邦研 究所 工业32%网络通信41%消费电子6%数据中心11%汽车电子6%人工智能4%工业 网络通信 消费电子数据中心 汽车电子 人工智能0%20%40%60%80%100%2019 2020 2021A&D、工业、TME 汽车、广 播和消 费 通信数据中心 渠道收入0501001502002502018 2023全球数据 中心加 速器(亿美元)CAGR=49%01020304050602018 2023全球FPGA 加速器(亿美元)CAGR38%行业深度 电子 15/32 请务必阅读正文之后的信息披露和法律声明#1:数据中心为什么要部署 FPGA?FPGA 芯 片 在数据中心领域主要用于硬件加速,在云服务器厂商中已有广泛部署。数 据中心 使用 FPGA 芯片代 替传统的 CPU 方案后,处理 其自定 义 算法时可实现显 著的加 速效果。因此 近年 来,微 软 Azure、亚马 逊 AWS、阿里 云 的服务器上都开 始部署 FPGA 加速器用 于运算 加速。在 云计算大 面积应 用的背 景 下,未来数据中 心对芯 片性能 的 要求将进 一步提 高,更多 数据中心 将采纳 FPGA 芯片方案,这将 提高 FPGA 芯 片在数据 中心芯 片中的 价 值占比。表 2:云 服务器 厂商 FPGA 应 用 实例 微软 亚马逊 AWS 阿里云 百度云 腾讯云 FPGA 芯片 Intel Stratix V Intel Stratix 10 Xilinx Ultrascale+系列 Xilinx Ultrascale+系列、Intel FM8 系列 Xilinx XCKU115 Xilinx Virtex UltraScale+部署时间 2014 2017 2017 2017 2017 2017 应用领域 搜索引擎 数据中心、人工 智能 弹性云计 算(AWS EC2)弹性云计 算(阿 里云)云服务器 云服务器 产品实例 Bing Azure、Brainwave AWS F1 云服务器 阿里云 F3/F5 云服务器 百度云服 务器 c4/g4/m4 加速型 FX4 云服务器 资料来 源:AMD(Xilinx)官网,亚 马 逊官网,阿里 云官 网,百度 云官 网,腾讯云 官网,英特 尔 FPGA 中国 创新 中心,CSDN,电子 技术应 用,电 子发 烧友,51CTO,德邦研 究所(1)芯片级别的 能耗限制与暗硅效应问题 芯片制造工艺所遇到的瓶颈问题,始终影响 着芯片设计的 技术路线 选择。在半导体 发展早 期,Dennard 缩放 定律(1974 年 提出,其内 容为:晶体管功耗会 随着尺 寸变小 而 同比变小,使相 同硅片 面 积下总功 耗保持 不变)指 引 工业 界 不断 实现 工 艺迭 代,在 每 个新 的工 艺 节点 上 使用 更 多的 晶 体管、更快 速率 和更 低功 耗 的 晶 体管,证 明开 发每 个 新工艺节点所 需的 巨大成本 具 备商业 合理性。而 Dennard 缩放定律的 停滞(当摩 尔定律 使晶体 管尺寸下 降到纳 米级时,量 子 隧穿 等 现象 导致 晶 体管 漏 电,使 晶体 管的 静 态功 耗 不减 反 增,功 率密 度 上升,散 热问 题 加剧)导致 工 业界 竞相 向多核架构发展,多 核架 构实现了 并 行 和多 任务 工 作负 载 的性 能 扩展,仍 然 能够 保证 在 商 业合 理 范围内提升 处理器 性能。但 随 着多 核 缩放 的优 势 开始 消 退,在 摩尔 定律 逼 近极 限 之前,多核 的 技术 路 径已 面 临新 的瓶 颈 由 于芯 片 散热 技术 和 供电 技 术的 限 制,以 及成本限制,可承 受的微 处 理器功耗 在近 10 年 的发 展历程中 并没有 太大变化,这导 致在 10nm 或 更先进工 艺线下,以摩 尔 定律增加 的晶体 管在动态运行期 间必须 通过关 闭 来实现功 耗控制,即暗硅(Dark Silicon)问题。图 25:随着 时间推
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642