资源描述
“数字经济”系列专题(一): 国产服务器CPU研究框架 西南证券研究发展中心 计算机研究团队 2022年3月 分析师:王湘杰 执业证号:S1250521120002 电话:13480920685 邮箱: 联系人:叶泽佑 电话:13524424436 邮箱: 联系人:邓文鑫 电话:15123996370 邮箱: 1 数字经济+国产替代双轮驱动,国产服务器CPU空间广阔。数字经济大背景下,服务器作为底层算力支撑,在各行各业数智化转型的浪潮中迎来需求爆发,根据IDC,预计2025年中国服务器出货量将达到525.2万台,市场规模达到350亿美元。同时,严峻的国际贸易形势再次强调自主可控的必要性与紧迫性,根据国务院印发的新时代促进集成电路产业和软件产业高质量发展的若干政策,中国芯片自给率要在2025年达到70%(当前不到20%),预计2025年国产x86芯片出货量超700万颗,市场规模约为158亿美元。 六大国产CPU,角逐行业信创市场。当前主流国产CPU厂商包括采用x86架构的兆芯、海光,采用 ARM架构的飞腾、海思,基于MIPS架构的龙芯,以及基于Alpha架构的申威。综合考虑产业需求及各厂商旗舰级产品的性能和生态适配等因素,我们认为,短期内海光、鲲鹏及飞腾三家企业最有望受益于行业信创及新基建的爆发节奏,1-3年内迎来出货量高增的确定性强;后续的市场格局还存在不确定性,龙芯等厂商凭借全栈自主可控的技术路径持续迭代,亦有望实现快速发展。 曙光海光协同效应突出,共享高增长机遇。中科曙光为海光信息的第一大股东,二者业务形成良好协同。海光提供性能优异的国产CPU,为曙光的战略转型提供支点;曙光在计算产业的全面布局已积累大量优质的客户资源和销售渠道,为海光芯片的放量打下基础。 风险提示:国际贸易形势恶化风险;电信、金融等行业信创国产化率不达预期;海光芯片出货量不及预期;行业竞争加剧等。 投资要点 2 2 5 目 录 一、服务器及CPU综述 二、全球CPU市场格局 三、服务器视角看CPU发展趋势 四、国产CPU行业篇 1.1 服务器的定义及分类 1.2 CPU的定义及分类 五、国产CPU厂商篇 3 Q1:CPU占服务器的成本比重? 根据IDC,在经典的基础服务器中CPU成本约占服务器整体硬件成本的32%; 在在更高高性能的服务器中,如面向计算推理的AI服务器,处理器相关成本占比高达50%-83%。 本章导读 Q2:服务器CPU的分类? 按指令集架构分类,主要可分为复杂指令集(CISC)服务器和精简指令集(RISC)服务器。 CISC:一条指令完成一个复杂的基本功能。单条指令集功能强,指令类型丰富完善,编译后指令数量较少,通用场景下性能具有优势。以x86架构为代表,主要用于桌面PC及服务器领域,配套软硬件丰富完善。 RISC:一条指令完成一个基本动作,多条指令组合完成一个复杂的基本功能。指令集架构在不断完善,译码效率高,偏向低功耗领域优化。以ARM架构为代表,还包括MIPS、Power、Risc-V等,过去主要用于手机、平板等移动终端,软硬件生态逐步建设完善。 1.1 服务器信息化时代的基石产品 4 服务器的定义 服务器是一种高性能计算机,其中包含向网络用户提供特定服务的软件和硬件,它比普通计算机运行更快、负载更高、价格更贵。服务器的定义包含了以下两个方面的内容:一方面,服务器可以为网络提供特定服务,人们通常会以服务器所能提供的服务来命名服务器;另一方面,服务器是软件和硬件的统一体,特定的服务程序需要运行在特定的硬件或一般通用的微机上才能完成服务功能,由服务程序完成服务策略,并通过硬件实现所需的服务。 服务器的功能 服务器可以为网络中的客户机(如PC、智能手机、大型系统设备等终端)提供特定应用服务,主要完成数据的存储、传输、处理和发布。 服务器的构成 由处理器(CPU)、内存、磁盘、网卡、监视器、电源、机箱系统总线等软硬件构成。其中最重要的部分是CPU和内存,CPU 用于实现判断和计算功能,内存用于暂时存放CPU 的运算数据,以及与硬盘、外部存储交换数据。 服务器的性能 由于需要提供高可靠的服务,服务器在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面的要求比普通的个人电脑高。同时服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。 数据来源: CSDN,西南证券整理 1.1 全球服务器发展历程 5 数据来源: CSDN,西南证券整理 第一代电子管计算机时代 1946年,第一台电子计算机ENIAC研制成功;1951年,IBM生产出第一台用于科学计算的大型机IBM 701;1953年,IBM推出了第一台用于数据处理的大型机IBM702和第一台小型机IBM650,为第一代商用计算机描绘出了一个丰满而生动的形象。 1946-1954年 晶体管造就第二代计算机 1954年,第一台使用晶体管的第二代计算机TRADIC诞生于美国贝尔实验室,采用了浮点运算,实现计算能力的飞跃;1958年,大型科学计算机IBM 7090诞生,实现了晶体化;1961年,第一台流水线计算机IBM7030研制成功,其成为了超级计算机的雏形 1954-1964年 集成电路使第三代计算机脱胎换骨 1964年,第一台通用计算机IBM/360研制成功,其采用了集成电路技术,实现了通用性(集科学计算、数据处理和实时控制功能于一身)、系列化(区分了小型机、大型机和超级计算机,统一了指令格式、数据格式、字符编码、IO接口和中断系统,实现了不同型号兼容)和可扩展性(具有开发价值),成为了计算机发展史上的一个重要里程碑; 1964-1970年 第四代计算机时代 1970年,IBM S/370问世,单晶硅电路技术、虚拟存储器技术、多处理技术相继应用其中,到1976年,S/370已发展成为具有17种型号的庞大家族。 1981年,S/370系列的地址线位数被增加到了31位,大大增强了其寻址能力,并且在存储方面还增加了扩展存储器,与主存分离,改善了系统性能。80代年上半叶以前,服务器主要是面向高端用户。80年代下半叶,大型机系统体系机构更新步伐加快。1986年,IBM 9370系列发布,标志着S/370开始向低端方向延伸,目标是服务于中小型企业。 1970年至今 1.1 服务器的构成 6 数据来源:IDC,CSDN,西南证券整理 服务器的主要组成部分 服务器的逻辑架构仍然遵循冯诺依曼架构,主要包含:处理器(CPU、GPU、DPU等)、存储器、I/O接口,以及SSD、BMC、PCIe插槽、主板、电源、风扇和相关软件等。 处理器是服务器的大脑,根据IDC,以经典x86服务器E5高配为例,CPU成本在基础型服务器中约占32%,在更高高性能的服务器中,处理器相关成本占比高达 50%-83%。 三大核心零部件(处理器、内存、硬盘)成本占服务器总成本比例约为服务器总硬件成本的80%。 服务器内部结构图 各类服务器成本构成 1.1 服务器的分类 7 数据来源:CSDN,西南证券整理 按服务器形态分类 刀片式服务器: 塔式服务器: 机架式服务器: 标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块“刀片”实际上就是一块独立的服务器。 正面类似PC机,但侧面较长,无统一标准,一般无需和机柜搭配 外形类似交换机,有1U(1U=1.75英寸)、2U、4U等标准规格。 优点:价格低 缺点:体积较大 使用场景:中小企业及入门级客户 优点:体积小,统一工业标准生产 缺点:扩充性受限,散热问题 使用场景:大型企事业单位及IDC 优点:空间密度较高 缺点:存储能力不如机架式服务器 使用场景:特殊应用行业及高性能计算机、云计算等 机柜式服务器: 面向新一代数据中心的形态,功能模块和支撑模块分离,容易实现统一集中管理和业务自动部署。 优点:高密度、模块化、节省电能 缺点:定制化设备,对机房称重要求严苛 使用场景:大型数据中心 1.2 CPU服务器的大脑 8 数据来源: CSDN,西南证券整理 处理器作为服务器的核心组成部分,对于服务器的整体性能发挥有着决定性的作用。此处列举中央处理器(CPU),图形处理器(GPU)以及深度学习处理器(DPU)这三大对于现今服务器行业有着长远影响的处理器。 CPU 中央处理器(CPU),是电子计算机的主要设备之一,电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU主要包括两个部分,即控制器、运算器,其中还包括高速实现缓冲处理器之间联系的数据、控制的总线。其功效主要为处理指令、执行操作、控制时间、处理数据。在计算机体系结构中,CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。CPU 是计算机的运算和控制核心。计算机系统中所有软件层的操作,最终都将通过指令集映射为CPU的操作。 1.2 CPU服务器的大脑 9 数据来源: CSDN,西南证券整理 处理器作为服务器的核心组成部分,对于服务器的整体性能发挥有着决定性的作用。此处列举中央处理器(CPU),图形处理器(GPU)以及深度学习处理器(DPU)这三大对于现今服务器行业有着长远影响的处理器。 GPU DPU 图形处理器(GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形 处理 时GPU所采 用 的核 心技 术有 硬 件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等。GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。但GPU无法单独工作,必须由CPU进行控制调用才能工作。 数据处理器(DPU)最早由国内深鉴科技提出,基于Xilinx可重构特性的FPGA芯片,设计专用的深度学习处理单元,且抽象出定制化的指令集和编译器,从而实现快速的开发与产品迭代。DPU集三个关键要素于一身,分别为: 行业标准的、高性能及软件可编程的多核CPU,通常基于已应用广泛的Arm架构,与其的SOC组件密切配合。 高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU。 各种灵活和可编程的加速引擎,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。 1.2 CPU的分类指令集 10 数据来源: CSDN,艾瑞咨询,西南证券整理 按照设计思路的不同,CPU可分为复杂指令集(CISC)架构和精简指令集(RISC)架构。 CISC(Complex Instruction Set Computer):一条指令完成一个复杂的基本功能。单条指令集功能强,指令类型丰富完善,编译后指令数量较少,通用场景下性能具有优势。以x86架构为代表,主要用于桌面PC及服务器领域,配套软硬件丰富完善。 RISC(Reduced Instruction Set Computer):一条指令完成一个基本动作,多条指令组合完成一个复杂的基本功能。指令集架构在不断完善,译码效率高,偏向低功耗领域优化。以ARM架构为代表,过去主要用于手机、平板等移动终端,软硬件生态逐步建设完善。 CISC RISC 指令系统 复杂、庞大 精简 指令数目 一般大于200条 一般小于200条 指令字长 不固定 定长 可访存指令 不限制 只有Load/store指令 通用寄存器数 较少 多 各种指令使用频率 相差较大 都比较常用 控制方式 绝大多数为微程序控制 绝大多数为组合逻辑控制 指令流水线 可通过一定方式实现 必须实现 代表架构 x86 ARM、MIPS、RISC-V等 特点 高性能、生态完善 低功耗、生态逐步完善 应用场景 桌面PC、服务器 移动终端、服务器 CISC RISC 处理器性能: = 两种指令集设计思路 两种指令集差异 优化每个程序的指令数量 牺牲每个指令的时钟周期 牺牲每个程序的指令数量 减少每个指令的时钟周期 x86 ARM、MIPS、Power、RISC-V等 1.2 CPU的分类x86 11 数据来源: CSDN,西南证券整理 按CPU体系架构分类 X86架构简介: X86架构应用场景: X86架构(The X86 architecture)是微处理器执行的计算机语言指令集,指一个intel通用计算机系列的标准编号缩写,也标识一套通用的计算机指令集合。X86指令集是美国Intel公司为其第一块16位CPU(i8086)专门开发的,同时电脑中为提高浮点数据处理能力而增加的X87芯片系列数学协处理器则另外使用X87指令,后续就将X86指令集和X87指令集统称为X86指令集。虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到今天的Pentium 4(以下简为P4)系列,但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集。X86架构具有性能高、速度快、兼容性好的特点,目前占据了服务器、桌面及移动PC的主要市场份额。 适用于高主频、高功耗,覆盖高性能和通用计算场景,主要运用于PC和自动化设备,也有应用在手机和平板电脑上。X86运行的主要为DOS,非ARM版Windows,旧版MacOS等操作系统,起步早,基于Wintel联盟,生态完善。 1.2 CPU的分类ARM 12 数据来源: CSDN,西南证券整理 按CPU体系架构分类 ARM架构简介 ARM架构,曾称进阶精简指令集机器(Advanced RISC Machine)更早称作Acorn RISC Machine,是一个32位精简指令集(RISC)处理器架构,此外还有基于ARM设计的派生产品,包括Marvell的XScale架构和德州仪器的OMAP系列。ARM架构具有成本低、低费用、低功耗、小体积、高性能的特点,同时是业界领先的微处理器体系结构,为系统和软件工程师提供了开发低耗能、高性能消费类和工业产品的硅验证解决方案,其完整产品线包括微控制器、微处理器、圆形处理器、实现软件、单元库、嵌入式内存、高速连接产品、外设以及开发工具。 ARM架构应用场景 类别 领域 应用 嵌入式 家用电器、HVAC系统、智能测量平台、触摸屏控制器、远程医疗、安全/监视、航空电子 ARM将嵌入式归类为利用微控制器作为主处理器的所有应用程序。在家用电器、HVAC系统、智能测量平台、触摸屏控制器等应用程序中,ARM Cortex-M系列处理器是理想解决方案的核心。ARM Cortex-A系列处理器在远程医疗、安全/监视、航空电子领域的应用同样属于类别。 企业 闪存卡和UFD、家庭网络 ARM将企业应用程序定义为提供网络连接和/或存储功能的完整系统或子系统。这包括家庭和公司网关、企业路由器、以太网交换机、无线访问点、基站、多服务配置平台、硬盘驱动器、网络连接存储和固态磁盘。随着更高性能的多核处理器核心和经过优化的性能改进物理逻辑IP的问世,可通过ARM技术满足需求的上述应用领域得到了拓展。 家庭 蓝光和DVD、计算数字机顶盒、静态数码相机、数字电视、游戏 ARM为用户在所有屏幕类型上随时随地地访问和享受媒体内容,并与这些内容交互提供了技术平台。 移动 智能手机、功能手机连接和调制解调Trustzone和移动支付 ARM在提供支持一系列移动设备的处理器和其他关键模块方面占据着市场领先地位,这些设备可在提供卓越性能的同时延长电池寿命。将PC性能、优异的多媒体性能和卓越连接融入到移动设备的功率范围中耗费了ARM和芯片合作伙伴的大量设计精力。 1.2 CPU的分类MIPS 13 数据来源: CSDN,西南证券整理 按CPU体系架构分类 MIPS架构简介 MIPS是高效率、低功耗CPU设计原则中的闪耀明星,已经在移动和嵌入式工业领域销售了近三十年。这一架构于20多年前由斯坦福大学开发,是一种简洁、优化、具有高度扩展性的RISC架构。它的基本特点是:包含大量的寄存器、指令数和字符、可视的管道延时时隙,这些特性使MIPS架构能够提供最高的每平方毫米性能和当今SoC设计中最低的能耗。MIPS公司的R系列就是在此基础上开发的RISC工业产品的微处理器。这些系列产品为很多计算机公司采用构成各种工作站和计算机系统。 MIPS架构应用场景 领域 应用 联网 基于MIPS的FourGee-3100芯片组用于多款Chromebook笔记本电脑,例如惠普Chromebook 11和华硕Chromebook 13.3。 基于MIPS 34K多线程CPU的RT6856被广泛用于众多知名品牌的家用无线路由器中,例如华硕、友讯(D-Link)、领势(Linksys)和合勤(ZyXEL)。 消费类多媒体 松下、LG等品牌的数字电视搭载了晨星半导体(MStar)的SoC,而34K MIPS CPU则广泛用于这些SoC中。 企业存储 博安思通信(PMC-Sierra)利用多线程功能为其企业服务器专用maxRAID架构提供极具竞争力的性能。 汽车 MIPS因受到Mobileye的青睐而在汽车行业占据了举足轻重的地位。Mobileye是ADAS(高级驾驶辅助系统)领域的全球领导者,目前大部分ADAS都采用了Mobileye的技术。 物联网 Creator Ci40物联网中心开发板使用了运行频率550MHz的多线程MIPS inter Aptiv CPU。 14 2 5 目 录 一、服务器及CPU综述 二、全球CPU市场格局 三、服务器视角看CPU发展趋势 2.1 CPU产业链 2.2 CPU市场规模 2.3 CPU全球市场格局 2.4 CPU全球主要厂商 四、国产CPU行业篇 五、国产CPU厂商篇 15 Q3:服务器市场格局? x86仍是主力,ARM奋起直追。2018年前,x86架构的服务器占据全球服务器99%以上市场份额;2020年,采用ARM架构服务器的市场份额快速提升至2.7%。 在x86领域里,Intel仍是王者,AMD挑战势头正盛。Intel在全球服务器市场的份额一直保持在90%以上,AMD自从推出基于Zen架构的EYPC系列服务器后开始不断侵蚀Intel的地盘,截至2021年H1,AMD服务器出货量占比超过10%。 本章导读 Q4:CPU的主要玩家? 基于x86架构的王者Intel与挑战者AMD;基于ARM架构的挑战者Apple。 本章亦详细梳理了三家厂商在UMA(Unified Memory Architecture,统一内存架构)方向的尝试与布局,探讨CPU未来演进的方向众核、异构、集成。 2.1 CPU产业链 数据来源:IDC,西南证券整理 上游包括晶体代工、设备、封装测试和内核授权四个方面,覆盖面广。上游中相关产业存在超额利润率,CPU产业市场集中,能够对上游纵向垄断,且垄断性强。 中游包括CPU设计企业、ARM授权及嵌入式处理器三部分。全球龙头包括英特尔(IDM模式)、AMD,国内厂商包括中科曙光、中国长城、华为海思等。 下游包括PC、服务器、消费电子、物联网等。下游产业在国内外都拥有巨大市场,整体利润率高,但垄断情况相对较低。 上游 安全集成 中游 下游 晶体代工 设备 封装测试 内核授权 CPU处理器 ARM授权 嵌入式处理器 PC、服务器 消费电子 物联网 16 2.2 集成电路市场规模 17 全球集成电路行业稳步增长,重心由欧美转向亚太 数据来源: WSTS,Gartner,公司年报,西南证券整理 2011-2019全球集成电路行业市场规模及增速 (亿美元) 2020年全球前十大集成电路厂商销售收入 (亿美元) 亚太地区经济水平快速发展,居民消费能力提升,对集成电路产品的需求增加,因此世界集成电路市场重心也转移至亚太地区。2020年,根据数据统计,亚太地区(除日本外)已成为全球最大的集成电路市场,销售额占全球市场的62.0%。2019 年受全球宏观经济低迷影响,行业景气度有所下降,下半年开始逐步回暖。伴随5G、可穿戴设备及云服务器市场的稳健成长,行业收入较2019年有所增长。预计2021年全球集成电路行业将持续保持复苏势头,至2025年将保持稳步增长的趋势。 从全球竞争格局的角度看,集成电路产业的头部效应较为明显,少数领军企业占据了市场的主导地位。目前,全球集成电路市场主要由美国、韩国、日本以及中国台湾企业所占据。 702.4 562 252.7 221 179.1 157 130.7 110.1 102.1 111 01002003004005006007008002470 2382 2517 2773 2745 2766 3432 3933 3304 -3.6% 5.7% 10.2% -1.0% 0.8% 24.1% 14.6% -16.0% -20%0%20%40%0500100015002000250030003500400045002011 2012 2013 2014 2015 2016 2017 2018 2019全球集成电路行业销售额 增速 2.2 CPU市场规模 18 CPU市场规模稳健回升,国内市场增长空间巨大 数据来源: IDC、西南证券整理 2015-2020年全球及中国桌面出货量(亿台) 2015-2020年全球服务器出货量(亿台) CPU的重要应用领域包括桌面和服务器,每台桌面通常只有一颗CPU,而每台服务器的CPU数量不定。桌面领域,2015年-2018年全球出货量增速呈现缓慢下降的趋势,但是整体出货量依然保持在2.6亿台/年左右。2019年开始,全球桌面出货量出现回升,2020年全球桌面出货量较前5年有较大增长。服务器领域,根据IDC数据,2020年全球服务器出货量达1,220万台,同比增长3.9%。 国内桌面领域,近年来出货量同样呈现缓慢下降的趋势,但是整体出货量依然保持在 0.5 亿台/年左右。近两年采用国产 CPU 的桌面产品发展迅速,但市场份额仍不足 5%,增长空间巨大。国内服务器领域,根据 IDC 数据,2020 年中国服务器出货量为 350 万台,同比增长 9.8%。 0.1 0.1 0.1 0.1 0.1174 0.122 -1.6% 6.6% 15.8% -0.4% 3.9% -4%1%6%11%16%00.020.040.060.080.10.120.142015 2016 2017 2018 2019 2020出货量 增长率 2.8 2.6 2.6 2.6 2.7 3.0 0.6 0.6 0.5 0.5 0.5 -5.8% 0.0% -0.4% 3.1% 13.5% -4.2% -3.9% -2.5% -2.7% -10%-5%0%5%10%15%00.511.522.533.52015 2016 2017 2018 2019 2020全球出货量 中国出货量 全球增长率 中国增长率 2.3 CPU全球竞争格局 19 X86领域:Intel和AMD占领市场 数据来源: IDC,西南证券整理 X86架构目前占据服务器、桌面及移动PC的主要市场份额,非X86架构产品不断发起进攻。 2018-2019年,在X86领域,AMD市场规模增长了1.0%,Intel市场份额小幅度下滑,但仍然呈现出主导态势。 在服务器领域,Intel市占率仍然高达96%以上,同时AMD公司正在努力提升自己的市场份额,从2018年的1.8%增长到2019年的3.9%,同比增长117.0%。 在笔记本电脑领域,AMD市占率大幅上升,从2018年的10%增长到2019年的14.6%,Intel则下降了5.1%。 在桌上型电脑领域中,AMD市占率持续上升,兆芯也占据了一定市场份额。 全部X86 桌上型电脑 服务器 笔记本电脑 2018 85.4% 14.6% Intel AMD90.0% 10.0% Intel AMD98.2% 1.8% Intel AMD96.1% 3.9% Intel AMD86.0% 14.0% Intel AMD85.0% 15.0% Intel AMD86.4% 13.4% 0.2% Intel AMD 兆芯 82.3% 17.6% 0.1% Intel AMD 兆芯 2019 2.3 CPU全球竞争格局 20 非X86领域:ARM占据绝对优势 数据来源: IDC,西南证券整理 非X86架构CPU重要参与厂商 几种非X86架构对比 在非X86领域,ARM以低能耗、高效率、发展时间长的优势占据移动终端市场的主导地位,使用最广泛、发展最成熟,市占率达到43.2%;RISC-V发展时间短且更加灵活,在物联网领域备受关注,近几年以其开源性质被重点关注发展,后续有望在新兴领域崭露头角;MIPS主要应用在网关、机顶盒等网络设备中,市占率达到9%;Power所代表的小型机是企业IT基础设施的核心,但在相关市场的占有率仅1%左右;Alpha指令集基本已退出国际主流应用;SPARC早先被Sun公司开源,后被Oracle公司并购,如今已消失。 在移动终端方面,ARM占据绝对优势,通过授权占据移动设备端90%以上的市场,构成市场上的标准架构;在服务器方面,非X86目前参与者有华为、飞腾、高通、亚马逊等,华为的鲲鹏服务器是ARM服务器的重要参与者,而国产龙芯是基于MIPS的服务器重要厂商;在桌面PC市场,ARM正逐渐被跟多企业应用,2011年微软开始采用ARM的Windows系统,ARM开始进入X86的传统优势领域,如今苹果MacOS、新版Windows等均采用了ARM。 公司名称 架构 主要产品 苹果 ARM A12x、A14、M1等芯片广泛应用于苹果iPad,Mac等热门产品中 三星电子 ARM Exynos系列芯片 高通 ARM 经典高通骁龙系列芯片在手机市场应用广泛 联发科 ARM 天玑系列芯片在手机上应用广泛 龙芯 MIPS 网络相关硬件、激光打印机、视频游戏等具有优势应用地位。龙芯3B4000属于龙芯服务器CPU产品线 MIPS Alpha Power SPARC 代表公司 龙芯 申威 IBM Oracle 主要应用领域 党政办公 超算 高性能计算 超算 可控性 国产龙芯2020年底准备研发完全采用中国技术的可兼容指令集 服务器和桌面领域,申威初步建立了包括CPU、操作系统、数据库、办公软件等在内的国产生态,实现从不可用到基本可用的初突破 在高性能计算领域有重要地位,其一些技术特性可与Intel一较高下 - 市占率 党政办公领域占一定比例 超算领域占一定比例 1%左右 将近消失 2.4 CPU厂商- 21 数据来源:公司官网,西南证券整理 产品布局: X86:英特尔在服务器CPU领域的布局,自首款产品Pentium Pro推出以来,已经有25年之久。近12年来,英特尔服务器CPU的平台包括:Thurley 、 Romley、Grantley、Purley和Whitley,公司预计2021年发布全新的Eagle Stream。这些服务器CPU的演化几乎采用了和桌面CPU相同的“Tick-Tock”(钟摆)战略,即在“Tick”时升级CPU的制程,而在“Tock”时升级微架构。2017年以来,英特尔将服务器CPU的原有的E7、E5、E3产品线由高到低细分为Platinum(铂金)、Gold(金)、Silver(银)、Bronze(铜),满足从低阶的中小企业到高阶的人工智能,不同的性能需求。2020年6月,英特尔发布了最新的Whirley平台的Cooper Lake服务器CPU,使用14nm+制程,支持8通道DDR4 ECC内存和PCIE3.0协议。 ARM/MIPS/Power:为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以很长一段时间内Intel公司所生产的所有CPU仍然继续使用X86指令集。 2.4 CPU厂商- 22 数据来源:前瞻研究院,西南证券整理 产品布局: RISC-V : 2021年10月英特尔就已推出了基于RISC-V架构的Nios V处理器。2022年2 月 ,以X86架构为主的英特尔宣布加入RISC-V 国际基金会,并设立了10亿美元基金用于扶持初创和成熟企业进行代工生态的创新,其中很大一部分资金将用于RISC-V。 RISC-V基金会白金成员 数据来源: 公司官网,西南证券整理 5月,Intel推出史上第一个双核处理器Pentium D系列,采用90nm工艺核心,每核心拥有1MB L2缓存,均是800MHz的FSB,随后还推出了带超线程技术的Pentium Extreme Edition 840处理器,双核四线程,FSB也提升到了1066MHz,频率也更高。 2005年 2006年 2013年 2014年 Intel的单核到多核之路:自Intel在1978年推出第一颗x86处理器8086后,CPU的发展方向一直都是整合更多的指令集与外部控制器,以及更高的主频。当CPU的单核效能与频率都到瓶颈之后,Intel与AMD都开始向多核发展。 2.4 CPU厂商- Pentium D处理器的继任者是非常经典的Core 2 Due处理器,而且他们还用当年炮制首款双核处理器的手法造出了首款四核处理器Core 2 Quad。而首款桌面级的四核处理器诞生于2006年11月2日,首发产品为Core 2 Extreme Edition QX6700。 3月16日推出的Core i7-980X是首款6核处理器,核心代号Gulftown,它基于Westmere架构,处理器每核心拥有256KB L2缓存,共享12MB L3缓存,主频是3.33GHz,最高睿频3.6GHz。 桌面市场的第一颗真八核处理器是Intel在2014年推出的Core i7-5960X,属于22nm的Haswell-E架构,基础频率3GHz,最高睿频3.5GHz,拥有20MB L3缓存,属于HEDT的X99平台。 23 数据来源:公司官网,西南证券整理 Intel在5月发布的Core i7-6950X是首款桌面的十核处理器,它所用的Broadwell-E架构其实就是Haswell-E的制程升级版,生产工艺从22nm升级到14nm,核心数量从上代Core i7-5960X的8核增加到10核,晶体管数量也从26亿增加到32亿,但因为更先进的制程工艺,芯片面积从355.52mm2缩减到246mm2。 2016年 2017年 2020年 Intel的单核到多核之路:自Intel在1978年推出第一颗x86处理器8086后,CPU的发展方向一直都是整合更多的指令集与外部控制器,以及更高的主频。当CPU的单核效能与频率都到瓶颈之后,Intel与AMD都开始向多核发展。 2.4 CPU厂商- 6月份,Intel推出了第七代Core X系列 处 理 器 , 包括Skylake-X与Kabylake-X两种不同架构的处理器,Skylake-X处理器多了12核、14核、16核、18核的产品,并且用Core i9取代Core i7成为Intel消费级市场上最强处理器的代名词。 Intel的Lakefield项目 于2019年正式公开,2020年 正式上市,这款产品的实验性质很重,它是首款采用Intel Foveros 3D堆叠工艺的产品,也是首款采用混合架构的x86 五核处理器。 从此Intel开启混合架构新时代。 24 25 数据来源:Intel官网,西南证券整理 UMA(Unified Memory Architecture):传统的CPU和GPU虽位于同一个SoC芯片上,但由于于内存的不同访问习惯和数据结构,导致它们虽使用相同的内存RAM,但其存取空间仍然是分开的。而UMA基于异构计算,将CPU、GPU、NPU、FPGA等通用、专用处理器集成到一起,协同计算、各司其职,从而提升带宽、延迟和性能表现。 2.4 CPU厂商- Intel的UMA尝试 Intel第六代酷睿处理器(Skylake,2015年)i7-6700K的ring互联架构集成了Intel Gen9核显。CPU核心、LLC(last level cache)、GPU和System Agent之间通过SoC Ring Interconnect相连,而且每个连接对象都有专门的本地接口。所有来自或者去往CPU核心,以及来自或者去往Intel GPU的(片外)系统内存数据交换事务,都经由这条互联ring实施,通过System Agent以及统一DRAM内存控制器。该LLC也与GPU共享。对于CPU核心与GPU而言,LLC着力于降低访问系统DRAM的延迟,提供更高的有效带宽。Intel处理器内部的核显其实是连片内的LLC cache都是可以访问的,和CPU核心算是平起平坐。也就是说,从很多年前开始,Intel就开始尝试UMA架构。 2.4 CPU厂商- 26 数据来源:公司官网,西南证券整理 产品布局: X86:AMD 2022年的旗舰产品将是EPYC Genoa服务器,它基于Zen 4架构,拥有庞大的96核。此外,AMD还计划在2022年底发布基于Zen 4c的128核EPYC Bergamo服务器。AMD在发布7nm产品之后得到许多公有云服务商采用,如Google Cloud Platform、Microsoft Azure与Tencent,占比逐渐在2021年提升,目前渗透率已达一成以上。TrendForce集邦咨询预估,2022年AMD渗透率在全球服务器领域可望达到约15%。 ARM/MIPS/Power/RISC-V:ADM在CPU市场中是坚定的X86追随者。基于庞大的软件基数以及所掌握的工具技术资源,X86可以最快速度、最便捷途径去优化提高。 2022年AMD的旗舰产品将是EPYC Genoa服务器芯片 数据来源:公司官网,西南证券整理 双核 安全集成 2.4 CPU厂商- AM D的双核处理器Athlon 64 X2诞生于2 0 0 5 年 5 月 。 但与Intel的Pentium D不同,AMD的Athlon 64 X2是在同一块芯片内整合了两个K8核心,两个核心之间可透过System Request Queue实现数据互通,因此执行效率远高于竞争对手产品。 三核、四核 2007年K10架构的四核于11月11日发布,它确实是首款原生四核处理器,并且首次把L3缓存引入到消费级市场,但整体效能不如对手的Core 2 Quad。通过改进B3步进的工艺,AMD还推出了首款三核处理器Phenom X3。每个核心独享512KB L2缓存,所有核心共享2MB L3缓存。 八核、12核、16核 32核、64核 2011年的Bulldozer推土机是首款八核处理器。因备受争议,没有进入主流市场。主流平台的八核处理器,是2017年Zen架构的第一代Ryzen7系列处理器,它正式引发了Intel与AMD在处理器市场的核心数量大战。同年,首个12核和16核处理器锐龙Threadripper 1920X和1950X上市。 2018年发布的第二代锐龙Threadripper,最大核心数量已达到32核 。 到了锐龙Threadripper 3000,CPU被拆分成CCD计算核心和IOD输入输出核心,解决了每个核心之间访问内存和PCI-E时延迟不一的问题,于是2020年,64核的锐龙T h r e a d r i p p e r 3990X从此诞生。 27 数据来源:公司官网,西南证券整理 2.4 CPU厂商- AMD的UMA尝试APU的提出 AMD在很早就发现在以游戏为代表的多媒体体验上,比起CPU,更强的GPU才是大势所趋。考虑到Intel有自家的集成显卡技术,AMD另辟蹊径,以GPU作为突破口,在笔记本领域取代Intel成为市场的主流。 随后,AMD又提出APU概念“Accelerated Processing Units”,中文名字叫加速处理器,是AMD基于Fusion融聚理念且已酝酿3年之久的战略级产品。APU最大的特色就是将AMD的CPU、DX11级别的GPU
展开阅读全文