资源描述
2021-2022年 GPU计算机图显核 心分析报告 摘要 目前 GPU应用领域正从图形显示向计算领域拓展,我们看好 GPU在大数据和 AI时代的应用潜力,国产 GPU厂商景嘉微是目前国内唯一商用 GPU公司,国产化背景下我们看好景嘉微 GPU在民用领域发展前景。 1 、 GPU:计算机图形显示核心。 GPU是计算机上做图像和图形相关运算工作的微处理器,采用流式幵行计算模式,适合对密集数据进行幵行 处理,擅长大规模幵发计算。早期 GPU多被用于 2D和 3D图形的计算和处理,近年也常常被用于需要大量重复计算的数据挖掘、 AI训练领域。 GPU可以分为集成 GPU和独立 GPU,被广泛地运用于 PC、服务器、游戏主机、汽车、移劢等领域。 2 、 GPU两大应用场景:图显、计算。 2020年全球 GPU市场规模达到 999.1亿美元,测算 2020年中国大陆 GPU市场规模约 235亿美元。 PC 是 GPU重要应用领域, 2020年全球 PC GPU出货 3.94亿片;服务器是 AI的核心基础设施, GPU服务器是 AI加速方案首选,一台 GPU服务 器通常搭载多个 GPU加速芯片, 2019年平均每台服务器配置 8.02个 GPU。 3 、 NVIDIA:全球 GPU巨头。 Nvidia是目前全球市值最大的半导体公司,技术革新、场景拓展、外延幵购三大因素驱劢 Nvidia持续进阶。 Nvidia产品主要分为两大类:图形处理、计算 提供符合 OpenGL规范 的驱动程序。 资料来源:景嘉微官网, 4 .3 景嘉微: JM7200已在信创市场批量落地 JM7200 目前 JM7200已完成与国内主要的 CPU和操作系统厂商的适配工作,与长城、联想、同方等十余家国内主要计算 机整机厂商建立合作关系并进行产品测试,成功进入商用领域。 JM7201是 JM7200针对民用市场的升级,在保证 性能基础上降低能耗。 2 2 019年 11月,景嘉微全资子公司长沙景美与湖南长城科技信息有限公司签署了战略合作协议,根据协议, 020年湖南长城拟采购 10万套基于 JM7200芯片的国产图形显卡; 2020年 3月,景嘉微全资子公司长沙景美与北 京神州数码有限公司签署采购合作框架协议,神州数码以景嘉微 “ 大陆地区经销商 ” 名义代理公司 GPU及 显卡产品。中国长城是国内信创市场的核心整机厂商,神州数码是国内重要的 IT分销商和信创参与方,合作是 景嘉微 GPU产品在民用信创大批量落地的体现。 图 36:景嘉微 JM7200芯片 图 37:景嘉微高性能显卡产品(搭载 JM7201) 资料来源:景嘉微公告,景嘉微官网, 4 .4 景嘉微:信创驱动 2021年 GPU芯片营收高增 景嘉微芯片营收 2021年上半年景嘉微芯片营收 2.14亿元,同比增长 13.5倍,占总营收比例达到 45.1%。 图 38:景嘉微营收及增速 图 39:景嘉微归母净利润及增速 图 40:景嘉微芯片产品营收 图 41:景嘉微芯片产品营收占比 资料来源: wind,景嘉微公告, 4 .5 景嘉微: JM9系列芯片目标中高端市场 JM9系列芯片 预计 JM9271系列芯片性能达到 GTX1080水平,目标中高端市场。根据公司公告, JM9231和 JM9271将采用业界主 流的统一渲染架构,支持 OpenGL4.5接口,可以无缝兼容市面上主流的 CPU、操作系统和应用程序。 JM9231性能与国际同类公司 2016年中低端产品性能相当,主要针对国产化办公电脑,便携式计算机、中低 端的游戏机和高端嵌入式系统等消费电子领域。 JM9271在 JM9231基础上对科学计算能力进行大幅度提高和改进,可以达到国际同类公司 2017年中高端产品 的性能,主要针对人工智能、安防监控、语音识别、深度学习、云计算等对计算速度要求非常高的高端应用 领域。 图 42:景嘉微拟推出的 JM9系列芯片与 GTX1018性能对比 JM9231 OpenGL 4.5 OpenCL 1.2 1500MHz PCle 3.016 256GB/s JM9271 OpenGL 4.5 OpenCL 2.0 1800MHz PCle 4.016 512GB/s GTX 1080( Nvidia) OpenGL 4.5 DX12 API 核心频率 主机接口 显存带宽 显存容量 渲染能力 浮点性能 /GFLOPS 视频接口 视频解码 功耗 1733MHz PCle 3.016 320GB/s 8GB 16GB 8GB 32Pixels/s 2000 128Pixels/s 8000 111Pixels/s 8900 HDMI 2.0/DP 1.3 H.265/4K 60fps 150W HDMI 2.0/DP 1.3 H.265/4K 60fps 200W HDMI 2.0/DP 1.4 H.265/4K 60fps 180W 党、政、金融以及交通、通信 人工智能、云计算等领域,包 等系统国产化电脑替换 括智能安防、语音识别等 应用领域 资料来源:景嘉微公告, Expreview, 风险提示 1 、市场竞争加剧的风险 当前全球独立 GPU市场由 Nvidia和 AMD垄断,景嘉微是国内唯一商用 GPU公司,未来全球和国内 GPU市场竞争或将加剧; 2 、 GPU市场发展不及预期 GPU应用正从图像显示向计算领域拓展, FPGA、 ASIC芯片也应用于计算领域,未来或将挤占 GPU在计算领域应用; 3 、 Nvidia产品迭代不及预期 Nvidia推动 GPU向数据中心、汽车等新兴场景应用,若产品迭代不及预期,或将影响 Nvidia市场地位和业绩表现; 4 、景嘉微第三代芯片性能不及预期 目前景嘉微 JM9系列芯片正在性能测试过程中,若性能不及预期,将影响景嘉微向民用领域拓展。 附: GPU重要参数解析 CUDA Core和 Tensor Core:为 GPU提供计算能力的硬件单元。 CUDA core也叫 Streaming Processor( SP),是单精度,组成 SM的重要 部分。 Tensor Core已发展到第三代, Tensor Core大幅减少了深度学习需要的时间。 Core的数量越多,并行运算的线程越大,计算的 峰值越高。 像素填充速率:指 GPU一秒钟内能处理多少个像素,单位是 GPixel/S(每秒十亿像素),或 MPixel/S(每秒百万像素)。像素填充速 率是较好衡量 GPU图像显示功能的整体指标,说明了显卡能以多快的速度对图像进行光栅化处理。 纹理填充率:指对多边形图像进行纹理贴图、实现 3D效果的速度,和像素填充率类似,单位是 GTexels/S或 MTexels/S。游戏采用了 多纹理贴图的方式,使画面具有更好的光影效果。 显存容量:其主要功能就是暂时储存 GPU要处理的数据和处理完毕的数据。显存容量大小决定了 GPU能够加载的数据量大小,在深 度学习、机器学习的训练场景,显存的大小决定了一次能够加载训练数据的量,在大规模训练时,显存会显得比较重要。 显存位宽:显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。 显存频率:一定程度上反应着该显存的速度,以 MHz(兆赫兹 )为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和 位宽决定显存带宽。 显存带宽:指显示芯片与显存之间的数据传输速率,它以字节 /秒为单位。显卡的显存是由一块块的显存芯片构成的,显存总位宽 同样也是由显存颗粒的位宽组成,显存带宽显存频率 显存位宽 /8。 制作工艺:制作工艺,指的是晶体管与晶体管之间的距离,单位是纳米。制作工艺越小说明集成度越高,功耗越小,性能越好。 功率:集显依靠 CPU的主板连接提供电源,但独显性能较强,需要单独接电源。 总线接口:显示卡要插在主板上才能与主板互相交换数据,现在主流接口为 PCLe( PCI-Express)。接口提供数据流量带宽,目前主 流采用 PCLe4.0版本, 16个通道。 Directx支持:简称 DX,是一种应用程序接口( API)。 DX由微软编写,由很多的 API组成,包括显示、声音、输入和网络。 DirectX 1 1还支持高质量实时渲染和预渲染场景,目前 DX已发展到 Directx 12版本,提高了多线程效率,可以充分发挥多线程硬件的潜力。 资料来源:华秋元器件官方知乎账号, THANKS
展开阅读全文