资源描述
摘要目前GPU应用领域正从图形显示向计算领域拓展,我们看好GPU在大数据和AI时代的应用潜力,国产GPU厂商景嘉微是目前国内唯一商用GPU公司,国产化背景下我们看好景嘉微GPU在民用领域发展前景。1、GPU:计算机图形显示核心。GPU是计算机上做图像和图形相关运算工作的微处理器,采用流式并行计算模式,适合对密集数据进行并行处理,擅长大规模并发计算。早期GPU多被用于2D和3D图形的计算和处理,近年也常常被用于需要大量重复计算的数据挖掘、AI训练领域。GPU可以分为集成GPU和独立GPU,被广泛地运用于PC、服务器、游戏主机、汽车、移动等领域。2、GPU两大应用场景:图显、计算。2020年全球GPU市场规模达到999.1亿美元,测算2020年中国大陆GPU市场规模约235亿美元。PC是GPU重要应用领域,2020年全球PC GPU出货3.94亿片;服务器是AI的核心基础设施,GPU服务器是AI加速方案首选,一台GPU服务 器通常搭载多个GPU加速芯片,2019年平均每台服务器配置8.02个GPU。3、NVIDIA:全球GPU巨头。Nvidia是目前全球市值最大的半导体公司,技术革新、场景拓展、外延并购三大因素驱动Nvidia持续进阶。Nvidia产品主要分为两大类:图形处理、计算提供符合OpenGL规范的驱动程序。 资料来源:景嘉微官网, 4.3 景嘉微:JM7200已在信创市场批量落地JM7200目前JM7200已完成与国内主要的CPU和操作系统厂商的适配工作,与长城、联想、同方等十余家国内主要计算机整机厂商建立合作关系并进行产品测试,成功进入商用领域。JM7201是JM7200针对民用市场的升级,在保证性能基础上降低能耗。22019年11月,景嘉微全资子公司长沙景美与湖南长城科技信息有限公司签署了战略合作协议,根据协议,020年湖南长城拟采购10万套基于JM7200芯片的国产图形显卡;2020年3月,景嘉微全资子公司长沙景美与北京神州数码有限公司签署采购合作框架协议,神州数码以景嘉微“大陆地区经销商”名义代理公司GPU及显卡产品。中国长城是国内信创市场的核心整机厂商,神州数码是国内重要的IT分销商和信创参与方,合作是景嘉微GPU产品在民用信创大批量落地的体现。 图36:景嘉微JM7200芯片图37:景嘉微高性能显卡产品(搭载JM7201) 资料来源:景嘉微公告,景嘉微官网, 4.4 景嘉微:信创驱动2021年GPU芯片营收高增景嘉微芯片营收2021年上半年景嘉微芯片营收2.14亿元,同比增长13.5倍,占总营收比例达到45.1%。图38:景嘉微营收及增速图39:景嘉微归母净利润及增速 图40:景嘉微芯片产品营收图41:景嘉微芯片产品营收占比 资料来源:wind,景嘉微公告, 4.5 景嘉微:JM9系列芯片目标中高端市场JM9系列芯片预计JM9271系列芯片性能达到GTX1080水平,目标中高端市场。根据公司公告,JM9231和JM9271将采用业界主流的统一渲染架构,支持 OpenGL4.5接口,可以无缝兼容市面上主流的CPU、操作系统和应用程序。 JM9231性能与国际同类公司2016年中低端产品性能相当,主要针对国产化办公电脑,便携式计算机、中低端的游戏机和高端嵌入式系统等消费电子领域。 JM9271在JM9231基础上对科学计算能力进行大幅度提高和改进,可以达到国际同类公司2017年中高端产品的性能,主要针对人工智能、安防监控、语音识别、深度学习、云计算等对计算速度要求非常高的高端应用领域。 图42:景嘉微拟推出的JM9系列芯片与GTX1018性能对比JM9231OpenGL 4.5OpenCL 1.21500MHzPCle 3.016256GB/s JM9271OpenGL 4.5OpenCL 2.01800MHzPCle 4.016512GB/s GTX 1080(Nvidia)OpenGL 4.5DX12API核心频率主机接口显存带宽显存容量渲染能力浮点性能/GFLOPS视频接口 视频解码功耗1733MHzPCle 3.016320GB/s8GB 16GB 8GB32Pixels/s2000 128Pixels/s8000 111Pixels/s8900HDMI 2.0/DP 1.3H.265/4K 60fps150W HDMI 2.0/DP 1.3H.265/4K 60fps200W HDMI 2.0/DP 1.4H.265/4K 60fps180W党、政、金融以及交通、通信 人工智能、云计算等领域,包等系统国产化电脑替换 括智能安防、语音识别等应用领域资料来源:景嘉微公告,Expreview, 风险提示1、市场竞争加剧的风险当前全球独立GPU市场由Nvidia和AMD垄断,景嘉微是国内唯一商用GPU公司,未来全球和国内GPU市场竞争或将加剧;2、GPU市场发展不及预期GPU应用正从图像显示向计算领域拓展,FPGA、ASIC芯片也应用于计算领域,未来或将挤占GPU在计算领域应用;3、Nvidia产品迭代不及预期Nvidia推动GPU向数据中心、汽车等新兴场景应用,若产品迭代不及预期,或将影响Nvidia市场地位和业绩表现; 4、景嘉微第三代芯片性能不及预期目前景嘉微JM9系列芯片正在性能测试过程中,若性能不及预期,将影响景嘉微向民用领域拓展。 附:GPU重要参数解析 CUDA Core和Tensor Core:为GPU提供计算能力的硬件单元。CUDA core也叫Streaming Processor(SP),是单精度,组成SM的重要部分。Tensor Core已发展到第三代,Tensor Core大幅减少了深度学习需要的时间。Core的数量越多,并行运算的线程越大,计算的峰值越高。像素填充速率:指GPU一秒钟内能处理多少个像素,单位是GPixel/S(每秒十亿像素),或MPixel/S(每秒百万像素)。像素填充速率是较好衡量GPU图像显示功能的整体指标,说明了显卡能以多快的速度对图像进行光栅化处理。纹理填充率:指对多边形图像进行纹理贴图、实现3D效果的速度,和像素填充率类似,单位是GTexels/S或MTexels/S。游戏采用了多纹理贴图的方式,使画面具有更好的光影效果。显存容量:其主要功能就是暂时储存GPU要处理的数据和处理完毕的数据。显存容量大小决定了GPU能够加载的数据量大小,在深度学习、机器学习的训练场景,显存的大小决定了一次能够加载训练数据的量,在大规模训练时,显存会显得比较重要。 显存位宽:显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。显存频率:一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和位宽决定显存带宽。显存带宽:指显示芯片与显存之间的数据传输速率,它以字节/秒为单位。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,显存带宽显存频率显存位宽/8。制作工艺:制作工艺,指的是晶体管与晶体管之间的距离,单位是纳米。制作工艺越小说明集成度越高,功耗越小,性能越好。功率:集显依靠CPU的主板连接提供电源,但独显性能较强,需要单独接电源。总线接口:显示卡要插在主板上才能与主板互相交换数据,现在主流接口为PCLe(PCI-Express)。接口提供数据流量带宽,目前主流采用PCLe4.0版本,16个通道。 Directx支持:简称DX,是一种应用程序接口(API)。DX由微软编写,由很多的API组成,包括显示、声音、输入和网络。DirectX11还支持高质量实时渲染和预渲染场景,目前DX已发展到Directx 12版本,提高了多线程效率,可以充分发挥多线程硬件的潜力。 资料来源:华秋元器件官方知乎账号, THANKS
展开阅读全文