自动驾驶系列报告三:车载芯片篇-自动驾驶芯片:GPU的现在和ASIC的未来.pdf

返回 相关 举报
自动驾驶系列报告三:车载芯片篇-自动驾驶芯片:GPU的现在和ASIC的未来.pdf_第1页
第1页 / 共26页
自动驾驶系列报告三:车载芯片篇-自动驾驶芯片:GPU的现在和ASIC的未来.pdf_第2页
第2页 / 共26页
自动驾驶系列报告三:车载芯片篇-自动驾驶芯片:GPU的现在和ASIC的未来.pdf_第3页
第3页 / 共26页
自动驾驶系列报告三:车载芯片篇-自动驾驶芯片:GPU的现在和ASIC的未来.pdf_第4页
第4页 / 共26页
自动驾驶系列报告三:车载芯片篇-自动驾驶芯片:GPU的现在和ASIC的未来.pdf_第5页
第5页 / 共26页
点击查看更多>>
资源描述
- 1 - 敬请参阅最后一页特别声明 市场数据 (人民币) 市场优化平均市盈率 18.90 国金汽车和汽车零部件指数 3115.91 沪深 300 指数 3525.75 上证指数 2859.54 深证成指 9314.30 中小板综指 9490.27 相关报告 1. 自动驾驶的时代已经开始到来 自动驾驶系列报告之一:综合篇, 2018.5.18 2. CES Asia:智能驾驶为最大亮点 -CES汽车行业点评, 2018.6.15 3. 自动 动驾驶系统:量产导向还是性能导向 自动驾驶系列报告之二: 决策层篇 , 2018.6.27 张帅 分析师 SAC 执业编号: S1130511030009 (8621)61038279 zhangshuai gjzq 何凯易 联系人 hekaiyi gjzq 自动驾驶芯片: GPU 的现在和 ASIC 的未来 自动驾驶系列报告三:车载芯片篇 行业观点 自动驾驶系列报告第三篇,我们将 按时间顺序梳理车载芯片的发展历程,探讨未来发展方向。 汽车电子 发展初期 以分布式 ECU 架构为主流, 芯片与传感器一一对应 , 随着汽车 电子 化 程度提升 ,传感器 增多 、线路复杂度增大, 中心化架构 DCU、 MDC 逐步 成为了 发展趋势 ; 随着汽车 辅助驾驶功能渗透率越来越高, 传统 CPU 算力不足 , 难以满足处理视频、图片等非结构化数据的需求, 而 GPU 同时处理大量简单计算任务 的特性在自动驾驶领域取代 CPU 成为了主流方案 ; 从 ADAS 向 自动驾驶 进化的过程中, 激光雷达点云数据以及 大量传感器加入到系统中 , 需要接受、分析、处理的信号大量且复杂, 定制化的ASIC 芯片可在相对低水平的能耗下,将 车载信息的数据处理速度提升更快 , 并且 性能、能耗和大规模量产成本均显著优于 GPU 和 FPGA,随着自动驾驶的定制化需求提升, ASIC 专用芯片将成为主流 。 目前出货量最大的驾驶辅助芯片厂商 Mobileye、 Nvidia 形成“双雄争霸”局面 , Xilinx 则在 FPGA 的路线上进军, Google、 地平 线 、寒武纪 在向专用领域 AI 芯片发力, 国内四维图新 、 全志科技 等 也在自动驾驶芯片领域积极布局 。 Mobileye 的 核心优势 是 EyeQ 系列芯片 ,可以处理摄像头、雷达等多种传感器融合产生的大量数据 , 在 L1-L3 自动 驾驶领域具有极大的话语权 ,目前出货量超过了 2700 万颗; NVIDIA 在 GPU 领域具有绝对的领导地位 , 芯片算力强大且具备很强的灵活性 , 但功耗高 、成本高, AI 机器学习并不太适合 GPU的应用; 此外 Google、地平线、寒武纪、 四维图新等 更聚焦在针对不同场景下的具体应用 , 芯片设计也开始增加硬件的深度学习设计,自动驾驶上 AI的应用已经成为 未来的 趋势 。 基于产业前景和潜在的巨大市场,给予行业买入评级, 上市公司方面看好 四维图新 ,建议关注地平线、寒武纪。 公司名称 代码 收盘价 (元 /美元 ) EPS (元 /美元 ) PE 业务 2017 2018E 2019E 2017 2018E 2019E 四维图新 002405.SZ 20.00 0.21 0.29 0.37 128 68 54 芯片 /高精地 图 全志科技 300458.SZ 23.90 0.05 0.46 0.70 546 52 34 芯片 NVIDIA NVDA.O 250.89 4.82 6.03 7.72 48 42 32 芯片 XILINX XLNX.O 68.17 2.89 2.90 3.19 25 24 21 芯片 来源: Wind/Thomson一致预测 风险提示 自动驾驶行业发展不及预期 ; 装车渗透不及预期 ; 产品开发 、成本下降 不及预期 ;使用场景限制; 法律法规限制自动驾驶发展 ;事故影响。 3008335436994045439147375083170724171024180124180424国金行业 沪深 300 2018年 07月 23 日 新能源汽车研究中心 自动驾驶行业系列报告之三 买入 ( 维持评级 ) ) 行业深度研究 证券研究报告 行业深度研究 - 2 - 敬请参阅最后一页特别声明 内容目录 一、车载芯片的发展趋势( CPU-GPU-FPGA-ASIC) .4 二、车载芯片的过去 以 CPU为核心的 ECU.5 2.1 ECU的核心 CPU .5 2.2 分布式架构向多域控制器发 展 .5 三、车载芯片的现在 以 GPU为核心的智能辅助驾驶芯片 .7 3.1 GPU Vs. CPU .7 3.2 GPU占据现阶段自动驾驶芯片主导地位 .7 3.3 相关 公司 .8 四、车载芯片的未来 以 ASIC 为核心的自动驾驶芯片 .14 4.1 ASIC vs GPU+FPGA.14 4.2 ASIC 是未来自动驾驶芯片的核心和趋势 .15 4.3 相关公司 .16 五、风险提示 .24 图表目录 图表 1:算法芯片发展路径 .4 图表 2:汽车 ECU .5 图表 3:汽车 ECU架构示例 .6 图表 4:汽车 DCU与 ECU架构示例 .6 图表 5:汽车 MDC 架构示例 .6 图表 6: CPU结构 .7 图表 7: GPU结构 .7 图表 8: CPU vs GPU.7 图表 9: NVIDIA GPU 阵营 .8 图表 10: NVIDIA 发展历程 .9 图表 11: NVIDIA DRIVE Pegasus AI 计算平台 .9 图表 12: NVIDIA DRIVE PX 2 平台 .9 图表 13: NVIDIA DRIVE Pegasus AI 计算平台 .10 图表 14: NVIDIA DRIVE 系列 AI计算平台性能参数 . 11 图表 15:杰发科技车规级 ADAS 芯片 .12 图表 16:全志科技车规级芯片 .13 图表 17:全志科技车规级芯片结构 .13 图表 18:汽车电子芯片生命周期 .13 图表 19: FPGA 结构 .14 图表 20: FPGA vs ASIC .14 图表 21: CPU、 GPU、 FPGA 和 ASIC 对比 .15 图表 22:自动驾驶芯片主要产品性能 .15 行业深度研究 - 3 - 敬请参阅最后一页特别声明 图表 23: ASIC 是未来自动驾驶 AI芯片解决方案的原因 .15 图表 24: Mobileye 发展历程 .16 图表 25: Mobileye EyeQ 系列性能参数 .16 图表 26: Mobileye EyeQ4 架构 .17 图表 27:寒 武纪发展历史 .17 图表 28:芯片设计 -量产面临的风险 .18 图表 29:寒武纪 MLU100 参数 .18 图表 30:地平线解决方案 .19 图表 31:芯片设计 -量产面临的风 险 .19 图表 32:地平线芯片参数 .19 图表 33:地平线核心竞争力 .19 图表 34:对 “昆仑 ”芯片的疑义 .20 图表 35:三代谷歌 TPU参数 .20 图表 36: Google TPU 2 代 vs 3 代 .21 图表 37:赛灵思 Zynq 芯片 .21 图表 38:赛灵思多传感器融合系统 .22 图表 39:亚里士多德架构 .22 图表 40:笛卡尔架构 .22 图表 41: DPhiAuto 性能 .23 图表 42: DPhiAuto 样品 .23 行业深度研究 - 4 - 敬请参阅最后一页特别声明 一、车载芯片的发展趋势( CPU-GPU-FPGA-ASIC) 过去汽车电子芯片以与传感器一一对应的电子控制单元( ECU)为主,主要分布与发动机等核心部件上。随着汽车智能化的发展,汽车传感器越来越多,传统的分布式架构逐渐落后,由中心化架构 DCU、 MDC 逐步替代。 随着人工智能发展,汽车智能化形成趋势,目前辅助驾驶功能渗透率越来越高,这些功能的实现需借助于摄像头、雷达等新增的传感器数据,其中视频(多帧图像)的处理需要大量并行计算, 传统 CPU 算力不足 , 这方面性能强大的 GPU 替代了 CPU。再加上辅助驾驶算法需要的训 练过程, GPU+FPGA 成为目前主流的解决方案。 着眼未来,自动驾驶也将逐步完善,届时又会加入激光雷达的点云(三维位置数据)数据以及更多的摄像头和雷达传感器, GPU 也难以胜任,ASIC 性能、能耗和大规模量产成本均显著优于 GPU 和 FPGA,定制化的ASIC 芯片可在相对低水平的能耗下,将 车载信息的数据处理速度提升更快 ,随着自动驾驶的定制化需求提升, ASIC 专用芯片将成为主流。 本文以如上顺序梳理车载芯片发展历程,探讨未来发展方向。 图表 1:算法芯片发展路径 来源:地平线机器人,国金证券研究所 行业深度研究 - 5 - 敬请参阅最后一页特别声明 二、车载芯片的过去 以 CPU 为核心的 ECU 2.1 ECU 的核心 CPU ECU( Electronic Control Unit)是电子控制单元 ,也称“行车电脑” ,是汽车专用微机控制器。一般 ECU 由 CPU、存储器( ROM、 RAM)、输入 /输出接口( I/O)、模数转换器( A/D)以及整形、驱动等大规模集成电路组成。 图表 2:汽车 ECU 来源: 大众汽车 ,国金证券研究所 ECU 的工作过程就是 CPU 接收到各个传感器的信号后转化为数据,并由Program 区域 的程序对 Data 区域 的数据图表调用来进行数据处理,从而得出具体驱动数据,并通过 CPU针脚传送到相关驱动芯片,驱动芯片再通过相应的周边电路产生驱动信号,用来驱动驱动器。即传感器信号 传感器数据 驱动数据 驱动信号这样一个完整工作流程。 2.2 分布式架构向多域控制器发展 汽车电子发展的初期阶段, ECU 主要 是用于控制发动机工作, 只有汽车发动 机的排气管(氧传感器)、气缸(爆震传感器)、水温传感器等核心部件才会放置传感器 ,由于传感器数量较少,为保证传感器 -ECU-控制器回路的稳定性 , ECU 与传感器一一对应的分布式架构是汽车电子的典型模式 。 后来随着车辆的电子化 程度逐渐提高 , ECU 占领了整个汽车,从防抱死制动系统、 4 轮驱动系统、电控自动变速器、主动悬架系统、安全气囊系统,到现在逐渐延伸到了车身各类安全、网络、娱乐、传感控制系统等。 行业深度研究 - 6 - 敬请参阅最后一页特别声明 图表 3:汽车 ECU架构示例 来源:公开资料,国金证券研究所 随着汽车电子化的发展,车载传感器数量越来越多,传感器与 ECU 一一对应使得车辆整体性下降,线路复杂性也急剧增加,此时 DCU(域控制器)和 MDC(多域控制器)等更强大的中心化架构逐步替代了分布式架构 。 域控制器( Domain Control Unit)的概念最早是由以博世,大陆,德尔福为首的 Tier1 提出,是为了解决信息安全,以及 ECU 瓶颈的问题。根据汽车电子部件功能将整车划分为动力总成,车辆安全,车身电子,智能座舱和智能驾驶等几个域,利用处理能力更强的多核 CPU/GPU芯片相 对集中的去控制每个域,以取代目前分布式汽车电子电气架构。 而进入自动驾驶时代, 控制器需要接受、分析、处理的信号大量且复杂,原有的一个功能对应一个 ECU 的分布式计算架构 或者单一分模块的域控制器 已经无法适应需求 , 比如摄像头、毫米波雷达、激光雷达乃至 GPS 和轮速传感器的数据都要在一个计算中心内进行处理以保证输出结果的对整车自动驾驶最优。 因此, 自动驾驶车辆的各种数据聚集、融合处理,从而为自动驾驶的路径规划和驾驶决策提供支持 的多域控制器将会是发展的趋势, 奥迪与德尔福共同开发的 zFAS,即是通过一块 ECU,能够接入不同传感器的信号并进行对信号进行分析和处理,最终发出控制命令。 图表 4:汽车 DCU与 ECU架构示例 图表 5: 汽车 MDC 架构示例 来源:德尔福,国金证券研究所 来源:德尔福,国金证券研究所 行业深度研究 - 7 - 敬请参阅最后一页特别声明 三、车载芯片的现在 以 GPU 为核心的智能辅助驾驶芯片 人工智能的发展也带动了汽车智能化发展,过去的以 CPU 为核心的处理器越来越难以满足处理视频、图片等非结构化数据的需求,同时处理器也需要整合雷达、视频等多路数据,这些都对车载处理器的并行计算效率提出更高要求 ,而 GPU 同时处理大量简单计算任务 的特性在自动驾驶领域取代CPU成为了主流方案。 3.1 GPU Vs. CPU CPU 的核心数量只有几个(不超过两位数),每个核都有足够大的缓存和足够多的数字和逻辑运算单元,并辅助很多复杂的计算分支。而 GPU 的运算核心数量则可以多达上百个(流处理器),每个核拥有的缓存大小相对小,数字逻辑运算单元也少而简单。 CPU和 GPU 最大的区别是设计结构及不同结构形成的不同功能。 CPU的逻辑控制功能强,可以进行复杂的逻辑运算,并且延时低,可以高效处理复杂的运算任务。而 GPU逻辑控制和缓存较少,使得每单个运算单元执行的逻辑运算复杂程度有限,但并列大量的计算单元,可以同时进行大量较简单的运算任务。 图表 6: CPU结构 图表 7: GPU结构 来源: Nvidia,国金证券研究所 来源: Nvidia,国金证券研究所 图表 8: CPU vs GPU 特征 CPU GPU ALU (计算运算单元) 强大的 ALU, 64bit 双精度。执行双精度浮点运算的加法和乘法只需 1-3 个时钟周期(约 1-3 纳秒) GPU 的设计出发点在于 GPU 更适用于计算强度高、多并行的计算,因此拥有大量并行 ALU,并且把更多晶体管用于计算单元,因此 GPU 不适用于繁琐的流程控制和需要大量缓存容量的低延时计算 缓存 保存大量数据在缓存中,需要访问时直接读取,延时低 缓存存在于各线程中并且容量较小,目的是为了提高线程性能,而非降低延时。若有多线程需要访问同一数据,缓存会合并这些访问,再去访问内存( DRAM),会形成延时 逻辑控制单元 拥有复杂的逻辑控制单元,若程序含有多个分支,通过提供分支预测来降低延时 简单逻辑控制单元,没有分支预测和数据预备功能 总结 CPU 兼顾计算和控制, 70%晶体管用来构建缓存,还有一部分控制单元,用来处理复杂逻辑和提高指令的执行效率。计算通用性强,可以处理高复杂 度的计算,延时低,但计算性能一般 GPU 包含大量 ALU,以并行方式设计,擅长大规模并发计算。逻辑控制单元简单,缓存较小,读取数据延时较高。适用于破解密码、挖矿及图形计算等场景 来源:国金证券研究所 3.2 GPU 占据现阶段自动驾驶芯片主导地位 相比于消费电子产品的芯片,车载的智能驾驶芯片对性能和寿命要求都比较高,主要体现在以下几方面: 1、耗电每瓦提供的性能; 行业深度研究 - 8 - 敬请参阅最后一页特别声明 2、生态系统的构建,如用户群、易用性等; 3、满足车规级寿命要求,至少 1 万小时稳定使用。 目前无论是尚未商业化生产的自动驾驶 AI 芯片还是已经可以量产使用的辅助驾驶芯片,由于自动驾驶算法还在快速 更新 迭代, 对云端“训练”部分提出很高要求,既需要大规模的并行计算,又需要大数据的多线程计算,因此 以 GPU+FPGA 解决方案为核心 ; 在终端的“推理”部分, 核心需求是大量并行计算, 从而以 GPU为核心 。 图表 9: NVIDIA GPU阵营 来源: EETimes,国金证券研究所 3.3 相关公司 3.3.1 NVIDIA NVIDIA 在自动驾驶领域的成就正是得益于他们在 GPU 领域内的深耕 ,NVIDIA GPU 专为并行计算而设计,适合深度学习任务,并且能够处理在深度学习中普遍存在的向量和矩阵操作。相对于 Mobileye 专注于视觉处理,NVIDIA 的方案重点在于融合不同传感器。 行业深度研究 - 9 - 敬请参阅最后一页特别声明 图表 10: NVIDIA 发展历程 时间 事件 2009 年 Google Brain 使用 NVIDIA GPU 创建了能够进行机器学习的深度神经网络,其中 Andrew Ng 确定 GPU 可以将深度学习系统的速度提高约 100 倍 2016 年 4-11月 制作了基于 8 GPU 集群的 DGX-1 超级计算机;还开发了基于 NVIDIA(英伟达 ) Tesla K80 和 P100 GPU 的虚拟机。微软在基于 NVIDIA Tesla K80 的 N 系列预览产品中增加了 GPU 服务器,每款产品包含 4992 个处理核心。AWS 的 P2 实例使用多达 16 个 NVIDIA Tesla K80 GPU 生成 2016 年 5 月 推出了首款基于该公司全新 Pascal 微架构的 GeForce 10 系列 GPU, GTX 1080 和 1070,并称这两款产品都优于基于麦克斯韦的 Titan X模型 2017 年 5 月 宣布与丰田汽车公司( Toyota Motor Corp.)建立合作伙伴关系。丰田将为其自动驾驶汽车使用 NVIDIA Drive PX 系列人工智能平台 2017 年 7 月 和中国搜索巨头百度宣布了一项广泛的 AI 合作伙伴关系,其中包括云计算,自动驾驶,消费设备和百度的开源 AI框架 Paddle Paddle。百度推出 NVIDIA的 Drive PX 2 AI 将成为其自动驾驶平台的基础 2018 年 1 月 创始人兼 CEO 黄仁勋在 2018CES 上介绍, Drive Xavier 在过去四年中的研发投入高达 20 亿美元,可提供每秒 30万亿次的计算能力,功耗为 30 瓦,能效比上一代架构高出 15 倍。配备了两个 Xavier 系统级芯片和两个下一代NVIDIA GPU 的 Pegasus 是全球首款致力于推进 L5 级全自动驾驶出租车的 AI 车载超级计算机,它的外形只有车牌大小,可以实现每秒 320 万亿次深度学习计算,能够同时运行多个深度学习网络,功耗为 500w 来源: NVIDIA,国金证券研究所 图表 11: NVIDIA DRIVE Pegasus AI 计算平台 来源: NVIDIA,国金证券研究所 2016 年,英伟达在 Drive PX 2 平台上推出了三款产品,分别是配备单GPU 和单摄像头及雷达输入端口的 Drive PX2 Autocruise(自动巡航)芯片(下图左上)、配备双 GPU 及多个摄像头及雷达输入端口的 Drive PX2 AutoChauffeur(自动私人司机)芯片(右上)、配备多个 GPU 及多个摄像头及雷达输入端口的 Drive PX2 Fully Autonomous Driving(全自动驾驶)芯片(下方)。 图表 12: NVIDIA DRIVE PX 2 平台 行业深度研究 - 10 - 敬请参阅最后一页特别声明 来源: NVIDIA,国金证券研究所 以目前的销售情况, Drive PX 2 搭载上一代 Pascal 架构 GPU 已经实现量产,并且已经搭载在 Tesla 的量产车型 Model S 以及 Model X 上。目前 PX 2 仍然是 NVIDIA 自动驾驶平台出货的主力, Tesla, Audi 和 ZF 等对外公布 Drive PX 2 应用在量产车上。 Xavier 是 Drive PX 2 的进化版本,搭配了最新一代的 Volta 架构 GPU, 相较于 Drive PX 2 性能将提升近一倍, 2017 年年底量产。由于多家主机厂L3 级别以上自动驾驶量产车的计划在 2020 年左右,而 Xavier 的量产计划将能和自动驾驶车的研发周期相互配合(一般 3 年左右),因此 Xavier 的合作都是有量产车落地计划的。 而对于较早与 NVIDIA 达成合作的车厂来说,他 们在小批量测试、量产的优先级别以及可定制化空间等方面都能获得一定的优势。 图表 13: NVIDIA DRIVE Pegasus AI 计算平台 来源: NVIDIA,国金证券研究所
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642