20240418_太平洋证券_汽车行业:特斯拉的FSD时刻_34页.pdf

返回 相关 举报
20240418_太平洋证券_汽车行业:特斯拉的FSD时刻_34页.pdf_第1页
第1页 / 共34页
20240418_太平洋证券_汽车行业:特斯拉的FSD时刻_34页.pdf_第2页
第2页 / 共34页
20240418_太平洋证券_汽车行业:特斯拉的FSD时刻_34页.pdf_第3页
第3页 / 共34页
20240418_太平洋证券_汽车行业:特斯拉的FSD时刻_34页.pdf_第4页
第4页 / 共34页
20240418_太平洋证券_汽车行业:特斯拉的FSD时刻_34页.pdf_第5页
第5页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
证 券 研究报告 行业深度 报告特斯拉的FSD 时刻太平洋证券研究院|首席分析师刘虹辰执业资格证书编号:S11905240100022024年4 月18日 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告特斯拉的FSD时刻2特 斯拉的FSD 时刻。V12.3端对 端NN重塑FSD。FSD 用户 的累计行 驶里程 从V11 扩 大推送 后加速提 升,V12推送后 开始指 数级提升,到今年4 月已 超10亿英里,特斯拉FSD迎来奇点时刻。FSD V12.3 的推送实现端到端NN,HW4.0 大幅提升算力,不再进 行识别 和标记,摆脱人 为规控规 则编码,大幅提 高自动 驾驶感知 决策能 力。AI 赋能,加速Robotaxi。马斯克称Robotaxi将于今年8 月8日 落地,近期 特斯 拉启动 了全 球范 围内的 人员 调整,自动 驾驶 预计将获得资源倾斜,大模型加持提 升城市NOA感知能力、泛化能力,加速无图城市NOA落地,AI 赋能,加速Robotaxi,特斯拉自动驾驶今年累计投资预计超100 亿美元。数据鸿 沟和算力要求,构成超算的核心 壁垒。任何模型 的训练都依赖于 数量巨大、质 量可控 的训练数 据,而 特斯拉FSD自推出以来累 计运行超过了10亿英 里,为 特斯拉 训练模型 提供了 充足的数 据。同时,大模型训数据需 要 强大 的 算力,特 斯拉领 先的超 算中心,Robotaxi 落地 路径持 续催化 值得期 待。无图城市NOA 重 新定义智能汽车。特斯拉FSD引领“Transformer+BEV”、“Occupancy、Lane算法”、“自动标注”、“超算 中心 建设”,实 现路 径收敛。华为ADS 2.0 OTA 新 增 不依赖 高精 地图 的城区 智驾 领航 辅助,问界 全系 车型实 现了 全 国都能开、有路 就能 开的City NCA。支持 城市 道路(主 干路/次干路/支路 等)、国道、县道、乡 道等 公开道 路,可 用路 段高达99%,用 户体验 提升带来 渗透率 拐点快速 提高。投 资建议:智能汽 车三条 投资主线:域控制 器:德赛西 威,华阳 集团,科博达。线 控底盘:伯 特利,保隆科技。智能整 车:赛 力斯,理 想汽车,小鹏汽 车。风 险提示:智 能汽 车渗透 率提升不 及预期,国产替 代不及 预期,技 术路线 变更风险。1ZFUvMtOpMpOrPnOsPtMrQ9PbPbRsQnNtRtPeRqQmQfQpOwP8OpOtNxNrNpPuOnOqM请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资料来源:太平 洋证券核心逻辑3大 模 型 加持提升城市NOA 感 知 能 力、泛化能力,加速无图城市NOA 落地华为无图城区NCA 全面OTA,特斯拉FSD 北美,用户体验提升带来渗透率拐点快速提高。覆盖生活场景从高速NOA 的10%到城市NOA 的99%。特斯拉8 月8 日Robotaxi。法规:L3智驾政策。接下来一段时间的催化预期?投资建议 域控制器:德赛西威、科博达、华阳集团。线控底盘:拓普集团,伯特利、保隆科技。整车:赛力斯,理想汽车,小鹏汽车特斯拉引领技术路径收敛2D+CNNTransformer+BEV优化感知效果摆脱高精地图LANEOccupancy人工标注 自动标注大模型效率提升几千甚至近万倍国内车企自建/合建超算中心特斯拉自建DOJO 超算7 月投产支持云端大模型训练大模型催 化FSD 时刻端到端算法有望提升规控准确性生成式AI 提供高质量训练数据大模型蒸馏训练小模型减少计算资源消耗多模态模型有望优化感知 BOM成本下降华为ADS1.0 到2.0 显著变化为从3 颗激光雷达减配至1 颗,纯视觉与激光雷达路线之争逐渐走向“折中”方案。高阶辅助驾驶BOM 成本持续下降。CONTENTS目 录目 录特斯拉的FSD 时刻AI赋能,加 速Robotaxi无图城市NOA重新定义智 能汽车投资建议风险提示0102030405/iWMjxCyPcKk+JDjvYxIR8iCYydMK33bsDsO0TSEcfb3rX9QRVWkV9gAw6HWSY1H 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告 2024 年3 月,特斯 拉先后 推出FSD(Beta)12.3.2、12.3.2.1以及最 新的FSD(Supervised)12.3.3 版本。相 比较于FSD 11,FSD v12创新性 地 采用了 端对端 的神经 网络技 术(端 对端NN),可 以更好 地理解 和处理复杂 驾驶环 境,减少驾 驶人员 的 干预,提 高自动 驾 驶的精确 度和自动化度。FSD v12 中 采用端到端NN(以前是AI 感知+软件规控),大 模型仅 需输 入 视频进 行学习,而无 需单独 编码,更灵活 更轻代 码。感知-决策-执行是FSD的基本流 程,在v11 中,感 知阶段 需要通 过视觉 方式/雷达 方式获取周 围物体 信 息并识别 和标识 分 类,决策 阶段则 依 赖于事先 认为编 写 好的控 制规则。但是v12 采用了端对 端NN技术,感 知阶段 不再需要识别和 标识,决 策阶段也 不需要 事 先人为编 写控制 规 则,只需 要输入 大 量视频 交给NN学习,就能分 辨出在 不同情 况下需 要做什 么,这使得 特 斯拉在FSD V12 中 减少了100倍代码,使其更 轻便、更灵活,同时在没有 网络连 接 的情况下 仍能在 不 熟悉的地 形上工 作。V12 同 时兼容HW3.0 和4.0,感知 力和算 力大幅 提升。v12 在北美的已经 适 配装备HW4.0 的model S、3、X和Y,在中 国地区 目前只 有Model Y 可以升级 到HW4.0。从3.30 号推 送以来,截至4.9 号,v12.3.3 累计安装量达5780。目前,v12 同时适配HW3.0 和4.0。相比HW3.0,HW4.0 在算 力、摄像 头数量 和清晰 度等方 面具有 大幅度 的提升。摄像 头为8 个,算力提 升5 倍,素 有摄像 头像素 由120万提升至500 万。资 料 来源:TeslaFi,太 平 洋证券 5特斯拉FSD:V12.3端对端NN重塑FSD图 截至4.9 号,HW3.0 摄像头清晰 度(左)vsHW4.0 摄像头清晰度(右)请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:特斯拉AI DAY,Not a tesla app,马 斯 克推特,Tesla_AI 推特,太 平洋证 券特斯拉FSD:累计里程指数级增长超10亿英里,剑指百亿公里6时间 版本进展 版本重大变化22年12月FSD Beta测试版向北美40万人推送截至2022年12月,特斯拉已经向美国和加拿大的几乎所有买了FSD(约40万)的客户发布了 FSD Beta 测试版,FSD Beta 测试版新增了大量新功能,并可以让特斯拉在城市环境中自动导航。根据马斯克推特,FSD 可用于北美90%道路,计划未来在欧洲推送FSD BETA。23年2 月FSD11.3版本合并城市驾驶与高速公路驾驶堆栈,提升辅助驾驶能力。FSD11.3 版本于2023年2 月向用户推送,单堆栈融合了城市和高速堆栈,单堆栈将使特斯拉能够将其在城市驾驶中的学习内容应用到其自动驾驶高速公路导航功能中。23年3 月FSD11.3.3 版本Vision Park Assist 使用占用网络代替超声波雷达。自22年10 月起,特斯拉逐步移 除超声波雷达,此次推送的新功能,代表着特斯拉用视觉占用网络算法替代被移除的超声波雷达,在摄像头的盲区通过记忆数据复现障碍物对车的距离。23年5月FSD11.4版本通过将自动标记车队数据集进一步增加 80k 个剪辑、提高自动标记算法的准确性以及调整训练监督的分布来实现以下优化:将部分切入的召回率提高了 39%,将由于变道到相邻车道而导致的假阳性切入的准确率提高了 66%,从而使整体变道预测错误减少了 33%。24年3月FSD12.3版本FSD v12.3采用端到端NN技术,不再进行识别和标记,摆脱人为规控规则编码,并实现了Autopark 不依赖USS(超声波传感器)(最早在3.21发布的v11.4.9 的更新中实现)图:3 月推送FSD v12.3 实 现端 到端NN,大幅 提高自 动驾驶 感知和 决策能力图:截 至2024 年4 月6 日,FSD 用 户的累计行 驶里程 已超10 亿英里,23年8 月 后加 速上行(系v11 扩大推送规 模)请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告 新版的Autopark 基于与FSD v12 相同的NN 技术,不再依赖USS:自2022 年特斯拉放弃USS 而改用摄像头以来,未装备USS 的新特斯拉的Autopark 和Summon 功能给用户带来的体验感远不如装备USS 的车辆。在今年3 月21 号推出的FSD v11.4.9 的更新中,特斯来推出了新版的Autopark,并 在之后 的v12.3 版 本 中沿用。在技 术层面,与旧版不 同,新版的Autopark 使用了 与FSD v12 相同的NN 技术,底层 技术优 于旧版,相比旧版有较 大的提 升,大幅度 提升了 泊 车系统的 视觉效 果 和自动泊 车能力。显著改进视 觉效果 和自动泊车 功能,“Tap to Park”一键泊车降 低人为 干预需要。之前 版本 的Autopark 具有 两大主要缺 陷:1)很难检测停 车位并 将其显示 在屏幕上,而且一 次只能显 示一个停 车位。2)停车速度 通常非常 慢,如果 周围有其 他车辆,几乎很难 完成自动 泊车。而 新的Autopark基于NN 技术,显著改善了这两个问题,停车速度更快,不仅可以在显示屏 上勾勒出停车位,还可以同时显示各 种停车位-包括平 行空间。此外,这次 升级,特 斯拉真 正实 现了一 键泊车(Tap to Park),当驾 驶员选 择好停 车位 后,点击“开始 按钮”,特斯拉 的车辆 能够 安全地 倒车进 入停 车位,驾驶 人员只 需 要保持关 注并随 时 准备在必 要时取 消 自动停车 操作即 可,大幅度 降低了 人 为干预需 要、提 升 用户体验。资 料 来源:not a tesla app,太平洋 证 券新版Autopark不依赖USS,“Tap to Park”大幅提升用户体验感7图 新版Autopark 不 再需要 驾驶员 操作方 向盘。自动泊 车功能显著改进图 新版Autopark 视 觉体验 感显著 强于旧 版Autopark 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:not a tasla app,公 开 资料整理,太 平 洋证券HW4.0芯片算力大幅提升8 芯 片 改用更 先进制 程:HW4.0 FSD芯 片 采用三星7nm 工艺,HW3.0 为 三星14nm 工艺,新的自 动驾驶 芯片性 能将是 现款自 动驾驶 芯片的5 倍左 右,这里 的性能 或为综 合能耗/算力参数,或为 单片算 力(那么 新平 台总算 力很可 能达到500TOPS)。摄像头或 升级:摄 像头数量 或从9 个减 少到8 个,但是 摄像 头的清晰 度从120万 像素提升 到500像素,这使得HW4.0 具有比3.0更强的 感知 能力,最 远 探测距 离可达424 米,扫除盲 区和死 角。预 留 雷达接 口,但model Y 目 前 未 配备雷 达:HW 4.0 预 留了 装备雷 达的空 间,但 是model Y在 出 厂时并不具 备雷达 功能,这可能 与特斯 拉更加偏好视 觉方案、降低车辆 出厂成 本 等因素有 关,同 时 也为用户 提供了 一 定的选择 空间。CPU内核数量 提 升66.67%,FSD Computer 2 数 量增加到3 个。CPU方面,HW4.0 由3.0 的12 核,提升 到了20核,内核 数量提 升66.67%。计算 平 台方面,虽然HW4.0 仍然采用 的是FSD Computer 2,但 是数 量却增 加到了3 个。目 前,海外HW4.0 已经支持model 3、X、Y 和S。国内,特斯 拉为了 应对竞 争压力,开放 了model Y的 升 级,并且是“加料 不加价”。表:HW3.0 和HW 4.0 关 键参数 对比HW 3.0 HW 4.0摄像头 9 个,120 万像素 8 个,500 万像素雷达1 个毫米波雷达,12 个超声波雷达为安装雷达预留空间,但是Model Y 目前未配备雷达计算平台 FSD Computer 2 FSD Computer 2计算平台数量 1 3芯片 三星的 Exynos 架构 三星的 Exynos 架构CPU 12 核 20 核CPU 频率 2.2GHz 2.35GHz神经网络加速器 双核 三核神经网络频率 2GHz 2.2GHz最大算力 100TOPS 500TOPS制程 14nm 7nm 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告 HW5.0 或搭载第二 代 3nm N3P 工艺 芯片:与N3E 相比,N3P 的晶体管密 度更高,从而提 高 了性能的 同时降 低 了功耗。N3P 性能比N3E 高 5%,同时光学 尺寸缩 小 了 2%,从而晶体管密度达 到 1.04 倍。据Digitimes报道,特斯 拉已向 台 积电第二 代 3nm N3P 工艺芯片下 达了 异常大的 订单,如 果 此消息 属实,HW5.0 的性能将 比HW4.0 具有显 著地提 升。摄 像头工艺 再提升,加入加热 镜头元件、水滴排 斥涂层和 光圈控制 技术。1)加 热镜头元 件:三星 开发的“Weather Proof”摄像 头配备了8MP传感器,并采用了 一种巧妙 的镜头加 热系统,能 在不到 一分钟内 融化覆盖 在镜头上 的冰雪。2)水滴排 斥涂层:新型摄像 头配备了 防水涂层,可以防 止水滴停留在镜头上,添加了防水涂层,以防止水滴停留在镜头上,这种涂层耐划痕和损伤,耐用性是现有解决方案的6 倍。3)光圈控制技术(IRIS):三星 开发 的摄 像头 模块 引入 了光 圈控制 技术,允许 摄像头 根据不 同的 光照条 件和自 动驾 驶需求 动态调 整进 光量,优化图 像质 量和传 感器性能。资 料 来源:Digitimes,三 星官网,公开 资料整 理,太 平洋证 券HW5.0:或搭载第二代 3nm N3P 工艺芯片,摄像头或加入加热镜头元件等9图 光 圈 控制技 术(IRIS)能够显 著优化 成像质 量 CONTENTS目 录目 录特斯拉的FSD 时刻AI赋能,加 速Robotaxi无图城市NOA重新定义智 能汽车投资建议风险提示0102030405 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告马斯克 称Robotaxi 将于今 年8 月8 日 落地,近期 特斯 拉启动 了 全球 范围 内的人 员调整,自动 驾驶预 计将获 得资源 倾斜,落地路 径Roadmap 持 续催 化值得 期待。乘坐Robataxi 的综合成本:我们将消 费 者 乘坐Robataxi的综合成 本划 分成货 币 成本、安全成本、和其他成本。其中货币成本主要指打车费,安全成本则是消费者乘坐Robataxi所承担的比传统出租车更大的安全风险,以及由此造成的乘客可能成本(如健康损失、医疗费用),其他成本则主要包括时间成本等(Robataxi 可能因为速 度或错 误选 择匝道进 入等导 致平 均速度相 对慢)等。综合成本降低是规模化落地的关键:Robotaxi 面临的竞争对手是传统的出租车行业,其商 业模 式要 想 跑得通,就 要从 传统 出租车Uber 等公 司抢 客,客观 需要 其具有相对低的综合成本吸引顾客。Robataxi 每公里货币成本已经显著下降,当前更重要的或 是降低 安全 成本。自驾技术进步是降低综合成本的核心,规模落地依赖L4/L5 技术,目前或局限于部分城市的部分区域路段。目前,国内外都存在Robotaxi的训练,但是仅局限于部 分城市 部分区 域。在 这一层 级上,L3层级 的自动 驾驶 技术可以 满足 需求。但是为了规模化推广,意味着自动驾驶技术要能适应更复杂的驾驶环境、降低综合成本,L4 则是 必 须的。基于 此,我 们认为 马斯 克在8.8落地的Robotaxi或将 局 限于部分城市的部分区域,规模化落地仍有 待自动 驾驶技 术向L4/L5方 向进一 步发展。外 部条件:监管 政策宽 松和有 关法律 完善。资料来源:公开 资料整 理,太 平洋 证券Robotaxi:8 月8日落地路径Roadmap持续催化11货币成本安全成本其他成本主要指打 车费所承担的 比传统出租车更 大的安全风险所 带来的可能成本时间成本 等综合成本如祺出行:19 年Robotaxi 成本为23.3 元/km,23 年降至4.5 元/km(载 人出租车1.8 元/km)请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告 超算需 巨额资 金投 入,马 斯克预 计特 斯拉今 年在有 关领 域累计 投资超100 亿美元。在今 年1月27 日,马 斯克 在推特 上表示,Dojo 目前 的算力 进相当于1 万个英 伟达H100,如果想 在AI 领域具 备竞争力,那么目 前需要每 年投入数 十亿美元。随后在4 月6号,马斯克再 发言,表示 特斯拉在 训练计算、数 据 管道和 视频存 储方面 的累计 投资将 在今年 超过100 亿美元。AI 赋能,加速Robotaxi。数 据鸿沟 和算力 要求,构成 超算的 核心 壁垒。首先,任何 模型的 训练都 依赖 于数量 巨大、质量 可控的 训练数 据,而特斯拉FSD 自 推 出以来累 计运行超过 了10亿 英里,这位 特斯拉 训练 模型提 供了 充足的 训练数 据。其次,算力方 面,大模型 训数据 需要 强大的 算力,特斯 拉目前 可能拥 有3万-3.5万颗英伟达H100 芯片,而下 一代 的Gork 可能需 要10 万颗H100,如果 按照单价4.5万美元/颗,那么10 万颗H100 总价值高达45 亿美元,相 当于300多亿人民 币。资 料 来源:Twitter,公开 资料整 理,太 平洋证 券AI 赋能,加速Robotaxi,特斯拉自动驾驶今年累计投资预计超100亿美元12图 Dojo 的 数据流近存 计算架 构层级 名称 片上SRAM 算力 说明内核Dojo Core1.25MB 1.024TFLOPS单个计算 核心,64 位宽度,具有4 个8x8x4的矩阵计算单 元,2GHz主频芯片级 D1 440MB 362TFLOPS 单 芯 片,核 心数为354,面积645mm核心级Dojo Tile11GB 9050TFLOPS 单个训练 模组,每5x5个芯片 包括一 个 训练模组整群级 ExaPOD 1320GB 1.1EFLOPS模拟训练 的训练 集 群,每12个训练 模 组组成一个机柜,每10个机 柜组成ExaPOD,共计3000个D1 芯片 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告 华为ADS 2.0 问世后,城市NOA 的 竞 争愈发向着无图化、全城市可用的方向发展。华为的ADS 2.0 首次搭载在华为问界M5 上,相比与ADS 1.0,ADS 2.0结合道路 拓扑推理网 络(RCR)和华为的先进 算法,实现了不 依赖 于高精地图 的高速、城区高阶 智能驾 驶功能。小 鹏汽车 宣布面向智 驾经 验 用户即 刻推送 无限 XNGP 智 能 辅助驾驶 功能,号称“不限城 市、不 限路线,有导 航的地 方就能 用”。理想、比 亚迪、华为、小 鹏等 智驾 头部车 企将 自动 驾驶放 在优 先发 展战略 地位,我 们认为 原因 如下:智能驾驶的技术路径逐渐收敛,后发力者技术上具备后发优势。特斯拉的智能驾驶技术路线已得到成功验证,我们看到,当前时点,“Transformer+BEV 感知大模型”、“Occupancy、Lane 算法”、“自 动标注”、“超算建设”等成 为共 识。从中 长期 看,纯视 觉与 激光 雷达路 线 之争逐 渐走向“折中”方案、“不 依赖高 精地图”有望 降低智 能驾驶 软硬件BOM 成本。我 们认为 在未 来大 模型将 继续 赋能 自动驾 驶。端 到 端算法 有望提 升规控 准确性、大模 型蒸馏 训练小 模型减 少计算 资源消 耗、生成 式AI 提供 高质量 训练数 据、多 模态模 型有望 优化感 知。资 料 来源:各公司 官网,太 平 洋证券AI 赋能,加速Robotaxi,无图全城城市NOA加速13品牌 高速NOA 城市NOA 24 年 计划指 定路线NOA 功能小鹏 不 限城市/AI 代驾阿 维塔 不 限城市(阿维塔12)/AI 代驾问界 不 限城市/AI 代驾理想 113 城 无图城市NOA 预计2H 全 国开放 通勤NOA蔚来 726 城预计Q2 向所有NT2.0 用户 推送NOP+城区领航辅助特 斯拉 国 外开通零跑 预计2H 推出腾势 40+最 快年底 覆盖全 国极氪 深蓝 宝骏 记 忆行车图:不同车 企高速NOA 及 城市NOA Roadmap时间 NOA 特点2023.05 华为 ADS2.01、配备1 个顶置激 光雷 达、3 个 毫米 波雷 达、11 颗高清摄像头以及12 个超 声波 雷达,不受 恶劣 天气 和光线 影响,全 天候 感知 信号。2、BEV+GOD 网 络(General Objective Detection 通用 障碍 物检 测),可 以识别 通用 障碍 物白 名单 外的异形物 体。3、有图无图都能 开,覆盖 超90%城区2024.04 小鹏无限 XNGP 不 限城 市、不限 路线,有导 航的 地方 就能 用图:华 为 ADS2.0 和 小鹏无 限XNGP 都 支持不 限城市、无图NOA 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告BEV+Transformer2D+CNN资 料 来源:特斯拉AI DAY,太平洋证 券技术路径收敛:特斯拉引领BEV+Transformer142021 年7 月AI DAY,特 斯拉首 次展 示基于Transformer 的BEV感知方 案,是 大模 型首 次用于 自动 驾驶,实时 感知 生成 向量空 间。BEV(Birds-eye-view)指 俯瞰 图视角,Transformer 利用 主干网 络对各 个摄像 机进行 特征提 取,再 利用Transformer 将多摄像 机数据 从图像 空间转化 为BEV空间(向量 空间)。Transformer vs CNN:Transformer 是一 种基于 注意力 机制(Attention)的 神经网 络模型,通过 注意力 机制去 挖掘序 列中不 同元素 的联系 及相关性,而CNN的局部感 受野限 制了它 们在长 距离依 赖性建 模方面 的能力。BEV+Transformer vs 2D+CNN:BEV+Transformer 可以消 除遮挡 和重叠,提高 检测精 度。BEV视角 下的物 体,不 会出现 图像视 角下的 尺度(scale)和遮挡(occlusion)问题。BEV能够实 现“局 部”端 到端优 化,感 知和预 测都在 同一个 空间进 行,输 出“并 行”结 果。图:自动驾 驶跨摄 像头和 多模态 融合背 景下的BEV 视角 图:BEV+Transformer 可 以消 除遮挡 和重叠,提高 检测精 度 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:特斯拉AI DAY 太 平 洋证券技术路径收敛:特斯拉Occupancy 感知引领华为、理想跟随15图:通过Occupancy flow 可以用 于判断 物体是 否运动2D+CNN2022 年10 月AI DAY,特斯拉Occupancy 感知进化,不识别 类别 也能 判断物 体运 动状 态,引 领华 为GOD、理想Occupancy 跟随。2022 年10月1 日的AI Day 中展现了Occupancy Network 感知技术:基本的 思 想是将三 维空间 划 分成体素voxel,通过0/1 赋值对voxel 进行二分类,实 际 中的赋 值可以 是概率 值,表 示voxel 存 在物体的 概率。Voxel 的属性 除了是 否被占 据,还 包含语 义信息 和速度 信息(Occupancy Flow)等。其 中 速度信 息是一 个三维 向量,用于表 述voxel 运 动的速度 和方向,通过occupancy flow 可 以 用于判 断物体 是否运 动。相较BEV+Transformer,Occupancy 是 又一 里程碑 式进步:占用 网络相 较于BEV,有了Z 轴上 的扩展,是一 种通用 的2D 特征转3D 特征的转 换,不 局 限于通 用障碍 物检测,可以 扩展到 更多3D 空间任务。同时 在引入 速度信 息后,动态描 述向4D 过渡。2Q23,华为、理 想 相继发布 类似的 算 法,其中 华为创 新 性地将激 光雷达 信 息融入其GOD 网络,理想Occupancy 属于其三 种重点 感 知算法之 一。图中展示 了一个 两 节的公交 车正在 启 动的场景:蓝 色 表示运 动的voxel,红色表 示静止 的voxel。Occupancy Network 精 确地估 计出了 公交车 的第一 节开始 运动,第二节 还静止。可预测道路起伏度:在BEV空间生成统一体素,可以预测任意一个体素的占用概率,道路边沿的占据栅格和道路表面贴合。运 动 流,3D 方 便测算遮挡关系:能够实时预测被遮挡物体的运动状态,可以为每个体素预测其运动状态,对随机运动进行建模。弱语义,强几何:可以为每个体素生成对应的语义类别,即使不识别类别也能处理运动物体。Occupancy 具 有 高 效 的存储和计算优势:10ms内可以完成计算,各个位置的分辨率可调整,具备BEV空 间 变焦能力。优势 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:特斯拉AI DAY,Neural Map Prior for Autonomous Driving,太平洋证 券技术路径收敛:Tesla Lane感知车道拓扑,理想提前提取复杂路口特征16图:Lane 神经 网络同样 基于Transformer 模型,是摆 脱高精 地图的 关键算 法,可生成道 路间的 拓 扑连接关 系视 觉组 件:一组 卷积 层,注 意力层,以及其他神 经网 络,输入8 摄像头 数据地图 组件:用粗 略地 图增 强,提供 道路 关系语 义组 件:输入 密集 张量,输出 编码 车道 连接 性的文本,利用NLP 领域 技术图:针对 复杂路 口,理想自 研NPN 网络提前进 行路口 特 征的提取,当 车 辆再次 行驶到 该路口 时,与 车端感 知的BEV 特 征层 融合 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:特斯拉AI DAY,各公司官 网,太 平洋证 券技术路径收敛:大模型自动标注效率是人工的1000-45000 倍17图:特斯拉 采用大 模型优 化数据 标注,从2018 年只有 纯人工 的2 维标注,2021 年后建 立 自动标 注系统 可以取 代500 万小时的 人工作 业量只有纯人 工 的2 维的图像标注,效率非常低开始有3D label,但是是单趟的人工的采用BEV空 间进行标注,重投影的精度明显降低采用多趟重建去进行标注,精度、效率、拓扑关系都达到了极高的水准企业 自动标注 大模型 应用及 能 力小鹏引入全自 动的标 注系统,对比人工 标注,全自动 标 注系统效率高,过去2000个人 一 年的标注 任务,现在用16 天左右就能完成,效率 可以提 升45000倍理想使用软件2.0的 大模型,通过训练 的方式 进行自 动 化标定,过去需要 用一年 做的事 情,基本上3个小 时就能 完 成,效率是人的1000倍比亚迪 毫末智行 在算法 模型上,研发了智 驾自动 标注大 模 型华为华为云研 发的标 注大模 型,基于海 量典型 数据进 行 预训练,通过语义 分割、对象跟 踪 技术可以 快速完 成长时 间 连续帧的自动标 注毫末智行DriveGPT 的自动 化标注 能 力,可以 降本98%数百亿4D Clips(环 视连续 数据Clips)的标注 成本。商汤商汤科技 公布了“日日 新SenseNova”大 模型体 系,包含自然语言 处理、内容生 成、自动化 数据标 注、自 定 义模型训练等多 种大模 型及能 力。图:国产新 势力、比亚迪、华为、长城、AI 公 司 纷纷 采用自动标注 大模型 提 升效率 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:特斯拉 推特TeslaAI,各公 司官网,太平 洋证券技术路径收敛:特斯拉Dojo投产,国内厂商建设超算中心18图:特斯拉DOJO 超算自7 月投 产,计 划明年 在DOJO 上投入 超过10 亿美元,当 前算 力 相当于1 万+英伟达H100,预计 到24 年算力 会相当 于30 万英 伟达A100企业 超算中心建设蔚来2022年就曾宣布与英伟达合作,基于A100打造自己的数据中心小鹏与阿里云合作在乌兰察布建设了智算中心“扶摇”,宣称云端算力可达600 PFLOPS毫末智行在算法模型上,研发了智驾自动标注大模型发布了和火山引擎合作的“雪湖绿洲”智算中心,称其算力规模为670 PFLOPS理想宣布了与火山引擎合作在山西打造智算中心,采购的公有云服务算力达750P FLOPS;吉利汽车和阿里云在湖州成立了星睿智算中心,拥有810 PFLOPS 的算力。图:国内多 家OEM 和Tier 1 均 在 积极 建设智 驾数据 中心 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告车端计算资源有限难以部署大模型,导致推理效果和泛化性能欠佳:通常来说,规模较大的模型 预测效果更好,但训练时间长、推 理速 度慢 的问题 使得 模型 难以实 时部 署,尤其在 自动 驾驶 汽车等 计算 资源 有限的 设备 上,响应速 度显 然不 够用。规模较小的模型 虽然推 理速度较 快,但 是因为参 数量不 足,推理 效果和 泛化性能 没那么 好。大模型知识蒸馏给小模型,可以实现更优的性能:知 识蒸馏(knowledge distillation)是模 型压缩的一种常用方法,通过 构建一个 轻量 化的 小模型,利 用性 能更好 的大 模型 的监督 信息 来训 练这个 小模 型,以期达 到更 好的 性能和 精度。目标检测是计算机视觉中的一 个重 要任 务,知 识蒸 馏可 以在不 增加 其计 算消耗 的前 提下 提升其 表现。根 据理想 智驾VP朗咸 朋,其 认为GPT最大的好 处 是可 以用 大量 的弱标 注或 者粗 标注的 样本,来 获取一 定的 基础 能力;然后 再用 精标的 小数 据去 做调整,在某些任务上得到更好的结果,理想 现在也在 这么做。资 料 来源:Focal and Global Knowledge Distillation for Detectors,太 平 洋证券大模型赋能智驾GPT:大模型蒸馏有望解决车端算力不足带来效果欠佳问题19图:学生 模型通 过 蒸馏学到 了教师 的 知识,并 获得更 好 的特征,由此实 现 性能提升 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告生成式AI 可以生成廉价的海量训练数据和极端驾驶场景,高 效地批 量生 产自动 驾驶模 型训 练开发 所需的 海量 数据。Tesla、Wayve 在2023 年CVPR 自动驾驶workshop 上展示了利用大模型来生成自动驾驶相关的连续视频场景,Tesla 命名为World Model,Wayve 则命名为GAIA-1。资 料 来源:各公司 官网,CVPR,太 平洋 证券大模型赋能智驾GPT:生成式AI 有望高效低价提供高质量训练数据20图:Waymo GAIA-1和基于GAIA-1 生 成 的 视频素 材 图:特斯拉 认为World 模型对端 到端的 自动驾 驶实现 非常重 要 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告资 料 来源:商汤官 网,知 乎 小小将,太平洋 证券大模型赋能智驾GPT:“语言+视觉+雷达+地图+定位”或将赋能多模态感知21图:当输入 图像时,GPT-4 可以生 成理解 图像的 文本回 答 图:商汤认 为在通 用大模 型加持 下,通 用AI 时 代 人可 以通过 语言和模型互动,人的反 馈 有助于提 速自动 驾 驶的新技 能解锁。“多 模态 大模 型”或能显著 提升 感知 效率 CONTENTS目 录目 录特斯拉的FSD 时刻AI赋能,加 速Robotaxi无图城市NOA重新定义智 能汽车投资建议风险提示0102030405 请务必仔细阅读报告尾部的投资评级说明和声明行业深度报告特斯拉率先定义,引领 国内 新势力 布局不 依赖 高精地 图的城 市NOA,当前量产方案处于有图向无图的过渡期。特斯拉率先 推送高 速NOA:特斯拉于2016 年10月率先推 出高速NOA(Navigate on Autopilot)功能,定 义了高 级 自动驾驶 的进阶 方 向。2020 年末起,蔚来、小鹏、理想相 继向客 户推送 高速NOA。城市NOA 重 新定义智能汽车:特斯拉 于2020 年10 月,首次向早期访问程序 测试人员发布了其FSD BETA测 试版,支持在城市道路使 用NOA,标志着汽车智 能水平 的 重新定义。2022年末,小鹏 作为国 内 首家向广 州用户 推 送了城市NGP。2023 年3 月,理想计 划 现在起all in 自动驾 驶,李想 表示,“到2024 年,有无 城市NOA,将会像 买了20-30 层高层,有电梯和没电梯 的 区别。”理想表示,不依赖高 精地图 的城市NOA 将会在2023 年末落地百市,并于6 月开启城市NOA(无图)内测。2023 年5 月,装配华为ADS2.0 的问界实现无图城市NOA,2024 年2 月,小鹏推出无限XNGP,紧跟华为 实 现全城 市无图NOA。资料来源:各公 司官网,维基 百科,太平洋 证券特斯拉FSD,引领无图城市NOA重新定义智能汽车23图:特斯拉 及国内 新势力NOA 进程宣布EA选装包推出标志性功能“Navigate on Autopilot”,它允许机器控制在受控 高速 公路上从入口匝道到出口匝 道,无需驾驶员操纵即可改变车 道,并且可以从一条高速公路换 道到 另一条高速公路,然后成功 驶出。2016年10月 2017年1月和2月 2020年10月 2021年1月 2021年11月 2022年HW2 车辆更新了软件版本 8.0,其中包括在高速公路和城 市道路上的Navigate on Autopilot 和自动转向、车道居中,最高时 速限制为 72公里/小时。特斯拉首次向早期访问程序测试人员发布了其 FSD BETA测试版,支持在城市道路使用NOA。FSD 测试测试版 FSD 软件的员工和客户人数接近 1000。截至2022年7 月,FSD 测试版已行驶 3500 万英里。同年11月,FSD 测试版向所有购买该选项的北美车主开放。特斯拉NOA历程参与 FSD BETA 的用户增加到 60000。国内新势力NOA历程小鹏推送高速NGP(Navigation Guided Pilot)小鹏国内首家推送城市NDP蔚来国内首家推送 高速场景下的领航辅助NOP(Navigate on Pilot)蔚来基于NT2.0新平台推送NOP+理想通过OTA 升级向用户推送了NOA 导航辅助2023年、2024年不依赖高精地图的城市NOA 预计在2024年3 月落地,目标开通110城,同时通勤NOA 覆盖100城市马斯克认为23年年底完全级自动驾驶有望落地,FSD将迎 来“CHATGPT”时刻。2023年实现超100城市覆盖城市NOA;2024年推出无限XNGP,实现全城市无图不依赖HDMAP 的城市辅助驾驶将于2023年Q4 落地 请务必仔细阅读报告尾部
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642