旗下微信矩阵:

赌桌上,马斯克偷偷换牌

被竞相争抢的端到端智驾方案到底有何魅力?端到端方案当下面临的阻力是什么?
2024-06-25 10:31 · 微信公众号:亿欧网 李馥琼

自动驾驶的春天终于回来了。

亿欧智库数据显示,在2021年,中国自动驾驶领域共发生投资事件107起,累计金额达575亿元,自动驾驶产业的火热程度可见一斑。

然而到了2022年,由于投资大环境周期性遇冷,还有自动驾驶迟迟难以实现大规模商业化落地等因素,自动驾驶产业投融资情况每况愈下,国内外的智能驾驶行业不约而同地陷入了寒冬中。

但随着端到端大模型的问世,资本市场对自动驾驶重燃热情。

特别是在2023年,特斯拉发布FSD v12版本以后,马斯克公开表示因为引入了端到端大模型,原来的30万行代码被简化为3000行,而且体验上还获得了巨大的提升。

这让所有人都意识到了端到端大模型的巨大价值。今年5月,软银和英伟达一起携手,投资了专注于端到端的英国自动驾驶初创公司Wayve.AI。这笔高达10.5亿美元的融资,成为了英国人工智能公司有史以来*的单笔融资。

特斯拉的示范和Wayve.AI收到的真金白银,无疑给自动驾驶行业注入了一阵强心剂,显露出资本对端到端自动驾驶领域的信心,展示了端到端自动驾驶背后的潜在商业价值。

此前有研究报告对包括主机厂、算法公司、芯片公司、数据服务和工具链公司等30余位专家、研究人员、高管进行调研分析,显示目前90%的公司选择全面拥抱端到端,大部分技术公司都表示出难以承受错过这一次技术革命的后果。

但是,就在端到端热潮兴起之际,有长期关注特斯拉的博主表示,特斯拉并未完全押注大模型,此前声称被拿走的30万行代码,又被特斯拉放了回去。

被竞相争抢的端到端智驾方案到底有何魅力?端到端方案当下面临的阻力是什么?其是否为完全自动驾驶大规模落地的最终形式?

1、“不可承受的错过”——端到端方案

在此前文章《特斯拉又造风口了》中,亿欧汽车讨论了当前实现完全自动驾驶的两种主流方法,端到端智驾方案就是其中一种。

早在2016年,英伟达就提出采用单个神经网络来实现端到端的自动驾驶。但是直到国内车企卷起“开城热”的狂潮,加上特斯拉FSD的推出,才真正将端到端方案推上了顶流的位置。

第三方研究院监测数据显示,2023年中国市场(不含进出口)乘用车前装标配ADAS交付1238.1万辆,其中,L2级及以上标配交付同比增长36.9%,而NOA为代表的高阶智驾市场则同比大增189%。进入2024年,NOA高阶智驾热度不减,1-2月,乘用车前装标配NOA新车交付量同比增长201.4%。

根据另一家第三方研究院数据指出,2023年国内NOA功能搭载量达94.5万辆,其中大部分集中在高速NOA,城市NOA搭载量为23.8万辆。

也就是说,在NOA高阶智驾广受追捧之际,城市NOA的竞争仍未达到最高点,主机厂们还在持续发力布局争夺城市NOA市场。虽然众多车企扎堆“开城”,纷纷立下flag,但推进速度并不尽如人意。即使是在已经开通的城市,整体的智能驾驶体验也远不及市场预期和车企宣传。

而城市NOA难以大规模落地的原因之一,就在于目前的智驾方案面临城市道路上突发情况时可能会束手无策。

传统的智驾方案是基于规则执行,但是城市道路存在许多corner case,或者说是一些长尾场景。这些情况是之前制定规则的工程师所未曾预想,或难以用规则准确描述的,这就导致了实际城市NOA使用体验和开城速度不及预期。

“端到端方案不一定是最安全的(自动驾驶方案),但它一定是最自然的。”光轮智能创始人兼CEO谢晨提到。在去年,谢晨曾在海外体验了特斯拉FSD的自动驾驶功能,而更加贴合真人驾驶习惯的特斯拉FSD也给他留下了深刻印象。

图源:Tesla FSD Tracker

此外,特斯拉引发的“鲶鱼效应”再次搅动了国内自动驾驶的一江春水。

从第三方网站Tesla FSD Tracker数据可以看出,自FSD V12推出后,无论是平均接管里程还是完全无接管占比,都较FSD V11有了巨大的飞跃。

从上图可以看到,与之前的版本相比,FSD V12.3所有路段平均接管里程从116英里提升至286英里,城市路段平均接管里程从60英里提升至149英里。用户完全无接管的行程次数占比也从FSD V11.4的47%上升至72%。

特斯拉FSD在自动驾驶领域的表现有目共睹,这也进一步推动国内车厂决心投入端到端方案中。

“特斯拉即将迎来ChatGPT时刻。”

马斯克的话似乎也暗示AGI(Artificial General Intelligence,通用人工智能)的迭代发展推动端到端方案的进一步落地。

鉴智机器人联合创始人、CTO都大龙也曾指出,端到端并不是新鲜的事情,早几年前就有人在研究。只是当时大家并不知道如何让自动驾驶端到端模型具备因果推理能力,具备common sense能力,具备人类认知能力。“但随着大语言模型和生成式AI的出现,大家看到自动驾驶端到端落地的可能性。”

开城瓶颈、拟人体验、特斯拉FSD成功经验以及技术推动等多方面原因,共同助力端到端方案一跃成为人人争抢的香饽饽。

2、“自动驾驶没有葵花宝典”

“我并不期待有一天出了一个葵花宝典武功秘籍,然后自动驾驶就突然开窍就成了,我觉得不会有这样的事情存在。”

在小马智行智慧物流总经理贺星看来,端到端大模型不是自动驾驶走向终局的*解决方案。

小马智行副总裁李衡宇更是表示,达到完全自动驾驶不太可能是单一的方法,一定是混合的:

“无人驾驶最终目的是完全自动化,这是一个系统化的工程,这就意味着所有的技术路线都是可以用的工具和选择。对小马智卡而言,我们只为最终结果负责,什么方法能达到完全自动驾驶的安全性是人驾驶的10倍,我们就用什么样的方法。但基于我们现在的认知,我认为这不太可能是单一的方法,一定是混合的。”

将规则算法和端到端大模型等技术和方案进行融合,这会是自动驾驶的*解决方案吗?

马斯克和特斯拉给出的答案可能是:YES。

等等,此前特斯拉的更新日志提到,FSD Beta v12对城市街道驾驶栈进行了单个端到端神经网络的升级,这个神经网络基于数以百万计的视频片段训练而来,替换了超过30万行明确编写的C++代码。此消息一出,也立马让饱受传统高阶智驾方案高投入、高成本之苦的智驾厂商,看到了降本增效的曙光,纷纷投入端到端方案的怀抱。

既然特斯拉把以前的30万行规则代码都拿掉了,为什么这里又说马斯克和特斯拉会采取混合方案呢?

因为马斯克可能偷偷换牌了。

有长期关注特斯拉的博主在社交媒体发文称,特斯拉把此前删除的30万行代码又悄悄地放了回去。所以上文提到FSD V12.3的平均接管里程以及完全无接管占比表现的优化,究竟是单独端到端大模型作用,还是规则代码的赋能,不得而知。

这也恰恰引出了一个问题,那就是目前行业内对端到端概念的存在着不同理解,背后有着不同的技术路线和模型设计。辰韬资本将自动驾驶架构演进分为四个路线,目前,无论处于哪条路线的厂商都喜欢往自己身上贴上“端到端”的标签。

图源:辰韬资本

虽然各个技术路线皆有其优劣势,但最终体验价值、开发代价等关键性问题仍没有达成共识。究其根本,行业内尚未出现可供参考的*实践案例。一直被视为走在“端到端自动驾驶方案”落地前列的优秀代表——特斯拉重新启用了被抛弃的30万行代码的举动,更是揭露了一个事实:

端到端大模型的解决方案,未必是适合所有企业宝宝的体质。

3、“大部分企业都不适合做端到端”

“我认为大部分企业都不适合做端到端。”谢晨指出。

对于想要做端到端方案厂商而言,摆在面前的首要难点就是数据,其中包括数据量、数据标注、数据质量、数据分布和数据存储等多个层面。

2023年,特斯拉就声称已经分析了从特斯拉客户的汽车中收集的1000万个视频片段(clips),特斯拉判断完成一个端到端自动驾驶的训练至少需要100万个、分布多样、高质量的clips才能正常工作。

谢晨也告诉亿欧汽车,特斯拉目前也仅有万分之一的数据是真正有用的数据,能够帮助去验证和迭代的。这也是特斯拉FSD当前的卡点。

据小马智行CTO楼天城透露,现阶段,训练出一个一般性能的端到端模型,自动驾驶的数据量已经不是一个问题;但是要训练出一个高性能的端到端模型,对数据的质量要求可能是几个量级的提升。

而数据泛化,看上去是数据资产,实际上都是储存成本。毫末智行数据智能科学家贺翔指出:“毫不夸张地说,数据会占据端到端自动驾驶开发中80%以上的研发成本。”

除了数据,解决算力问题也是攻克端到端方案的必由之路。

特斯拉在算力方面的实力不容小觑,在2023年底的时候,已经跻身英伟达H100头部客户之列。在2024年*季度的财报电话会上,特斯拉对外宣布已经拥有35000张H100 GPU,并计划在2024年增加到85000张以上,和谷歌、亚马逊属于同一梯队。

在算力方面,国内主机厂和智驾厂商与特斯拉相比还存在一定差距。

以技术傍身的小鹏汽车为例,其在2023年8月宣布建成“扶摇”自动驾驶智算中心,算力可达600PFLOPS。据辰韬资本测算,以英伟达A100 GPU的FP32算力推算,约等于3万张A100 GPU。

商汤绝影也正在积极攻克端到端方案落地难题,两个月前,其面向量产端到端自动驾驶解决方案UniAD在北京车展上完成上车演示首秀。其当前运营算力规模达到了12000P,并将在预计2024年末达到18000P。

一系列事实似乎都在说明一个问题:端到端方案有风险,下注需谨慎。

【本文由投资界合作伙伴微信公众号:亿欧网授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。