视觉语言动作模型如何重塑自动驾驶竞争格局
创始人
2025-02-21 08:20:36
0

本报记者 龚梦泽

纵观自动驾驶技术的发展历程,人工智能的不断突破显著提升了自动驾驶的感知性能。2025年以来,一种全新的技术范式,即视觉语言动作模型(VLA,Vision-Language-Action)正在加速崛起。

新技术崛起

VLA模型最早见于机器人行业,其通过输入给定的文本和视觉数据,输出机器人可执行的动作,天然带有AI与物理世界交互的基因。

2023年7月28日,谷歌DeepMind推出了全球首个控制机器人的VLA模型。如今这一模型概念正快速扩散到智驾领域。不少智驾人士将VLA模型视为当下端到端方案的2.0版本。

中国自动驾驶产业创新联盟调研员高超对《证券日报》记者表示,VLA模型的核心突破在于其“思维链”的推理能力。VLA模型可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后转化为驾驶操作指令,期间可向用户展现系统推理过程,解释为什么这么开,让用户更信任智驾,进而推动智能驾驶从“功能时代”迈向“体验时代”。

“VLA模型极有可能在未来两年内改写智能驾驶市场的竞争格局。”在高超看来,VLA模型将端到端与多模态大模型更彻底地融合,能够根据感知直接生成车辆的运动规划和决策,更接近“图像输入、控制输出”的端到端智驾理想状态。预计2025年VLA模型的量产落地,将推动城区NOA渗透率提升。

现阶段,智驾市场竞争焦点已从单纯的功能实现转向了更深层次的技术范式竞争,强调技术架构的先进性和可持续性。高盛最新自动驾驶报告显示,到2030年,VLA模型主导的端到端方案可能占据L4级市场60%份额,这意味着传统一级供应商的价值链地位面临重构。

电车巨头特斯拉或将成为这场变革的潜在受益者。据悉,特斯拉的Dojo超算中心已形成20000多片自研的芯片集群,专门针对视觉数据的时空连续性进行优化。

国内企业也在发力布局。北京理想汽车有限公司(以下简称“理想汽车”)曾在2024年三季度财报电话会议上表示,内部已经启动了L4级别自动驾驶的预研,在当前的技术路线基础上,研发能力更强的车端VLA模型与云端世界模型相结合的强化学习体系。

作为“车位到车位”的提出者,华为技术有限公司(以下简称“华为”)通过智驾3.0融合GOD(通用障碍物检测)网络与VLA模型,在无高精地图区域实现厘米级定位;百度集团股份有限公司Apollo则依托文心大模型,将VLA模型的交通场景理解准确度大幅提升。

据新战略低速无人驾驶产业研究所统计,2024年,国内自动驾驶领域公开185起重要投融资事件,较2023年增加30%,端到端技术公司表现活跃;披露的融资总金额超370亿元(含收并购、IPO募资),较2023年增加76%。

市场竞争激烈

在进入规模推广之前,下一代端到端方案还面临很多现实挑战。

现阶段车端芯片硬件不足以支撑多模态大模型的部署落地。有行业人士向记者透露,将端到端技术与视觉语言模型二合一后,车端模型参数变得更大,既要有高效实时推理能力,同时还要有认识复杂世界并给出建议的能力,这对车端芯片硬件有相当高的要求。

“目前,高阶智驾的算力硬件基本为2颗英伟达Orin-X芯片,算力在508Tops左右,以现有的车端算力很难支撑VLA模型的部署。”上述人士表示,如何将端到端技术与多模态大模型的数据与信息进行深度交融,也考验着头部智驾团队的模型框架定义能力、模型快速迭代能力。

与此同时,商业化之路并非坦途。据《证券日报》记者统计,2024年成功上市的7家智能驾驶领域相关企业中,6家企业处于亏损状态,研发费用远高于营业收入。另据麦肯锡调研报告显示,虽然中国消费者对智能驾驶的接受程度在上升,但对智能驾驶的支付意愿却出现了下滑。受访者中,愿意对智能驾驶进行支付的用户占比,从2022年的42%下降到了2024年的28%。

供应链的暗战同样激烈。据悉,英伟达Orin芯片虽占据75%的市场份额,但北京地平线机器人技术研发有限公司征程6的BPU架构专门针对VLA模型进行优化,能效比提升3倍。这场芯片架构之争背后,是每年价值数百亿美元的车载计算市场主导权的争夺。

“VLA模型引发的技术变革正在重塑自动驾驶产业格局,这场变革的终局或许不是某条技术路线的完胜,而是催生出分层市场。”中国乘用车产业联盟秘书长张秀阳告诉记者,在Robotaxi(无人驾驶出租车)领域,混合运营架构(有人+无人)可能长期共存;而在量产车市场,未来VLA模型有望成为高阶智驾的标配。这不是单纯的技术竞赛,而是整个汽车和智驾行业认知范式和技术范式的迁移。“当软件定义汽车进入2.0时代,真正的较量才刚刚开始。”

(编辑 张博)

相关内容

热门资讯

无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
原创 预... 从销量上来看,两千元左右的手机更受大众消费者的喜爱,这其中爆发了不少爆款手机,而国内各大手机厂商也都...
“最准最快最久最少”纷纷亮相,... 医疗器械及医药保健展区一直都是进博会上“最卷”的展区之一。要得到关注,不拿出“绝活”不行。在本届进博...
原创 千... 在上个月联发科抢先高通,率先发布了自己的新款旗舰处理器天玑9400,并且在新机这块也比搭载高通的骁龙...
原创 日... 科技浪潮的奔涌向前,正重塑着人类社会的生活形态。近年来,AI智能技术的蓬勃发展,让科幻作品中的奇幻场...
叠彩区:加快促进“人工智能+”... 3月13日,记者在位于叠彩区北仓路的力源智能配送中心看到,3000平方米的仓库里,17台橘黄色的小机...
eaapp错误代码ec201怎... eaapp是许多玩家常用的游戏平台之一,像ea的体育竞技类游戏,在游戏市场中热度极高。但一些玩家在使...
座头鲸迁徙1.3万公里或创纪录 ◎荆晶 海洋生物学家发现,有一头先前生活在太平洋东部海域的雄性座头鲸出现在印度洋西海域,两地距离超过...