视觉语言动作模型如何重塑自动驾驶竞争格局
创始人
2025-02-21 08:20:36
0

本报记者 龚梦泽

纵观自动驾驶技术的发展历程,人工智能的不断突破显著提升了自动驾驶的感知性能。2025年以来,一种全新的技术范式,即视觉语言动作模型(VLA,Vision-Language-Action)正在加速崛起。

新技术崛起

VLA模型最早见于机器人行业,其通过输入给定的文本和视觉数据,输出机器人可执行的动作,天然带有AI与物理世界交互的基因。

2023年7月28日,谷歌DeepMind推出了全球首个控制机器人的VLA模型。如今这一模型概念正快速扩散到智驾领域。不少智驾人士将VLA模型视为当下端到端方案的2.0版本。

中国自动驾驶产业创新联盟调研员高超对《证券日报》记者表示,VLA模型的核心突破在于其“思维链”的推理能力。VLA模型可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后转化为驾驶操作指令,期间可向用户展现系统推理过程,解释为什么这么开,让用户更信任智驾,进而推动智能驾驶从“功能时代”迈向“体验时代”。

“VLA模型极有可能在未来两年内改写智能驾驶市场的竞争格局。”在高超看来,VLA模型将端到端与多模态大模型更彻底地融合,能够根据感知直接生成车辆的运动规划和决策,更接近“图像输入、控制输出”的端到端智驾理想状态。预计2025年VLA模型的量产落地,将推动城区NOA渗透率提升。

现阶段,智驾市场竞争焦点已从单纯的功能实现转向了更深层次的技术范式竞争,强调技术架构的先进性和可持续性。高盛最新自动驾驶报告显示,到2030年,VLA模型主导的端到端方案可能占据L4级市场60%份额,这意味着传统一级供应商的价值链地位面临重构。

电车巨头特斯拉或将成为这场变革的潜在受益者。据悉,特斯拉的Dojo超算中心已形成20000多片自研的芯片集群,专门针对视觉数据的时空连续性进行优化。

国内企业也在发力布局。北京理想汽车有限公司(以下简称“理想汽车”)曾在2024年三季度财报电话会议上表示,内部已经启动了L4级别自动驾驶的预研,在当前的技术路线基础上,研发能力更强的车端VLA模型与云端世界模型相结合的强化学习体系。

作为“车位到车位”的提出者,华为技术有限公司(以下简称“华为”)通过智驾3.0融合GOD(通用障碍物检测)网络与VLA模型,在无高精地图区域实现厘米级定位;百度集团股份有限公司Apollo则依托文心大模型,将VLA模型的交通场景理解准确度大幅提升。

据新战略低速无人驾驶产业研究所统计,2024年,国内自动驾驶领域公开185起重要投融资事件,较2023年增加30%,端到端技术公司表现活跃;披露的融资总金额超370亿元(含收并购、IPO募资),较2023年增加76%。

市场竞争激烈

在进入规模推广之前,下一代端到端方案还面临很多现实挑战。

现阶段车端芯片硬件不足以支撑多模态大模型的部署落地。有行业人士向记者透露,将端到端技术与视觉语言模型二合一后,车端模型参数变得更大,既要有高效实时推理能力,同时还要有认识复杂世界并给出建议的能力,这对车端芯片硬件有相当高的要求。

“目前,高阶智驾的算力硬件基本为2颗英伟达Orin-X芯片,算力在508Tops左右,以现有的车端算力很难支撑VLA模型的部署。”上述人士表示,如何将端到端技术与多模态大模型的数据与信息进行深度交融,也考验着头部智驾团队的模型框架定义能力、模型快速迭代能力。

与此同时,商业化之路并非坦途。据《证券日报》记者统计,2024年成功上市的7家智能驾驶领域相关企业中,6家企业处于亏损状态,研发费用远高于营业收入。另据麦肯锡调研报告显示,虽然中国消费者对智能驾驶的接受程度在上升,但对智能驾驶的支付意愿却出现了下滑。受访者中,愿意对智能驾驶进行支付的用户占比,从2022年的42%下降到了2024年的28%。

供应链的暗战同样激烈。据悉,英伟达Orin芯片虽占据75%的市场份额,但北京地平线机器人技术研发有限公司征程6的BPU架构专门针对VLA模型进行优化,能效比提升3倍。这场芯片架构之争背后,是每年价值数百亿美元的车载计算市场主导权的争夺。

“VLA模型引发的技术变革正在重塑自动驾驶产业格局,这场变革的终局或许不是某条技术路线的完胜,而是催生出分层市场。”中国乘用车产业联盟秘书长张秀阳告诉记者,在Robotaxi(无人驾驶出租车)领域,混合运营架构(有人+无人)可能长期共存;而在量产车市场,未来VLA模型有望成为高阶智驾的标配。这不是单纯的技术竞赛,而是整个汽车和智驾行业认知范式和技术范式的迁移。“当软件定义汽车进入2.0时代,真正的较量才刚刚开始。”

(编辑 张博)

相关内容

热门资讯

无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
东风汽车集团申请阻燃柔性固态电... 金融界2025年1月31日消息,国家知识产权局信息显示,东风汽车集团股份有限公司申请一项名为“一种阻...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
我市特步5G工厂入选国家5G工... 日前,工业和信息化部发布《关于2024年5G工厂名录的公示》,我市特步5G工厂入选国家5G工厂名录,...
卫星化学获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示卫星化学(002648)新获得一项实用新型专利授权,专利名为“...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
360智脑张向征:构建安全可信... 人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京...
原创 3... 一、iQOO 12 参考价格:2659元(12G+256G)。 性能强劲,游戏无忧 首先不得...
联想宣布旗下AIPC个人智能体... DoNews2月7日消息,近日,联想宣布个人智能体“小天”已接入DeepSeek,除了目前可以在联想...
2025年消脂设备产业数据报告 消脂仪是医学美容领域的医疗器械。 它使用激光和微波等设备根据其波长向真皮/皮下平面发射能量; 通过加...