10月国庆假期刚刚结束,小鹏汽车自动驾驶中心悄然换帅:世界基座模型(WA)负责人刘先明接棒1号位,原VLA路线负责人李力耘退居二线;几乎同一时间,蔚来智驾部门三位核心高管离职,官方直言“为吸收通用AI最新技术”。两家头部新势力不约而同把“世界模型2.0”写进路线图,曾经热闹的VLA(视觉-语言-行为)派突然只剩理想一家“独舞”。小鹏从VLA转到WA,说明智驾技术路线之争已进入“生死时速”。
一、人事地震:小鹏“WA”上台,蔚来“WA”换血
小鹏:世界模型负责人直接掌舵
刘先明拥有UIUC电气与计算机工程博士学位,曾任职Facebook与Cruise,专攻机器学习与计算机视觉。2024年3月加入小鹏,6月便以“世界基座模型负责人”身份公开亮相。此次直接接棒自动驾驶中心,意味着小鹏将把WA路线从“预研”升级为“量产主航道”。
蔚来:三位自动驾驶核心高管同时离职
人工智能平台负责人白宇利、世界模型负责人马宁宁、智驾产品负责人黄鑫均已离职。蔚来官方称,这是为了“吸收通用人工智能最新技术”,并构建“预研-量产-平台复制-车型复制”的4×100接力棒模式,实质是把智驾组织与通用AI并轨,WA 2.0迭代已排到今年底至明年一季度。
短短一天,两家头部新势力完成“技术路线”上的自我进化,由此可见VLA路线正在全面退场,WA路线集体登台。
二、路线之争:VLA是“语言中介”,WA是“直接行动”
VLA:视觉→语言→行为,解释性强但链路长
VLA先让模型理解“前方有行人”,再生成“减速”行为,语言模块提供可解释性,适合监管汇报,但也带来误差累积与延迟。
WA:视觉→行为,真正的一段式端到端大模型
WA把感知点云与行为控制直接映射,用世界模型预测下一帧环境状态,再输出转向/加减速,链路更短、上限更高,但对数据量和算力要求更苛刻。
学术界早已争论:VLA是“过渡方案”还是“终极答案”?小鹏与蔚来用“人事换血”给出答案——VLA只是过渡,WA才是量产终点。这与前不久华为车BU CEO靳玉志靳总的观点完全一致。
三、小鹏战略选择:世界模型WA上位,只为学FSD商业模式
VLA需要额外的大语言模型参数,对Orin-X算力占用高达30%,而WA仅用卷积+Transformer,算力占用降一半,可把城市NOA硬件包打到万元以内。小鹏拥有950万公里实际道路数据+2亿小时仿真数据,WA可直接用仿真生成“下一帧世界”,把Corner Case训练成本降低40%。刘先明上任后,内部已立下“2025年Q1城市NOA订阅包1万元”军令,WA模型将首发于小鹏G9改款,随后覆盖P7+、X9 facelift,形成“全系列WA”产品矩阵。
四、蔚来战略选择:WA 2.0,世界模型升级为“订阅化”铺路
VLA的语言模块难以按功能订阅,WA可把“高速NOA、城市NOA、自动泊车”拆成独立世界模型,按月/按功能收费,订阅变现更精细。蔚来NT3.0采用 Thor-U芯片,WA可把高速、城市、泊车全部映射为“世界状态”,一颗芯片跑全场景,避免VLA多模型切换的算力浪费。蔚来新的“预研-量产-平台复制-车型复制”接力棒,实质是把通用AI与智驾并轨,WA 2.0迭代周期从6个月压缩到3个月,为2026年“订阅式智驾”上市铺路。
五、理想战略选择:孤独的VLA技术路线,过渡方案难成差异化护城河
VLA+城市NOA已落地,语言可解释性更强。理想L3 Max已推送城市NOA,VLA架构便于向监管解释“为什么减速”,适合中国L3准入申报。Mind GPT可把“我想喝咖啡”转化为“前方500米右转”,VLA天然与座舱多模态融合,形成“驾驶+座舱”统一语言模型。以前理想单车均价超40万元时,Orin-X算力占用30%仍可接受;但面对2025年城市NOA万元包竞争,VLA成本劣势将凸显。
六、未来终局预判:WA“抢班”,VLA“过渡”,不会并行太久
WA行动执行速度>VLA语言解释速度。当城市NOA接管里程从100km迈向500km,视觉-行为直接映射的延迟优势将放大,语言解释反而成为瓶颈。WA可把“高速、城市、泊车”拆成独立世界模型,按月/按功能收费,比VLA一次性收费更可持续。
L3准入需要“可解释”,但更需要“低延迟”,中国L3准入要求“可解释”,但更看重“系统响应时间”,WA的端到端低延迟更符合监管诉求。
小鹏把WA负责人推上1号位,蔚来三位自动驾驶核心离职,理想独自坚守VLA——这一幕像极了当年Mobileye与英伟达的GPU之争:前者强调规则的可解释,后者追求算力上限。如今,世界模型用“视觉即行为”的端到端,把语言中介彻底绕过。2025年,WA的“直接映射到行动”优势将被无限放大。或许,VLA不会消失,但终将退居“监管解释”的配角;WA才是量产智驾的终极答案。
哪个平台可以杠杆炒股提示:文章来自网络,不代表本站观点。