法雷奥与NATIX合作构建开源多摄像头世界基础模型
盖世汽车讯 1月22日,汽车技术公司法雷奥(Valeo)与全球摄像头分布式物理基础设施网络(decentralized physical infrastructure network,DePIN)提供商NATIX Network宣布建立合作伙伴关系,共同构建规模最大的开源多摄像头世界基础模型(WFM)。

图片来源: 法雷奥
自动驾驶和机器人技术的飞速发展,以及对多样化、高质量真实世界数据日益增长的需求,正在创造新的可能性。通过结合法雷奥在世界模型方面的专业知识和NATIX的分布式360°真实世界数据网络,双方将构建一个能够学习、预测和推理真实世界运动和交互的开源世界模型。
“自2018年成立以来,法雷奥人工智能研究中心一直处于汽车行业人工智能研究的前沿,尤其是在辅助驾驶和自动驾驶领域。我们的目标始终是安全负责地推进智能出行发展,”法雷奥脑机接口事业部首席执行官Marc Vrecko表示。“通过将法雷奥在生成式世界建模方面的研究专长与NATIX的全球多摄像头数据相结合,我们正在加速提升下一代端到端人工智能模型的质量和可及性,使研究人员能够基于强大的开放模型进行开发。”
“世界模型是千载难逢的机遇——类似于2017年至2020年间LLM的崛起,”NATIX首席执行官兼联合创始人Alireza Ghods表示。“构建首批可扩展世界模型的团队将定义下一波人工智能浪潮的基础:物理人工智能。凭借我们分布式的多摄像头网络,NATIX拥有比大型OEM厂商更快的明显优势。”
面向开放获取的真实世界建模的新基础
为了构建能够在物理世界中运行的自主系统,机器必须学习理解四维环境,即空间和时间。世界基础模型(WFM)将生成式人工智能的边界从文本扩展到真实世界,使系统能够在物理环境中进行推理、预测未来状态并采取行动。
与现有的仅感知模型不同,多摄像头世界模型不仅能够预测当前正在发生的事情,还能预测接下来将要发生的事情。Valeo-NATIX方法基于持续采集的真实世界多摄像头数据,使人工智能能够从真实的极端案例中学习,并加速自主系统的安全部署。
法雷奥与NATIX合作开发的方案基于开源框架,将公开发布模型、数据集和训练工具,使开发者能够微调世界模型,并针对不同地区和驾驶条件对物理人工智能进行基准测试。该合作基于法雷奥的视频自回归模型(Video Autoregressive Model,VaViM)和视频-动作模型(Video- Action Model,VaVAM)这两个开源框架,它们主要基于前置摄像头视频进行训练,并包含大规模在线数据集。NATIX 的多摄像头网络对此进行了补充,该网络在7个月内收集了超过10万小时的多摄像头驾驶数据(60万小时的视频数据),并持续从美国、欧洲和亚洲的真实车辆中采集此类数据。将世界模型从前置摄像头输入扩展到多摄像头输入,使人工智能能够获得与自动驾驶汽车和机器发人实际应用相同的完整空间感知能力。
欢欢@盖世汽车供应链
悠悠@盖世汽车
豆豆@盖世汽车







