Helm.ai宣布推出VidGen-1 用于自动驾驶的最先进的生成式AI视频
盖世汽车讯 据外媒报道,为高级驾驶辅助系统(ADAS)、自动驾驶和机器人自动化提供先进人工智能(AI)软件的供应商Helm.ai宣布推出生成式AI模型VidGen-1,可生成高度逼真的驾驶场景视频序列,用于自动驾驶开发和验证,对于预测任务和生成式仿真都具有重要意义。

图片来源:Helm.ai
经过数千小时的各种驾驶视频训练,Helm.ai的生成式AI视频模型将创新的深度神经网络(DNN)架构与Deep Teaching(一种高效的无监督训练技术)相结合,创建出逼真的驾驶场景视频序列。这些视频的分辨率为384 x 640,可变帧速率高达每秒30帧,长度最长可达几分钟,可以在没有输入提示的情况下随机生成,
VidGen-1能够生成不同地理位置、多种摄像头和车辆视角的驾驶场景视频。该模型不仅可以生成高度逼真的外观和时间一致的物体运动,还可以学习和重现类似人类的驾驶行为,生成车辆本身和周围主体按照交通规则行事的运动。该模型模拟了全球多个城市各种场景的真实视频片段,涵盖城市和郊区环境、各种车辆、行人、自行车、十字路口、转弯、天气条件(例如雨、雾)、照明效果(例如眩光、夜间驾驶),甚至还有湿滑路面、反光建筑墙壁和自车引擎盖上的精确反射。
视频数据是自动驾驶中信息最丰富的传感方式,来自最具成本效益的传感器——摄像头。然而,视频数据的高维度使得人工智能视频生成成为一项具有挑战性的任务。在实现高水平的图像质量的同时,准确地模拟移动场景的动态,从而实现视频真实感,是视频生成应用中众所周知的难题。
Helm.ai首席执行官兼联合创始人Vladislav Voroninski表示:“我们在视频生成式AI方面取得了技术突破,开发出了VidGen-1,为自动驾驶领域树立了新标杆。将我们多年来一直在开发的深度教学技术与生成DNN架构方面的额外内部创新相结合,可以生成一种高效且可扩展的方法来制作逼真的AI生成视频。我们的技术是通用的,可以同样有效地应用于自动驾驶、机器人技术和任何其他视频生成领域,而无需进行任何更改。”
与传统的非人工智能仿真相比,VidGen-1为汽车制造商提供了显著的可扩展性优势,因为它能够快速生成资产,并让仿真中的代理具备复杂的现实行为。Helm.ai的方法不仅缩短了开发时间和成本,还有效地缩小了“仿真到现实”的差距,提供了一种高度逼真且高效的解决方案,大大拓宽了基于仿真的训练和验证的适用性。
“预测视频中的下一帧类似于预测句子中的下一个单词,但维度更高,”Voroninski补充道。“生成驾驶场景的逼真视频序列代表了自动驾驶最先进的预测形式,因为它需要准确地模拟现实世界的外观,并将意图预测和路径规划作为堆栈最高级别的隐式子任务。这种能力对于自动驾驶至关重要,因为从根本上说,驾驶就是预测接下来会发生什么。”
欢欢@盖世汽车供应链
悠悠@盖世汽车
豆豆@盖世汽车







