丰桥技术科学大学开发出新AI模型 可同时处理自动驾驶车辆感知和控制
盖世汽车讯 据外媒报道,丰桥技术科学大学(Toyohashi University of Technology)计算机科学工程系主动智能系统实验室(AISL)博士生Oskar Natan及其导师Jun Miura教授开发出可以同时处理自动驾驶车辆感知和控制的AI模型。
图片来源:丰桥技术科学大学
该AI模型通过完成多个视觉任务来感知环境,同时让车辆沿着一系列路线点行驶。该模型可以在各种场景下的各种环境条件下安全驾驶车辆。在点对点导航任务下进行评估时,该AI模型在标准模拟环境中实现了部分最新模型的最佳驾驶性能。
自动驾驶是一个复杂的系统,由多个处理多项感知和控制任务的子系统组成。然而,部署多个任务特定模块仍然需要大量配置来形成集成的模块化系统,因此成本高且效率低。
此外,集成过程可能会导致信息丢失,因为需要手动调整许多参数。但通过快速的深度学习研究,这一问题可以通过训练具有端到端和多任务方式的单个AI模型得到解决。因此,该模型可以仅基于一组传感器提供的信息来提供导航控制。 由于不再需要手动配置,该模型可以自行管理信息。
端到端模型的主要问题是如何提取有用信息,以便控制器能够正确估计导航控制。 通过向感知模块提供大量数据以更好地感知周围环境,端到端模型可实现有效提取有用信息。此外,由于传感器融合技术融合了不同传感器以捕获各种数据的能力,因此可用于增强性能。
然而,这也带来了巨大的计算负载,因此需要更大的模型来处理更多的数据。此外,数据预处理技术非常必要,因为不同传感器通常带有不同的数据模式。不仅如此,训练过程中的不平衡学习也可能会造成问题,因为模型会同时执行感知和控制任务。
为了应对这些挑战,该团队提出了一种经过端到端和多任务方式训练的AI模型。 该模型由两个主要模块组成,即感知模块和控制器模块。感知阶段首先处理由单个RGBD摄像头提供的RGB图像和深度图。
图片来源:丰桥技术科学大学
然后,控制器模块对从感知模块提取的信息以及车辆速度测量和路线点坐标进行解码,以估计导航控制。为了确保所有任务都能平等执行,该团队采用了一种称为修正梯度归一化(MGN)的算法来平衡训练过程中的学习信号。
该团队考虑模仿学习,因为该方法允许模型从大规模数据集中学习,以匹配接近人类的标准。此外,该团队设计模型使用更少的参数,从而减少计算负载并加速在资源有限的设备上的推理。
标准自动驾驶模拟器CARLA的实验结果表明,融合RGB图像和深度图以形成鸟瞰(BEV)语义图可以提高整体性能。由于感知模块对场景有更好的整体理解,控制器模块可以利用有用信息来正确估计导航控制。此外,该团队表示,所提出的模型更适合部署,因为与其他模型相比,该模型以更少的参数实现了更好的驾驶性能。
该团队目前正在对该模型进行修改和改进,以解决在夜间、大雨等光照条件差的情况下的驾驶问题。作为假设,该团队认为添加不受亮度或照度变化影响的传感器,例如LiDAR,将提高模型的场景理解能力,并带来更好的驾驶性能。另一个未来的任务是将提出的模型应用于现实世界中的自动驾驶。