美国研究人员开发MvACon技术 有望改善自动驾驶汽车的导航性能
盖世汽车讯 据外媒报道,美国研究人员开发出多视角注意力语境化(MvACon, Multi-View Attentive Contextualization)技术,可使人工智能(AI)程序利用多个摄像头拍摄的2D图像更好地绘制3D空间地图。该技术可在有限的计算资源下有效工作,因此有望改善自动驾驶汽车的导航性能。

图片来源:North Carolina State University
相关论文的通讯作者、北卡罗莱纳州立大学(North Carolina State University)电气和计算机工程系副教授Tianfu Wu表示:“大多数自动驾驶汽车都使用强大的人工智能程序,即视觉转换器,来获取多个摄像头拍摄的2D图像,并创建车辆周围的3D空间地图。然而,尽管这些AI程序各自采取了不同的方法,但仍有很大的改进空间。”
Wu表示:“我们的技术被称为多视角注意力语境化(MvACon, Multi-View Attentive Contextualization),是一种即插即用的补充技术,可以与现有的视觉转换器AI结合使用,以提高它们绘制3D空间地图的能力。视觉转换器不会从摄像头中获得任何额外的数据,它们只是能够更好地利用这些数据。”
MvACon通过修改一种叫“Patch-to-Cluster attention(PaCa)”的方法(由Tianfu Wu及其合作者去年发布)来有效工作。PaCa使得转换器AI能更有效地识别图像中的物体。Wu表示:“这里的关键进展是将我们在PaCa中演示的技术应用于使用多个摄像头绘制3D空间地图的挑战中。”
为了测试MvACon的性能,研究人员将其与3种领先的视觉转换器——BEVFormer、BEVFormer-DFA3D版本和PETR——结合使用。在每种情况下,视觉转换器都从6个不同的摄像头收集2D图像。在这3种情况下,MvACon都显著提升了每个视觉转换器的性能。
Wu表示:“在定位物体以及物体的速度和方向方面,视觉转换器的性能得到了显著提升。将MvACon添加到视觉转换器中对计算需求的增加几乎可以忽略不计。我们下一步的工作包括根据额外的基准数据集测试MvACon,以及根据自动驾驶汽车的实际视频输入进行测试。如果MvACon的性能仍然优于现有的视觉转换器,那我们就可以乐观地认为它将被广泛采用。”
欢欢@盖世汽车供应链
悠悠@盖世汽车
豆豆@盖世汽车







