—— 汽车产业链供需平台 ——
下载盖世APP

首页 > 资讯 > 新技术 > 美国研究人员开发MvACon技术 有望改善自动

美国研究人员开发MvACon技术 有望改善自动驾驶汽车的导航性能

盖世汽车 钟群 2024-06-17 18:18:20
分享

盖世汽车讯 据外媒报道,美国研究人员开发出多视角注意力语境化(MvACon, Multi-View Attentive Contextualization)技术,可使人工智能(AI)程序利用多个摄像头拍摄的2D图像更好地绘制3D空间地图。该技术可在有限的计算资源下有效工作,因此有望改善自动驾驶汽车的导航性能。

1.jpg

图片来源:North Carolina State University

相关论文的通讯作者、北卡罗莱纳州立大学(North Carolina State University)电气和计算机工程系副教授Tianfu Wu表示:“大多数自动驾驶汽车都使用强大的人工智能程序,即视觉转换器,来获取多个摄像头拍摄的2D图像,并创建车辆周围的3D空间地图。然而,尽管这些AI程序各自采取了不同的方法,但仍有很大的改进空间。”

Wu表示:“我们的技术被称为多视角注意力语境化(MvACon, Multi-View Attentive Contextualization),是一种即插即用的补充技术,可以与现有的视觉转换器AI结合使用,以提高它们绘制3D空间地图的能力。视觉转换器不会从摄像头中获得任何额外的数据,它们只是能够更好地利用这些数据。”

MvACon通过修改一种叫“Patch-to-Cluster attention(PaCa)”的方法(由Tianfu Wu及其合作者去年发布)来有效工作。PaCa使得转换器AI能更有效地识别图像中的物体。Wu表示:“这里的关键进展是将我们在PaCa中演示的技术应用于使用多个摄像头绘制3D空间地图的挑战中。”

为了测试MvACon的性能,研究人员将其与3种领先的视觉转换器——BEVFormer、BEVFormer-DFA3D版本和PETR——结合使用。在每种情况下,视觉转换器都从6个不同的摄像头收集2D图像。在这3种情况下,MvACon都显著提升了每个视觉转换器的性能。

Wu表示:“在定位物体以及物体的速度和方向方面,视觉转换器的性能得到了显著提升。将MvACon添加到视觉转换器中对计算需求的增加几乎可以忽略不计。我们下一步的工作包括根据额外的基准数据集测试MvACon,以及根据自动驾驶汽车的实际视频输入进行测试。如果MvACon的性能仍然优于现有的视觉转换器,那我们就可以乐观地认为它将被广泛采用。”

关注我们更多服务平台

添加社区公众号、小程序, APP, 随时随地云办公尽在掌握

联系我们
盖世汽车社区 盖世汽车中文资讯 盖世汽车会议 盖世汽车研究院 盖世大学堂 Automotive News Global Auto Sources 友情链接 Copyright@2007-2022 All Right Reserved.盖世汽车版权所有
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号 沪公网安备 31011402009699号 未经授权禁止复制或建立影像,否则将追究法律责任。