北理工开发SPOD高速方法无需图像皆即可检测多个物体-汽车资讯-盖世汽车社区

首页 > 资讯 > 新技术 > 北理工开发SPOD高速方法无需图像皆即可检

北理工开发SPOD高速方法无需图像皆即可检测多个物体

盖世汽车刘丽婷 2023-05-05 20:26:39

盖世汽车讯据外媒报道，北京理工大学研究人员宣布开发出新的高速方法：无图像单像素对象检测（SPOD）技术，可检测多个物体的位置、大小和类别，而无需获取图像或重建复杂的场景，且该技术可以实现80%以上的物体检测精度。由于大大降低了物体检测所需的计算能力，该方法可能有助于识别驾驶危险。相关论文已发表于期刊《Optics Letters》。

研.jpg

图片来源：期刊《Optics Letters》

该研究团队负责人边丽蘅表示：“我们的技术基于单像素检测器，可以直接从少量二维测量中实现高效、稳健的多目标检测。这种无图像感知技术有望解决现有视觉感知系统通信负荷大、计算开销大和感知率低的问题。”

此前，研究小组将无成像传感技术开发为高效场景感知技术，包括基于单像素检测器的无图像分类、分割和字符识别，而SPOD技术正是基于这些基础之上。

边教授表示：“对于自动驾驶，SPOD可以与激光雷达一起使用，以帮助提高场景重建速度和目标检测精度。我们相信，该方法具有足够高的自动驾驶检测率和准确率，同时也可降低物体检测所需的传输带宽和计算资源要求。”

无图像检测

自动化高级视觉任务——无论是用于导航车辆还是跟踪移动的飞机——通常需要场景的详细图像来提取识别物体所需的特征。然而，这需要复杂的成像硬件或复杂的重建算法，会导致计算成本过高、运行时间长和数据传输负载重。因此，传统的图像先、感知后的方法可能不是目标检测的最佳选择。

基于单像素检测器的无图像传感方法可以降低物体检测所需的计算能力。单像素成像不使用CMOS或CCD等像素化检测器，而是使用一系列结构光图案照亮场景，然后记录透射光强度以获取物体的空间信息。最后使用此信息来计算重建对象或计算其属性。

而对于SPOD，研究人员使用小型但经过优化的结构光图案快速扫描整个场景并获得2D测量值。这些测量值被输入到称为基于变换器的编码器的深度学习模型中，以提取场景中的高维有意义的特征。然后这些特征会被输入到基于多尺度注意力网络的解码器中，且该解码器可同时输出场景中所有目标的类别、位置和大小信息。

研究小组成员Lintao Peng表示：“与其他单像素检测方法使用的全尺寸图案相比，经过优化的小图案可产生更好的无图像传感性能。此外，SPOD解码器中的多尺度注意力网络加强了网络对场景中目标区域的注意力。这可以更有效地提取场景特征，实现最先进的物体检测性能。”

概念验证演示

为了通过实验证明SPOD，研究人员构建了一个概念验证设置。从Pascal Voc 2012测试数据集中随机选择图像，然后打印在胶片上并用作目标场景。当使用5%的采样率时，使用SPOD完成每个场景的空间光调制和无图像对象检测的平均时间仅为0.016秒。这比先执行场景重建（0.05秒）然后进行对象检测（0.018秒）要快得多。SPOD显示测试数据集中包含的所有对象类的平均检测精度为82.2%。

研2.jpg

图片来源：期刊《Optics Letters》

Peng表示：“目前，SPOD无法检测到所有可能的对象类别，因为用于训练模型的现有对象检测数据集仅包含80个类别。然而，当面临特定任务时，我们可以对预训练模型进行微调，以实现对行人、车辆或船只检测等应用的新目标类别的无图像多目标检测。”

接下来，研究人员计划将无图像感知技术扩展到其他探测器和计算采集系统，以实现无重建感知技术。

北理工开发SPOD高速方法 无需图像皆即可检测多个物体

新闻分类

北理工开发SPOD高速方法无需图像皆即可检测多个物体