Penn State：儿童视觉经验可能是更好的计算机视觉训练的关键-汽车资讯-盖世汽车社区

首页 > 资讯 > 新技术 > Penn State：儿童视觉经验可能是更好的计算

Penn State：儿童视觉经验可能是更好的计算机视觉训练的关键

盖世汽车刘丽婷 2024-06-04 10:22:49

盖世汽车讯据外媒报道，宾夕法尼亚州立大学（The Pennsylvania State University，Penn State）跨学科团队的研究表明一种新颖的、受人类启发的训练人工智能（AI）系统识别物体并导航周围环境的方法，可以为开发更先进的AI系统以探索极端环境或遥远世界奠定基础。

儿童.png

图片来源：宾夕法尼亚州立大学

在儿童在最初两年里所接触的物体和面孔相对较少，而视角和光照条件都不同。受这一发展洞察的启发，研究人员引入了一种新的机器学习方法，该方法利用有关空间位置的信息来更有效地训练AI视觉系统。

研究人员发现，用新方法训练的人工智能模型比基础模型高出14.99%。相关研究已发表于期刊《Patterns》。“目前人工智能的方法使用来自互联网的大量随机打乱的照片进行训练。相比之下，我们的策略是基于发展心理学的，该心理学研究儿童如何看待世界，”本文第一作者、宾夕法尼亚州立大学信息科学与技术学院博士生Lizhen Zhu表示。

研究人员开发了一种新的对比学习算法，这是一种自我监督学习方法，其中人工智能系统学习检测视觉模式，以识别两幅图像是否是同一基础图像的衍生品，从而产生正对。然而，这些算法通常将从不同角度拍摄的同一物体的图像视为单独的实体，而非正对。

研究人员表示，考虑到包括位置在内的环境数据，人工智能系统可以克服这些挑战，无论摄像头位置或旋转、照明角度或条件以及焦距或变焦如何变化，都能检测到正对。

“我们假设婴儿的视觉学习取决于位置感知。为了生成具有时空信息的以自我为中心的数据集，我们在ThreeDWorld平台中设置了虚拟环境，这是一个高保真、交互式的3D物理模拟环境。这使我们能够操纵和测量观看摄像头的位置，就像孩子在房子里走来走去一样，”Zhu补充道。

科学家创建了三个模拟环境——House14K、House100K和Apartment14K，其中“14K”和“100K”指的是在每个环境中拍摄的样本图像的大致数量。然后，研究人员通过模拟运行了基础对比学习模型和采用新算法的模型三次，以查看每个模型对图像的分类效果如何。该团队发现，在他们的算法上训练的模型在各种任务上都优于基础模型。

例如，在识别虚拟公寓房间的任务中，增强模型的平均准确率为99.35%，比基础模型提高了14.99%。“模型在新环境中使用少量数据进行学习总是很困难。我们的工作是首次尝试使用视觉内容进行更节能、更灵活的人工智能训练，”信息科学与技术杰出教授、Zhu的导师James Wang说道。

科学家们表示，这项研究对未来开发用于导航和从新环境中学习的先进人工智能系统具有重要意义。“凭借这种方法，资源有限的自主机器人团队或可学习如何在完全陌生的环境中导航，”Wang表示。“为了为未来的应用铺平道路，我们计划改进我们的模型，以更好地利用空间信息并融入更多样化的环境。”

Penn State：儿童视觉经验可能是更好的计算机视觉训练的关键

新闻分类