MIT发明人工智能控制系统 可帮助自主无人机在不确定的环境中保持航向
盖世汽车讯 一架自动无人机在内华达山脉运送水源,帮助扑灭一场野火时,可能会遭遇圣安娜(Santa Ana)旋风,使其偏离航线。如何在飞行中快速适应这些未知的干扰,对无人机的飞行控制系统来说是一个巨大的挑战。
据外媒报道,为了帮助这种无人机保持目标飞行,麻省理工学院(MIT)的研究人员开发出一种基于机器学习的新型自适应控制算法,该算法可以在阵风等不可预测的力量下,最大限度地减少无人机偏离预定轨迹的概率。相关研究论文发表在arXiv预印本服务器上。
图片来源: 麻省理工学院
与标准方法不同,这项新技术不需要自主无人机的编程人员事先了解这些不确定干扰的结构。相反,控制系统的人工智能模型会从15分钟的飞行时间收集的少量观测数据中学习所有需要的信息。重要的是,该技术会自动确定应使用哪种优化算法来适应干扰,从而提高跟踪性能。它会选择最适合该无人机所面临特定干扰几何形状的算法。
研究人员使用一种名为元学习(meta-learning)的技术训练控制系统同时完成这两件事,这种技术可以教会系统如何适应不同类型的干扰。
综合起来,这些因素使他们的自适应控制系统在模拟中实现了比基线方法减少50%的轨迹跟踪误差,并且在训练期间未见过的新风速下表现更佳。
未来,这种自适应控制系统可以帮助自主无人机在强风条件下更高效地运送重型包裹,或监测国家公园的火灾多发区域。
“这些组件的并行学习是我们方法的优势所在。通过利用元学习,我们的控制器可以自动做出最适合快速适应的选择,”麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)的Esther and Harold E. Edgerton助理教授、信息与决策系统实验室(LIDS)首席研究员、本文资深作者Navid Azizan说道。
与Azizan共同撰写该论文的还有航空航天系研究生Sunbochen Tang和电气工程与计算机科学系研究生Haoyuan Sun。
寻找合适的算法
通常,控制系统会包含一个对无人机及其环境进行建模的函数,并包含一些关于潜在扰动结构的现有信息。但在充满不确定性的现实世界中,通常不可能提前手动设计这种结构。
许多控制系统使用一种基于流行优化算法(称为梯度下降)的自适应方法来估计问题的未知部分,并确定如何使无人机在飞行过程中尽可能接近其目标轨迹。然而,梯度下降只是众多可供选择的算法(称为镜像下降)中的一种。
“镜像下降是一类通用算法,对于任何给定的问题,其中一种算法可能比其他算法更合适。关键在于如何选择最适合你问题的特定算法。在我们的方法中,我们实现了这一选择的自动化,”Azizan说道。
在他们的控制系统中,研究人员将包含潜在扰动结构的函数替换为一个神经网络模型,该模型可以学习从数据中近似这些扰动。这样,他们就不需要事先掌握无人机可能遇到的风速的先验结构。
他们的方法还使用一种算法,在从数据中学习神经网络模型的同时,自动选择正确的镜像下降函数,而不是假设用户已经选择了理想的函数。研究人员为该算法提供了一系列函数供其选择,并由其找到最适合当前问题的函数。
“选择一个好的距离生成函数来构建正确的镜像下降自适应算法,对于获得正确的算法以减少跟踪误差至关重要,”唐补充道。
学习适应
虽然无人机每次飞行时遇到的风速可能会发生变化,但控制器的神经网络和镜像函数应该保持不变,这样就无需每次都重新计算。
为了提高控制器的灵活性,研究人员采用了元学习技术,通过在训练过程中展示一系列风速组来教会它适应环境。
“我们的方法可以应对不同的目标,因为通过元学习,我们可以高效地从数据中学习出一个适用于不同场景的共享表征,”Tang解释说。
最后,用户向控制系统输入目标轨迹,它会实时地不断重新计算无人机应如何产生推力,使其尽可能接近该轨迹,同时适应其遇到的不确定干扰。
在仿真和实际实验中,研究人员表明,在他们测试的每种风速下,他们的方法都比基线方法的轨迹跟踪误差明显更小。
“即使风干扰比我们在训练期间遇到的要强得多,我们的技术仍然表明它能够成功应对,”Azizan补充道。
此外,随着风速的加剧,他们的方法优于基线方法的幅度也在扩大,这表明它能够适应具有挑战性的环境。
该团队目前正在进行硬件实验,以测试其控制系统在真实无人机上在不同风况和其他干扰条件下的表现。
研究人员还希望扩展他们的方法,使其能够同时处理来自多个来源的干扰。例如,风速的变化可能会导致无人机携带的包裹重量在飞行过程中发生变化,尤其是在无人机携带晃动有效载荷时。
他们还希望探索持续学习,使无人机能够适应新的干扰,而无需根据迄今为止的数据进行重新训练。