中国研究人员发明多目标深度强化学习策略为更安全环保的自动驾驶电动出行铺平道路-汽车资讯-盖世汽车社区

首页 > 资讯 > 新技术 > 中国研究人员发明多目标深度强化学习策略

中国研究人员发明多目标深度强化学习策略为更安全环保的自动驾驶电动出行铺平道路

盖世汽车刘丽婷 2026-03-05 14:28:44

盖世汽车讯电动汽车的快速发展以及自动驾驶技术的突破正在重塑未来交通运输，使其朝着更可持续的方向迈进。智能电动汽车，尤其是插电式混合动力汽车（PHEV），拥有巨大的潜力，可以通过更智能、更协调的运动和动力系统控制，大幅降低能耗和减少排放。然而，要同时实现安全性和卓越的能源效率仍然是一项挑战。传统方法通常将驾驶安全、环保轨迹规划和动力系统能量管理视为独立的任务，导致在复杂的实际驾驶场景中，各方面性能难以兼顾，从而限制了整体性能。

多目标.jpg

图片来源：期刊《Green Energy and Intelligent Transportation》

据外媒报道，为了弥合这一差距，中国研究人员推出了智能节能驾驶策略（Intelligent Eco-Driving Strategy，IEDS），这是一种基于精细化深度强化学习（DRL）的端到端自动驾驶解决方案。IEDS以多头深度Q网络（DQN）为核心，处理车辆自身状态、周围交通环境和路况等实时输入，同时生成关于变道、速度调整以及发动机和电动机之间扭矩分配的决策。

精心设计的多目标奖励函数指导学习过程，惩罚可能导致碰撞的危险操作，同时奖励平稳高效的驾驶行为，从而最大限度地减少燃油消耗。这种集成方法使系统能够在单一神经网络框架内平衡潜在的冲突优先级，使车辆能够在不依赖预定义驾驶循环或基于规则的启发式方法的情况下，避开动态障碍物并优化能量流。

大量的仿真实验证明了智能能量管理系统（IEDS）在高速公路场景中的有效性。该策略能够持续提供稳定、安全的驾驶体验，平均速度约为75公里/小时，单位油耗低于240克/（千瓦·小时），在最长180秒的评估窗口内，安全运行时间超过160秒。与基准方法相比，IEDS的避障能力提高了2.10%，节能性能提高了5.83%。

最引人注目的是，在各种随机驾驶条件下，IEDS实现了动态规划（DP）确定的理论最优能量管理性能的97.07%，远超对比策略的76.47%和91.72%。这些优势凸显了该系统能够在实时条件下产生接近最优结果的能力，同时确保驾驶安全性和舒适性，即使主要以20米/秒的参考速度进行训练，然后在不同速度下进行测试，也能保持这一优势。

其优势不仅限于实验室指标，更能切实影响社会和环境。通过使插电式混合动力汽车在不牺牲碰撞规避功能的前提下，更接近其理论节能极限运行，智能能量分配系统（IEDS）有助于显著降低智能车队的油耗和温室气体排放。其数据驱动的特性使其无需依赖人工制定的规则或特定的路线知识，从而能够适应各种不同的交通模式和路况。这种稳健性使该策略成为迈向可扩展的绿色自动驾驶出行的切实一步，并与全球可持续发展目标相契合。

展望未来，IEDS为更广泛的部署和完善开辟了充满希望的途径。未来的工作可以整合更多传感器模式，例如激光雷达或车联网通信，以进一步增强在恶劣天气或低能见度环境下的感知能力。将该框架扩展到交互更密集的城市环境，或将其与车网互动能源系统集成，有望释放新的效率潜力。实车测试和硬件在环验证将是至关重要的下一步，以确认仿真结果能否成功应用于实际平台，从而加速下一代智能电动汽车全面节能驾驶能力的普及。

本质上，这项研究代表着在基于DRL的统一控制器中，将安全、节能驾驶和能源管理整合起来的重大飞跃。通过在实现接近最优的能源性能和强大的避障能力的同时，IEDS解决了可持续自动驾驶广泛实现的关键障碍。随着智能电动汽车的日益普及，此类集成策略将在降低能源需求、减少排放以及推进未来更清洁、更安全的交通运输系统方面发挥越来越重要的作用。

中国研究人员发明多目标深度强化学习策略 为更安全环保的自动驾驶电动出行铺平道路

新闻分类

中国研究人员发明多目标深度强化学习策略为更安全环保的自动驾驶电动出行铺平道路