燕山大学 已有样品
更新于2024-07-29 14:36:38
本发明提供一种混合车队中基于强化学习控制策略的车辆控制方法,其包括:初始化混合车队,建立固定参考系和惯性参考系;建立惯性参考系中混合车辆纵向队列的模型;构造拉格朗日二次型队列跟驰代价函数,并得到Q值函数的表达式;对于由周围车辆对自身车辆影响所获得的信息,首先运用深度Q学习网络进行训练;然后运用DDPG算法进行参数的训练,若Q值函数和控制输入两个过程同时实现收敛,就完成对当下最优控制策略的求解;将最优控制策略输入混合车辆纵向队列的模型中,混合车队更新自身状态;循环往复,最终完成混合车队中车辆的控制任务。本发明系统解决了混合车队自主训练的问题。