基于RL-MPC的智能车辆轨迹跟踪横向控制策略*

doi:10.16731/j.cnki.1671-3133.2026.04.008

现代制造工程 ›› 2026, Vol. 547 ›› Issue (4): 61-69.doi: 10.16731/j.cnki.1671-3133.2026.04.008

基于RL-MPC的智能车辆轨迹跟踪横向控制策略^*

郝亮¹, 董耀付¹, 刘磊¹, 杨少华²

1 辽宁工业大学,锦州 121000;
2 中国人民解放军火箭军装备部驻呼和浩特地区军事代表室,呼和浩特 010000

收稿日期:2025-05-30 发布日期:2026-05-07
通讯作者: 郝亮,博士,教授,硕士研究生导师,主要研究方向为特种车辆系统动力学及控制、新能源汽车集成控制等。E-mail:hl867438249@126.com
作者简介:董耀付,硕士研究生,主要研究方向为智能网联汽车。刘磊,博士,教授,主要研究方向为智能控制与无人系统。E-mail:1183321896@qq.com
基金资助:
^*国家自然科学基金区域创新发展联合基金重点项目(U24A20283);辽宁省科技厅计划联合计划项目(技术攻关计划项目)(2024JH2/102600150);辽宁省科技厅成果转化类揭榜挂帅项目(2023JHI/11100003)

Lateral control strategy for intelligent vehicle trajectory tracking based on RL-MPC

HAO Liang¹, DONG Yaofu¹, LIU Lei¹, YANG Shaohua²

1 Liaoning University of Technology,Jinzhou 121000,China;
2 Military Representative Office of the Equipment Department of the Rocket Force of the Chinese People′s Liberation Army in Hohhot Area,Hohhot 010000,China

Received:2025-05-30 Published:2026-05-07

摘要/Abstract

摘要： 针对智能车辆在横向轨迹跟踪过程中难以兼顾轨迹跟踪精度和行驶稳定性的问题,提出了一种基于强化学习与模型预测控制(Reinforcement Learning with Model Predictive Control,RL-MPC)的智能车辆轨迹跟踪横向控制策略。首先,构建车辆系统动力学模型;然后,依托模型预测控制(Model Predictive Control,MPC)的滚动优化框架实时量化轨迹跟踪精度,同时构建奖励函数,实现控制策略的自主优化,并通过反馈校正模块修正预测偏差;最后,通过Matlab/Simulink软件搭建仿真模型,进行仿真实验,并将RL-MPC控制器与传统MPC控制器进行对比,实验结果表明,在不同工况下,相较传统MPC控制器,RL-MPC控制器对轨迹的跟踪效果更好,并且显著降低了横向轨迹跟踪误差,提升了行驶工况下的操纵稳定性。

关键词: 智能车辆, 轨迹跟踪, 横向控制, 模型预测控制, 强化学习

Abstract: To address the problem that intelligent vehicles struggle to balance trajectory tracking accuracy and driving stability during lateral trajectory tracking,a lateral control strategy for intelligent vehicle trajectory tracking based on Reinforcement Learning combined with Model Predictive Control (RL-MPC) is proposed. First,a vehicle system dynamics model is established. Then,relying on the receding horizon optimization framework of Model Predictive Control (MPC),the trajectory tracking accuracy is quantified in real time. Meanwhile,a reward function is constructed to realize the autonomous optimization of the control strategy,and a feedback correction module is used to correct the prediction deviation. Finally,a simulation model is built using Matlab/Simulink software for simulation tests,and the RL-MPC controller is compared with the traditional MPC controller. The experimental results show that under different working conditions,compared with the traditional MPC controller,the RL-MPC controller achieves better trajectory tracking performance,significantly reduces the lateral tracking error,and improves the handling stability under driving conditions.

Key words: intelligent vehicles, trajectory tracking, lateral control, Model Predictive Control (MPC), Reinforcement Learning (RL)

中图分类号:

U469

郝亮, 董耀付, 刘磊, 杨少华. 基于RL-MPC的智能车辆轨迹跟踪横向控制策略^*[J]. 现代制造工程, 2026, 547(4): 61-69.

HAO Liang, DONG Yaofu, LIU Lei, YANG Shaohua. Lateral control strategy for intelligent vehicle trajectory tracking based on RL-MPC[J]. Modern Manufacturing Engineering, 2026, 547(4): 61-69.

参考文献

[1] 陈慧岩,陈舒平,龚建伟. 智能汽车横向控制方法研究综述[J]. 兵工学报,2017,38(6):1203-1214.
[2] 郭景华,李克强,罗禹贡. 智能车辆运动控制研究综述[J]. 汽车安全与节能学报,2016,7(2):151-159.
[3] 马浩东. 基于深度强化学习的智能汽车路径规划研究[D].吉林:吉林化工学院,2024.
[4] 王毅,马臣斌. 基于模糊PID的无人驾驶车辆横向控制方法[J]. 公路与汽运,2024,40:4-11.
[5] 刘铭,冷搏,闻焕汐,等. 基于优化预瞄距离的无人驾驶车辆轨迹跟踪控制[J]. 同济大学学报(自然科学版),2024,52(S1):165-175.
[6] 张培培,杨自栋,赵相君. 基于滑膜控制的半挂汽车自动倒车路径跟踪[J]. 汽车实用技术,2021,46(2):31-34.
[7] 葛程,李伟东,黄振柱,等. 基于模糊终端滑模控制器的路径跟踪横向控制策略[J]. 大连理工大学学报,2024,64(4):376-383.
[8] 陈威,廖文浩,刘明春. 基于MPC的自动驾驶车辆横向路径跟踪控制[J]. 南昌大学学报(工科版),2020,42(3):279-288.
[9] YANG H J,HE Y Q,XU Y,et al. Collision Avoidance for Autonomous Vehicles Based on MPC With Adaptive APF[J]. Ieee Transactions on Intelligent Vehicles,2024,9(1):559-570.
[10] AMMOUR M,ORJUELA R,BASSET M. A MPC Combined Decision Making and Trajectory Planning for Autonomous Vehicle Collision Avoidance[J]. Ieee Transactions on Intelligent Transportation Systems,2022,23(12):24805-24817.
[11] JING Z Y,HUANG W,MA H. A tracking control method for collision avoidance trajectory of autonomous vehicle based on multi-constraint MPC[J]. International Journal of Vehicle Design,2021,86(1/2/3/4):106-123.
[12] ROKONUZZAMAN M,MOHAJER N,NAHAVANDI S. Effective adoption of vehicle models for autonomous vehicle path tracking:a switched MPC approach[J]. Vehicle System Dynamics,2023,61(5):1236-1259.
[13] GUO D,HE S L,JI S W. Intersection decision making for autonomous vehicles based on improved PPO algorithm[J]. Iet Intelligent Transport Systems,2024,18:2921-2938.
[14] 丛坤地. 基于强化学习和模型预测控制的无人车规划与跟踪研究[D].哈尔滨:哈尔滨工业大学,2024.
[15] 时高松,赵清海,董鑫,等. 基于PPO算法的自动驾驶人机交互式强化学习方法[J]. 计算机应用研究,2024,41(9):2732-2736.
[16] 汪洪波,王春阳,赵林峰,等. 基于强化学习的智能车辆路径跟踪变参数MPC多目标控制[J]. 中国公路学报,2024,37(3):157-169.

基于RL-MPC的智能车辆轨迹跟踪横向控制策略^*

Lateral control strategy for intelligent vehicle trajectory tracking based on RL-MPC

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

[1]	李恒强, 许恩永, 陈义时, 吴湘柠, 熊斯凯, 李希明, 蒙艳玫. 基于事件触发模型预测控制的分布式驱动汽车横纵向分层控制^*[J]. 现代制造工程, 2026, 545(2): 74-82.
[2]	刘本学, 左富豪, 张红军, 侯俊峰, 吴涛, 李霞. 基于多模型障碍物轨迹融合预测的自动驾驶横纵向联合运动规划算法^*[J]. 现代制造工程, 2026, 544(1): 74-86.
[3]	陈鹏宇, 孙有平, 李旺珍, 营江澎, 李松蔚. 基于四轮转向无人驾驶汽车的轨迹跟踪稳定性控制研究[J]. 现代制造工程, 2025, 539(8): 48-62.
[4]	牛强, 魏文军. 分布式驱动电车的多智能体协同驱动防滑控制[J]. 现代制造工程, 2025, 539(8): 63-70.
[5]	张宁宁, 万卫兵, 张梦晓, 赵宇明. 面向多目标动态作业车间调度的强化学习决策算法研究^*[J]. 现代制造工程, 2025, 538(7): 20-30.
[6]	金桥, 杨光锐, 王霄, 徐凌桦, 张芳. 基于A-TD3的码垛机器人轨迹规划^*[J]. 现代制造工程, 2025, 536(5): 42-52.
[7]	邢迪, 王红霞, 周奎, 张子越. 考虑道路曲率和车辆稳定性的4WID智能车辆轨迹跟踪控制研究^*[J]. 现代制造工程, 2025, 535(4): 98-108.
[8]	徐帅, 李艳武, 谢辉, 牛晓伟. 基于卷积金字塔网络的PPO算法求解作业车间调度问题^*[J]. 现代制造工程, 2025, 534(3): 19-30.
[9]	杨丹, 舒先涛, 余震, 鲁光涛, 纪松霖, 王家兵. 深度强化学习求解动态柔性作业车间调度问题^*[J]. 现代制造工程, 2025, 533(2): 10-16.
[10]	刘嘉成. 基于深度强化学习的晶圆分拣系统实时调度研究[J]. 现代制造工程, 2025, 541(10): 26-34.
[11]	杨逢海, 杨晓英, 裴志杰, 武亚琪, 张志伟. 基于深度强化学习的风电拉挤板生产智能排程^*[J]. 现代制造工程, 2025, 532(1): 23-32.
[12]	谢子健, 秦建军, 曹钰. 基于改进TD3的四足机器人非结构化地形运动控制^*[J]. 现代制造工程, 2025, 532(1): 33-41.
[13]	梁彪, 周德强, 盛卫锋, 左文娟, 何长江, 奚青, 陈曲燕. 基于分数阶滑模控制的AGV纠偏系统研究^*[J]. 现代制造工程, 2024, 527(8): 51-60.
[14]	和丽阳, 冯剑波, 王衍学, 陈洋. 基于MPC及改进ADRC的车辆自适应巡航控制研究^*[J]. 现代制造工程, 2024, 527(8): 95-101.
[15]	卢兵, 刘腾, 霍为炜. 基于强化学习的车队速度规划与能量管理联合优化^*[J]. 现代制造工程, 2024, 523(4): 80-86.