强化学习动态路径规划降低建筑构件运输的研究与应用

强化学习动态路径规划降低建筑构件运输的研究与应用

Authors

  • 朱帅 潍坊科技学院
  • 林士飏 潍坊科技学院

DOI:

https://doi.org/10.70693/cjst.v1i1.723

Keywords:

建筑构件; 运输路径; 容量约束; 强化学习

Abstract

建筑构件运输过程的容量约束与路径优化问题相互交织,形成一个复杂的耦合难题。针对这一难题,本文深入研究基于Q-learning算法动态路径规划在建筑构件运输的应用。为了引导算法朝着更优的路径决策方向学习,设计基于距离惩罚的奖励函数。通过这种方式,奖励算法在不断的学习过程中,逐渐探索出成本更低、效率更高的运输路线,并以仿真验证该方法的有效性和优越性。仿真结果显示,与传统算法相比,强化学习Q-learning算法能降低19.49%的运输距离,缩短0.11%运输成本。这使得建筑构件能够以成本更低,速度更快的方式送达施工地点,有效提高了施工效率,实现运输路径的优化,为建筑构件运输领域提供了一种切实可行且高效的解决方案,具有广阔的应用前景和推广价值。

References

Zhou H, Li Y, Ma C, et al. Modular vehicle routing problem: Applications in logistics[J]. Transportation Research Part E, 2025, 197104022-104022. DOI: https://doi.org/10.1016/j.tre.2025.104022

徐伟华, 邱龙龙, 张根瑞, 等. 求解带容量约束车辆路径问题的改进遗传算法[J]. 计算机工程与设计, 2024, 45 (03): 785-792.

Khallaf N, Rouf E A O, Algarni D A, et al. Enhanced vehicle routing for medical waste management via hybrid deep reinforcement learning and optimization algorithms[J]. Frontiers in Artificial Intelligence, 2025, 81496653-1496653. DOI: https://doi.org/10.3389/frai.2025.1496653

Meng W, He Y, Zhou Y. Q-Learning-Driven Butterfly Optimization Algorithm for Green Vehicle Routing Problem Considering Customer Preference[J]. Biomimetics, 2025, 10 (1): 57-57. DOI: https://doi.org/10.3390/biomimetics10010057

张传伟, 芦思颜, 秦沛霖, 等. 融合简化可视图和A*算法的矿用车辆全局路径规划算法[J]. 工矿自动化, 2024, 50 (10): 12-20. DOI: https://doi.org/10.12677/ds.2024.1012468

王景存, 张晓彤, 陈彬, 等. 一种基于Dijkstra算法的启发式最优路径搜索算法[J]. 北京科技大学学报, 2007, (03): 346-350.

辜勇, 刘迪. 自适应混合蚁群算法求解带容量约束车辆路径问题[J]. 东北大学学报(自然科学版), 2023, 44 (12): 1686-1695+1704.

刘祥坤, 李万龙, 李东升, 等. 基于改进遗传算法求解容量约束车辆路径问题[J]. 长春工业大学学报, 2023, 44 (03): 254-261.

付梦印, 李杰, 邓志红. 限制搜索区域的距离最短路径规划算法[J]. 北京理工大学学报, 2004, (10): 881-884.

Rahman H M, Menezes C B, Amin A M. Determination of optimal depot location for a capacitated vehicle routing problem (CVRP) based on gross vehicle weight[J]. International Journal of Systems Science: Operations & Logistics, 2024, 11 (1). DOI: https://doi.org/10.1080/23302674.2024.2339385

Chen J, Jiang Y, Pan H, et al. Path Planning in Complex Environments Using Attention-Based Deep Deterministic Policy Gradient[J]. Electronics, 2024,13 (18): 3746-3746. DOI: https://doi.org/10.3390/electronics13183746

何封. 基于强化学习的运输路径优化问题求解[D]. 西安电子科技大学, 2023.

Bäumler A, Benterki A, Meng J, et al. Energy management strategies based on soft actor critic reinforcement learning with a proper reward function design based on battery state of charge constraints[J]. Journal of Energy Storage, 2024, 90 (PA). DOI: https://doi.org/10.1016/j.est.2024.111797

江明, 何韬. 基于深度强化学习的带容量约束车辆路径问题求解[J/OL]. 系统仿真学报, 1-10 [2025-03-16].

刘全, 翟建伟, 章宗长, 等. 深度强化学习综述[J]. 计算机学报, 2018, 41 (01): 1-27.

刘明洋. 大规模车辆路径问题的深度强化学习算法研究[D]. 大连海事大学, 2022.

牛鹏飞, 王晓峰, 芦磊, 等. 强化学习在车辆路径问题中的研究综述[J]. 计算机工程与应用, 2022, 58 (01): 41-55.

周鲜成, 王莉, 周开军, 等. 动态车辆路径问题的研究进展及发展趋势[J]. 控制与决策, 2019, 34 (03): 449-458.

杨丹. 动态车辆路径问题的算法设计与系统实现[D]. 哈尔滨工业大学, 2016.

靳康飞, 闫军, 梁云涛. 容量约束的车辆路径问题研究现状综述[J]. 甘肃科技纵横, 2022, 51 (10): 52-56+16.

张景玲, 冯勤炳, 赵燕伟, 等. 基于强化学习的超启发算法求解有容量车辆路径问题[J]. 计算机集成制造系统, 2020, 26 (04): 1118-1129.

马朋委. Qlearning强化学习算法的改进及应用研究[D]. 安徽理工大学, 2016.

高阳, 陈世福, 陆鑫. 强化学习研究综述[J]. 自动化学报, 2004, (01): 86-100.

赵英男. 基于强化学习的路径规划问题研究[D]. 哈尔滨工业大学, 2017.

Niu Y, Wang S, He J, et al. A novel membrane algorithm for capacitated vehicle routing problem[J]. Soft Computing, 2015, 19 (2): 471-482. DOI: https://doi.org/10.1007/s00500-014-1266-0

丁伟(Sefa Vidinlioglu). 用遗传算法求解应急物流中有容量约束的车辆路径问题[D]. 华中科技大学, 2013.

Wang C, Jin C, Han J. A multistage algorithm for multi-objective joint optimization of loading problem and capacitated vehicle routing problem[J]. ICIC Express Letters, Part B: Applications, 2014, 5 (5): 1453-1459.

朱加园. 物流配送车辆路径问题建模及多目标优化算法研究[D]. 沈阳建筑大学, 2014.

蔡海鸾. 惩罚函数法在约束最优化问题中的研究与应用[D]. 华东师范大学, 2015.

杨娟, 郭海湘, 杨文霞, 等. 基于MATLAB的GUI设计车辆路径问题的仿真优化平台[J]. 系统仿真学报, 2012, 24 (03): 722-727. DOI: https://doi.org/10.12677/SG.2013.33011

Laporte G. What you should know about the vehicle routing problem[J]. Naval Research Logistics (NRL), 2007, 54 (8): 811-819. DOI: https://doi.org/10.1002/nav.20261

李琛, 李茂军, 杜佳佳. 一种强化学习行动策略ε-greedy的改进方法[J]. 计算技术与自动化, 2019, 38 (02): 141-145.

Downloads

Published

2025-04-12

How to Cite

朱帅, & 林士飏. (2025). 强化学习动态路径规划降低建筑构件运输的研究与应用. 中国科学与技术学报, 1(1), 56–72. https://doi.org/10.70693/cjst.v1i1.723
Loading...