当前位置：首页 > article >正文

基于强化学习的多码头集卡路径优化

article 2025/4/2 8:48:56

基于强化学习的多码头集卡路径优化

Problem Description
Proposed method
- 状态设计
- 动作设计
- 奖励函数
- 深度Q网络
Experimental Results
Multi-Agent
- Agent1 设计
- Agent2 设计
- - State Representation
  - Actions
  - Rewards
结论
参考文献

Problem Description

问题定义：

问题类型： 同型车辆取送货问题（Homogeneous Vehicle Pickup and Delivery Problem, ITTRP）
考虑因素：
- 集卡工作时间的最大可用性
- 延迟订单的罚款
- 地点的时间窗
- 运输订单的截止日期

实验设置：

不包括外集卡： 提出的ITTRP版本不考虑外部集卡。
实验范围： 釜山新港（Busan New Port，BNP），拥有五个集装箱码头（PNIT、PNC、HJNC、HPNT、BNCT），决策期：24小时，即1440分钟

符号定义：

节点集合： $L$
集卡集合： $T$
客户集合： $C$
客户k的订单集合： $R^k$ ，其中 $k$ 是客户的索引。
所有订单集合： $\displaystyle O = \cup_{k \in C} R^k$
订单的起始码头： $o(j_i^k) \in L$
订单的目标码头： $d(j_i^k) \in L$
起始码头集合： $L^s$
目标码头集合： $L^d$
服务时间： 取货点 $S_{j_i^k,o(j_i^k)}$ 和送货点 $S_{j_i^k, d(j_i^k)}$ 的服务时间。
订单罚款： $\displaystyle pn_{j^k_i}$
截止日期： $dd_{j^k_i}$
集卡初始位置： $ip_t$
集卡最大工作时间： $mx_t$
集卡使用成本： $cs_t$
集卡小时成本： $hr_t$

目标函数：

最小化成本： 使用集卡的成本 $\displaystyle \min \left( \sum_{t\in T} x_t cs_t + \sum_{t\in T} tm_t hr_t + \sum_{o \in O} y_o pn_o\right)$
成本组成部分：
- 集卡使用成本： $\displaystyle \sum_{t \in T} x_t cs_t$
- 集卡工作时间成本： $\displaystyle \sum_{t \in T} tm_t hr_t$
- 订单延迟罚款： $\displaystyle \sum_{o \in O} y_o pn_o$

变量定义：

集卡是否被雇佣： $x_t = 1$ 如果集卡 $t$ 被雇佣，否则为

http://www.kler.cn/a/355320.html

相关文章：

SQL进阶技巧：如何删除第N次连续出现NULL值所存在的行？

linux git submodule 需要输入密码的问题

计算PSNR, SSIM, VAMF工具

网络攻击的新趋势：勒索软件与零日漏洞

单例模式（自动加载）

手机在网状态接口的使用和注意事项

Android常用界面控件——ImageView

新员工入职流程指南_完整入职流程解析

文心智能体：我的旅游小助手

代理IP在爬虫中的作用是什么？

机器学习导论

ORACLE 批量插入更新删除sql

FreeRTOS - 任务管理

解决 burp 抓取无用包的困扰

设计模式之委托模式

提高EDM广告发送率和到达率_实用技巧揭秘

GIT batch的支持中文的方法和系统建议

react项目，通过自定义 separator 属性来修改日期选择器中间的分隔符：

I.MX6U 的 EPIT 定时器详解

Scrapy的Lambda函数用法：简化数据提取与处理的技巧