当前位置: 首页 > article >正文

单智能体carla强化学习实战工程介绍

有三个工程:
在这里插入图片描述
Ray_Carla: 因为有的论文用多进程训练强化学习,包括ray分布式框架等,这里直接放了一个ray框架的示例代码,是用sac搭建的,obs没用图像,是数值状态向量值(速度那些)。
在这里插入图片描述

Ray_Carla只有v1.0一个更新版本,当然,后续更新可能会增加v2.0,v3.0…,依此类推。

Carla_DRL: 单进程的RL的训练版本之一,目前主要包括三个场景,点到点导航,鬼探头,急刹车,其他场景都可以自行创建。算法包括:PPO,DQN和SAC,这里只有PPO用了视觉图像(用的语义分割图像),训练效果还算可以,但是此种方法需要先训练vae编码器,只用cnn网络处理图像是训不出来的。而vae编码器有个问题,就是出现均值方差为None。
在这里插入图片描述

目前Carla_DRL有三个版本,v3.0是最新的,点进去可以看到代码,下载或者git clone,当然,后续更新可能会增加v4.0,v5.0…,依此类推。

Carla_Deepmdp_RL: 单进程的RL的训练版本之一,目前主要包括2个场景,高速公路和鬼探头,其他场景都可以自行创建。这个deepmdp的目的,就是解决Carla_DRL中,sac等算法不加vae直接输入原始图像无法训练出很好的拟合效果的问题,所以加了一个deepmdp+sac算法的工程,这个工程可以用来跑顶会论文的baseline。理论上,后续的ddpg等新的rl算法都可以在deepmdp基础上加。

在这里插入图片描述

Carla_Deepmdp_RL只有v1.0一个更新版本,当然,后续更新可能会增加v2.0,v3.0…,依此类推。


http://www.kler.cn/a/377550.html

相关文章:

  • 【云备份项目】json以及jsoncpp库的使用
  • unity3d————叉乘的知识点
  • Openlayers高级交互(18/20):根据feature,将图形适配到最可视化窗口
  • 【jvm】如何设置新生代和老年代的比例
  • 数字信号处理Python示例(5)使用实指数函数仿真PN结二极管的正向特性
  • ICPC区域赛成都站【赛后回顾+总结】
  • 使用Django REST framework构建RESTful API
  • 【React 轮子】文本溢出后显示展开/收起按钮
  • java jsoup解析豆瓣电影数据html实战教程
  • Linux云计算 |【第五阶段】CLOUD-DAY5
  • 2.WebSocket进阶: 深入探究实时通信的最佳实践与优化技巧
  • Rust 力扣 - 1652. 拆炸弹
  • 深入理解跨域资源共享(CORS)安全问题原理及解决思路
  • C++编程法则365天一天一条(27)std::initializer_list 轻量级初始化列表
  • OKHTTP断点续传
  • 【运输&加载码头】仓库新卸物料检测系统源码&数据集全套:改进yolo11-DRBNCSPELAN
  • 利用Docker Compose构建微服务架构
  • 90%的读者都惊呆了!一键生成的微头条,连作者都认不出来是AI作品?
  • Linux常见指令大全(必要+知识点)
  • 设计模式08-行为型模式(命令模式/迭代器模式/观察者模式/Java)
  • 免公网服务器实现DDNS功能(API动态修改DNS解析IP)
  • webstorm 项目如何配置支持 nodejs
  • 怎么提取视频里的音频?关于提取视频里音频的几种方法
  • 【含文档】基于ssm+jsp的老年人健康管理系统(含源码+数据库+lw)
  • 移植 AWTK 到 纯血鸿蒙 (HarmonyOS NEXT) 系统 (4) - 平台适配
  • 计算机视觉和深度学习有什么区别