taoyafan / Master_Graduation_Project
硕士毕设,基于强化学习的足型机器人运动控制
☆10Updated 5 years ago
Related projects: ⓘ
- 白话强化学习与PyTorch的学习笔记☆31Updated 4 years ago
- 这是一个学习强化学习基础原理的仓库,主要包括了《深入浅出强化学习原理入门》书中一些例子和课后作业的代码☆252Updated 5 years ago
- 🚗自动驾驶AI小车,基于遗传算法优化神经网络 Auto driving AI-Car, based on Genetic Algorithm.☆10Updated 3 years ago
- 引用整理https://blog.csdn.net/yellow_red_people/article/details/80465510 一文中PyTorch平台,利用DQN模型玩Flappy Bird游戏,是一个再励学习(强化学习)实验例子。☆46Updated 5 years ago
- Alignment成为GPT类大模型微调的必须环节,深度强化学习是Alignment的核心。本项目是一个支持非gym环境训练、支持可视化配置的深度强化学习应用编程框架,30分钟上手强化学习编程。☆70Updated last year
- 一些利用pytorch编程实现的强化学习例子☆35Updated 5 years ago
- 《深度强化学习:原理与实践》,Code of the book <Deep Reinforcement Learning: Principles and Practices>☆148Updated 5 years ago
- [动手学强化学习]系列,基于pytorch。☆51Updated 3 years ago
- ☆384Updated 4 years ago
- 应用强化学习在复杂的交通环境下自动学习最佳驾驶策略的方案,在测试环境下准确率达到100%。☆20Updated 7 years ago
- 物流运输车辆调度☆27Updated 6 years ago
- cartpole的多种控制方法(强化学习、自适应pid、粒子群)☆17Updated 5 years ago
- 线性规划-单纯形算法☆26Updated 5 years ago
- The simulation module for AGV dispatching with ML approach (SVM and DQN).☆42Updated 5 years ago
- ☆45Updated 5 years ago
- ☆34Updated this week
- ☆20Updated 6 years ago
- 使用pytorch构建深度强化学习模型DQN☆23Updated 6 years ago
- Various global and local optimization algorithms, as well as many practical cases. Besides, this repository aslo uses common language an…☆162Updated 3 years ago
- Auto tuning of PID parameters of a quad-rotor using Q-learning☆18Updated 4 years ago
- 爬取高德地图数据并用dijkstra算法进行路径规划☆17Updated 4 years ago
- 使用遗传算法求解TSP和mTSP☆40Updated 6 years ago
- 我的强化学习笔记和学习材料 still updating ... ...☆335Updated 5 years ago
- JD 城市物流运输车辆智能调度☆98Updated 5 years ago
- shouyuantianxia / Algorithmic-Game-Theory-Application-on-Multi-agent-Combat-and-Verification-Platform-Design本科毕业设计:《多智能体博弈兵棋推演理论与验证平台设计》的源代码附录内容。强化学习算法的实现上参考了周沫凡先生的开源代码https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow☆44Updated 4 years ago
- 基于深度强化学习DQN的FlappyBird游戏AI开发☆11Updated 5 years ago
- 基于深度学习的共享单车预测与调度解决方案,使用神经网络构建单车需求量与时间段和地理画像的关联,预测不同区域单车需求量;使用蚁群算法规划最优单车调度路径。☆79Updated 5 years ago
- 强化学习相关知识的学习,Q学习和SARSA以及后面的DQN,有用到路径规划方面的,也有实际小迷宫的案例☆26Updated 5 years ago
- 基于改进型BP神经网络的PID控制系统☆44Updated 5 years ago
- 基于定向A*算法的多无人机航迹规划分步策略☆8Updated 6 years ago