taoyafan / Master_Graduation_Project
硕士毕设,基于强化学习的足型机器人运动控制
☆10Updated last month
Alternatives and similar repositories for Master_Graduation_Project:
Users that are interested in Master_Graduation_Project are comparing it to the libraries listed below
- Alignment成为GPT类大模型微调的必须环节,深度强化学习是Alignment的核心。本项目是一个支持非gym环境训练、支持可视化配置的深度强化学习应用编程框架,30分钟上手强化学习编程。☆72Updated last year
- 一些利用pytorch编程实现的强化学习例子☆35Updated 5 years ago
- 这是一个学习强化学习基础原理的仓库,主要包括了《深入浅出强化学习原理入门》书中一些例子和课后作业的代码☆256Updated 6 years ago
- 使用pytorch构建深度强化学习模型DQN☆24Updated 7 years ago
- [动手学强化学习]系列,基于pytorch。☆54Updated 3 years ago
- 用强化学习来玩微信跳一跳☆18Updated 7 years ago
- cartpole的多种控制方法(强化学习、自适应pid、粒子群)☆17Updated 6 years ago
- 引用整理https://blog.csdn.net/yellow_red_people/article/details/80465510 一文中PyTorch平台,利用DQN模型玩Flappy Bird游戏,是一个再励学习(强化学习)实验例子。☆47Updated 5 years ago
- Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow☆28Updated 5 years ago
- Stable Baselines官方文档中文版☆94Updated 3 years ago
- 白话强化学习与PyTorch的学习笔记☆33Updated 4 years ago
- 学习强化学习过程中的笔记和代码☆9Updated 4 years ago
- 基于改进型BP神经网络的PID控制系统☆48Updated 6 years ago
- 应用强化学习在复杂的交通环境下自动学习最佳驾驶策略的方案,在测试环境下准确率达到100%。☆19Updated 7 years ago
- 强化学习面试(未完待续)☆32Updated 5 years ago
- 《深度强化学习:原理与实践》,Code of the book <Deep Reinforcement Learning: Principles and Practices>☆161Updated 5 years ago
- 强化学习-中文笔记&资源-以python实例为主-由浅入深☆92Updated 4 years ago
- 《强化学习-原理与Python实现》的Pytorch实现。☆55Updated 4 years ago
- Python版本 盖尔-沙普利算法:为了寻找一个稳定匹配而设计出的市场机制,对于市场的一方A有m个对象 另一方市场B有n个对象,A中的每个人会对B中的人有一个好感度排名,B也会有相应的排名 市场一方的对象 Ai,i=1,2,...,m 向另一方的对象 Bj,j=1,2…☆9Updated 5 years ago
- 强化学习经典算法(offline\online learning, q-learning, DQN)的实现在平衡杆游戏和几个Atari 游戏 (CartPole\Pong\Boxing\MsPacman)☆28Updated 6 years ago
- 基于Deep Qlearning Network的股票交易模型☆55Updated 7 years ago
- 用 qlearning 算法走迷宫☆49Updated 6 years ago
- Pytorch for Deep Reinforcement Learning☆243Updated 4 years ago
- 在PyTorch上重构multi-agent deep deterministic policy gradient(MADDPG),将https://github.com/xuemei-ye/maddpg-mpe 修改到自己电脑上可运行。因为本人笔记本没有CUDA,实验速度…☆13Updated 5 years ago
- ☆20Updated 6 years ago
- Re-produce DQN, REINFORCE, REINFORCE with baseline, one-step AC, QAC, QAC with shared network, PPO2, DDPG, TD3, SAC, SAC discrete,A2C,A3C☆19Updated 4 years ago
- Reinforcement Learning Algorithms Based on PyTorch☆18Updated 2 years ago
- 多智能体强化学习☆87Updated 6 years ago
- RL-code for beginners. Enjoying!☆110Updated 4 years ago
- ☆45Updated 5 years ago