JM-Kim-94 / rl-pendulumLinks

Open AI Gym - Pendulum-v1 reinforcement learning (DQN, SAC)

☆18

Alternatives and similar repositories for rl-pendulum

Users that are interested in rl-pendulum are comparing it to the libraries listed below

Sorting:

alirezakazemipour / SAC
Implementation of Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor.
☆28Updated last month
datvodinh / recurrent-ppo
A Reinforcement Learning Project using PPO + LSTM
☆82Updated last year
katetolstaya / multiagent_gnn_policies
Learning multi-agent policies for flocking using graph neural networks
☆76Updated 2 years ago
GiovaniCenta / Pareto-Deep-Q-Networks
Implementation of Pareto Deep Q Networks in a multi-objective Gym Reinforcement Learning Environment
☆16Updated 2 years ago
marek-robak / Drone-2d-custom-gym-env-for-reinforcement-learning
OpenAI Gym environment designed for training RL agents to control the flight of a two-dimensional drone.
☆52Updated 3 years ago
LinghengMeng / LSTM-TD3
The implementation of LSTM-TD3.
☆81Updated 2 years ago
MarcoMeter / recurrent-ppo-truncated-bptt
Baseline implementation of recurrent PPO using truncated BPTT
☆148Updated last year
XinJingHao / SAC-Continuous-Pytorch
a clean and robust Pytorch implementation of SAC on continuous action space
☆81Updated 2 months ago
lok-i / DRLPathPlanner
-A framework for path-planing and obstacle avoidance using Deep Reinforcement Learning Techniques
☆32Updated 4 years ago
keep9oing / DRQN-Pytorch-CartPole-v1
Deep recurrent Q learning on CartPole-v1 environment
☆91Updated last year
jianzhnie / deep-marl-toolkit
MARLToolkit: The Multi-Agent Rainforcement Learning Toolkit. Include implementation of MAPPO, MADDPG, QMIX, VDN, COMA, IPPO, QTRAN, MAT..…
☆139Updated last year
TJU-DRL-LAB / Multiagent-RL
The official code releasement of publications in MARL field of TJU RL lab.
☆79Updated 2 years ago
DanieleGammelli / gnn-rl-for-amod
Official implementation of "Graph Neural Network Reinforcement Learning for Autonomous Mobility-on-Demand
☆78Updated 4 years ago
williamyuanv0 / Transformer-in-Reinforcement-Learning-for-Decision-Making-A-Survey
Transformer in RL for decision-making
☆96Updated 2 years ago
Felhof / DiscreteSAC
☆40Updated 3 years ago
christinakouridi / multiagent_gym
Adaptation of DQN, DDQN and COMA for multi-agent Gym environments
☆12Updated last year
indigoLovee / TD3
TD3 in Pytorch
☆34Updated 3 years ago
nsidn98 / InforMARL
Code for our paper: Scalable Multi-Agent Reinforcement Learning through Intelligent Information Aggregation
☆115Updated 5 months ago
XinJingHao / TD3-Pytorch
A clean and robust Pytorch implementation of TD3 on continuous action space
☆30Updated last year
RvuvuzelaM / self-attention-ppo-pytorch
I used this paper as inspiration https://arxiv.org/pdf/1904.03367.pdf
☆35Updated 2 years ago
akjayant / PPO_Lagrangian_PyTorch
Implementation of PPO Lagrangian in PyTorch
☆49Updated 2 years ago
Kirili4ik / HRL-taxi
Solution for Taxi env using HRL (Hierarchical reinforcement learning) (2018)
☆21Updated 5 years ago
uoe-agents / robotic-warehouse
Multi-Robot Warehouse (RWARE): A multi-agent reinforcement learning environment
☆66Updated 9 months ago
araffin / rl-handson-rlvs21
Stable-Baselines3 (SB3) reinforcement learning tutorial for the Reinforcement Learning Virtual School 2021.
☆54Updated 2 years ago
catezi / MAPT
This is the official code repository for the paper "Decoding Global Preferences: Temporal and Cooperative Dependency Modeling in Multi-Ag…
☆10Updated 4 months ago
zrc0622 / HIRL4UCAV
The implementation of "An Imitative Reinforcement Learning Framework for Autonomous Dogfight"
☆28Updated 3 months ago
XinJingHao / DDPG-Pytorch
A clean Pytorch implementation of DDPG on continuous action space.
☆20Updated last year
BY571 / Normalized-Advantage-Function-NAF-
PyTorch implementation of the Q-Learning Algorithm Normalized Advantage Function for continuous control problems + PER and N-step Method
☆29Updated 4 years ago
Jonathan-Pearce / transfer_learning_rl
Transfer learning in deep reinforcement learning for continuous control. Implemented DDPG and TD3 algorithms and evaluated ability to ada…
☆16Updated 4 months ago
chauncygu / Multi-Agent-Constrained-Policy-Optimisation
Multi-Agent Constrained Policy Optimisation (MACPO; MAPPO-L).
☆179Updated last year