txzhao / rl-zooLinks

PyTorch implementation of various reinforcement learning algorithms

☆18

Alternatives and similar repositories for rl-zoo

Users that are interested in rl-zoo are comparing it to the libraries listed below

Sorting:

Riashat / Bayesian-Exploration-Deep-RL
Bayesian Uncertainty Exploration in Deep Reinforcement Learning
☆18Updated 7 years ago
dtak / hip-mdp-public
Code for training and testing a Hidden Parameter Markov Decision Process, used to facilitate the transfer of learning
☆32Updated 7 years ago
jonasrothfuss / model_ensemble_meta_learning
Implementation of the Model-Based Meta-Policy-Optimization (MB-MPO) algorithm
☆44Updated 6 years ago
veronicachelu / meta-learning
Meta Reinforcement Learning Experiments
☆34Updated 7 years ago
TianhongDai / self-imitation-learning-pytorch
This is the pytorch implementation of ICML 2018 paper - Self-Imitation Learning.
☆66Updated 6 years ago
ermongroup / CalibratedModelBasedRL
Code for "Calibrated Model-Based Deep Reinforcement Learning", ICML 2019.
☆56Updated 6 years ago
kazizzad / BDQN-MxNet-Gluon
Efficient Exploration through Bayesian Deep Q-Networks
☆37Updated 7 years ago
davidsandberg / rl_ssms
State Space Models for Reinforcement Learning in Tensorflow
☆19Updated 6 years ago
rrti / maxq
hierarchical Q-learning implementation
☆11Updated 10 years ago
nosyndicate / pytorchrl
Deep Reinforcement Learning algorithms implemented in PyTorch
☆49Updated 7 years ago
wulfebw / hierarchical_rl
hierarchical deep reinforcement learning algorithms
☆41Updated 7 years ago
gd-zhang / ACKTR
Actor Critic using Kronecker-Factored Trust Region
☆19Updated 6 years ago
TomZahavy / CB_AE_DQN
Contextual Bandits Action Elimination DQN
☆21Updated 7 years ago
quanvuong / Supervised_Policy_Update
Code to reproduce Supervised Policy Update (ICLR 2019)
☆17Updated 2 years ago
pkumusic / E-DRL
Exploration Strategies for Deep Reinforcement Learning
☆39Updated 6 years ago
krasheninnikov / max-causal-ent-irl
Maximum Causal Entropy Inverse Reinforcement Learning
☆47Updated 6 years ago
EndingCredits / Neural-Episodic-Control
Implementation of Deepmind's Neural Episodic Control
☆58Updated 7 years ago
AdeelMufti / RL-RND
Full Chainer implementation of OpenAI's Reinforcement Learning using Random Network Distillation
☆31Updated 6 years ago
mcmachado / options
☆43Updated 8 years ago
0b01 / CommNet
PyTorch implementation of CommNet
☆36Updated 7 years ago
google-research / policy-learning-landscape
Explore the optimization landscape for direct policy learning reinforcement learning.
☆50Updated 6 years ago
facebookresearch / modeling_long_term_future
Code for ICLR 2019 paper Learning Dynamics Model by Incorporating the Long Term Future
☆50Updated 6 years ago
HumanCompatibleAI / population-irl
(Experimental) Inverse reinforcement learning from trajectories generated by multiple agents with different (but correlated) rewards
☆28Updated 6 years ago
AutumnWu / Streamlined-Off-Policy-Learning
ICRL 2020
☆19Updated 5 years ago
thanard / me-trpo
☆92Updated last year
facebookresearch / reward-estimator-corl
Reward Estimation for Variance Reduction in Deep Reinforcement Learning
☆22Updated 6 years ago
jachiam / surprise
Surprise-based intrinsic motivation for deep reinforcement learning
☆20Updated 8 years ago
aravindr93 / robustRL
Robust policy search algorithms which train on model ensembles
☆28Updated 8 years ago
ShangtongZhang / DistributedES
Distributed implementation of popular evolutionary methods
☆64Updated 7 years ago
sparisi / td-reg
TD-Regularized Actor-Critic Methods
☆36Updated 5 years ago