lcalem / reproduction-soft-qlearning-mutual-informationLinks

Reproduction of the paper "Soft Q-Learning with Mutual Information Regularization" CoRL 2019.

☆10

Alternatives and similar repositories for reproduction-soft-qlearning-mutual-information

Users that are interested in reproduction-soft-qlearning-mutual-information are comparing it to the libraries listed below

Sorting:

tdavchev / option-critic
A Tensorflow implementation of the Option-Critic Architecture
☆71Updated 8 years ago
schroederdewitt / mackrl
Code for Multi-Agent Common Knowledge Reinforcement Learning (NeurIPS 2019)
☆33Updated 5 years ago
veronicachelu / temporal_abstraction
Option Critic with subgoal discovery by spectral decomposition of the Successor Features Matrix or clustering in Successor features space…
☆23Updated 6 years ago
arushijain94 / SafeOptionCritic
Safe Option-Critic: Learning Safety in the Option-Critic Architecture
☆20Updated 6 years ago
dnddnjs / feudal-montezuma
Pytorch implementation of "FeUdal Networks for Hierarchical Reinforcement Learning" for Montezuma's Revenge
☆96Updated 2 years ago
011235813 / SEPT
Single Episode Policy Transfer in Reinforcement Learning
☆17Updated 3 years ago
wendelinboehmer / dcg
☆76Updated last year
mcmachado / count_based_exploration_sr
☆31Updated 6 years ago
Hwhitetooth / lirpg
☆61Updated 7 years ago
jeanharb / a2oc_delib
A3C style Option-Critic with deliberation cost
☆39Updated 7 years ago
RomainLaroche / SPIBB
Safe Policy Improvement with Baseline Bootstrapping
☆26Updated 5 years ago
florensacc / snn4hrl
Stochastic Neural Networks for Hierarchical Reinforcement Learning
☆96Updated 7 years ago
apsdehal / ic3net-envs
Environments with IC3Net paper
☆13Updated 6 years ago
behaviorguidedRL / BGRL
Open source demo for the paper Learning to Score Behaviors for Guided Policy Optimization
☆24Updated 5 years ago
ruizhaogit / mep
Maximum Entropy-Regularized Multi-Goal Reinforcement Learning (ICML 2019)
☆24Updated 6 years ago
RLAgent / state-marginal-matching
Efficient Exploration via State Marginal Matching (2019)
☆69Updated 6 years ago
llan-ml / tesp
Implementation of our paper "Meta Reinforcement Learning with Task Embedding and Shared Policy"
☆34Updated 6 years ago
alversafa / option-critic-arch
Implementation of the Option-Critic Architecture
☆39Updated 6 years ago
YuhangSong / DEHRL
Diversity−Driven Extensible Hierarchical Reinforcement Learning. AAAI 2019.
☆50Updated 6 years ago
davidbrandfonbrener / onestep-rl
☆41Updated 3 years ago
thanard / me-trpo
☆92Updated last year
zafarali / emdp
Easy MDPs and grid worlds with accessible transition dynamics to do exact calculations
☆49Updated 3 years ago
mcmachado / options
☆43Updated 8 years ago
DartML / PPO-Stein-Control-Variate
Proximal Policy Optimization with Stein Control Variates:
☆33Updated 7 years ago
BorealisAI / pommerman-baseline
Code for the paper "Skynet: A Top Deep RL Agent in the Inaugural Pommerman Team Competition"
☆37Updated 6 years ago
mrkulk / hierarchical-deep-RL
Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstractions and Intrinsic Motivation
☆87Updated 7 years ago
jonasrothfuss / model_ensemble_meta_learning
Implementation of the Model-Based Meta-Policy-Optimization (MB-MPO) algorithm
☆44Updated 6 years ago
maximilianigl / DVRL
Deep Variational Reinforcement Learning
☆136Updated 3 years ago
cjm715 / mgym
A collection of multi-agent reinforcement learning OpenAI gym environments
☆45Updated 5 years ago
uber-research / D3G
Estimating Q(s,s') with Deep Deterministic Dynamics Gradients
☆32Updated 5 years ago