mabirck / AttentionTRLLinks

Attentional Mechanism incorporated in Asynchronous Advantage Actor Critic a3c/a2c deep mind

☆10

Alternatives and similar repositories for AttentionTRL

Users that are interested in AttentionTRL are comparing it to the libraries listed below

Sorting:

Riashat / Bayesian-Exploration-Deep-RL
Bayesian Uncertainty Exploration in Deep Reinforcement Learning
☆18Updated 8 years ago
liampetti / A3C-LSTM
A3C-LSTM algorithm tested on CartPole OpenAI Gym environment
☆48Updated 7 years ago
xlnwel / model-free-algorithms
TD3, SAC, IQN, Rainbow, PPO, Ape-X and etc. in TF1.x
☆62Updated 4 years ago
flowersteam / geppg
☆35Updated 6 years ago
quanvuong / Supervised_Policy_Update
Code to reproduce Supervised Policy Update (ICLR 2019)
☆17Updated 2 years ago
dannysdeng / dqn-pytorch
PyTorch - Implicit Quantile Networks - Quantile Regression - C51
☆22Updated 5 years ago
dnishio / DSAC
The implementation of Discriminator Soft Actor Critic
☆15Updated 5 years ago
krasheninnikov / max-causal-ent-irl
Maximum Causal Entropy Inverse Reinforcement Learning
☆48Updated 6 years ago
AnujMahajanOxf / VIREL
Code for VIREL: A Variational Inference Framework for Reinforcement Learning
☆14Updated 5 years ago
ppocma / ppocma
☆72Updated 6 years ago
flowersteam / rl-difference-testing
Simple tools for statistical analyses in RL experiments
☆66Updated 7 years ago
jeappen / gym-grid
A simple Gridworld environment for Open AI gym
☆25Updated 7 years ago
louaaron / GAN-Q-Learning
Unofficial Implementation of GAN Q Learning https://arxiv.org/abs/1805.04874
☆47Updated 4 years ago
jvmncs / ParamNoise
A comparison of parameter space noise methods for exploration in deep reinforcement learning
☆28Updated 6 years ago
NiMlr / High-Dim-ES-RL
Paper: Challenges in High-dimensional Reinforcement Learning with Evolution Strategies
☆28Updated 3 years ago
uidilr / deepirl_chainer
Implementation of GAIL and AIRL using chinerrl
☆17Updated 3 years ago
mike-gimelfarb / bayesian-reward-shaping
Bayesian Reward Shaping Framework for Deep Reinforcement Learning
☆23Updated 6 years ago
DuaneNielsen / rnd
Exploration by Random Network Distillation
☆15Updated 6 years ago
tmoer / multimodal_varinf
Code for paper "Learning Multimodal Transition Dynamics for Model-Based Reinforcement Learning".
☆35Updated 7 years ago
brett-daley / dqn-lambda
NeurIPS 2019: DQN(λ) = Deep Q-Network + λ-returns.
☆23Updated last year
cxxgtxy / deeprl-baselines
Deep reinforcement learning baselines base on OpenAI. More algorithms are included, such as Rainbow: Combining Improvements in Deep Rei…
☆35Updated 6 years ago
louiskirsch / metagenrl
MetaGenRL, a novel meta reinforcement learning algorithm. Unlike prior work, MetaGenRL can generalize to new environments that are entire…
☆67Updated 5 years ago
kindredresearch / arp
Autoregressive policies for continuous control reinforcement learning
☆32Updated 6 years ago
ajgupta93 / d4pg-pytorch
In Progress : State of the art Distributed Distributional Deep Deterministic Policy Gradient algorithm implementation in pytorch.
☆19Updated 7 years ago
boschresearch / DD_OPG
Implementation prototype of the Deep Deterministic Off-Policy Gradient (DD-OPG) method.
☆11Updated 6 years ago
sparisi / td-reg
TD-Regularized Actor-Critic Methods
☆36Updated 5 years ago
davidsandberg / rl_ssms
State Space Models for Reinforcement Learning in Tensorflow
☆19Updated 6 years ago
hu-po / pySACQ
PyTorch implementation of SAC-Q Reinforcement Learning Algorithm (tested on OpenAI Gym environments)
☆37Updated 4 years ago
karush17 / Evolution-Strategies-PyTorch
Implementation of OpenAI's Evolution Strategies in PyTorch.
☆20Updated 5 years ago
ermongroup / CalibratedModelBasedRL
Code for "Calibrated Model-Based Deep Reinforcement Learning", ICML 2019.
☆56Updated 6 years ago