quantumiracle / Benchmark-Efficient-Reinforcement-Learning-with-DemonstrationsLinks

Benchmark present methods for efficient reinforcement learning. Methods include Reptile, MAML, Residual Policy, etc. RL algorithms include DDPG, PPO.

☆32

Alternatives and similar repositories for Benchmark-Efficient-Reinforcement-Learning-with-Demonstrations

Users that are interested in Benchmark-Efficient-Reinforcement-Learning-with-Demonstrations are comparing it to the libraries listed below

Sorting:

watakandai / hiro_pytorch
Implementation of HIRO (Data-Efficient Hierarchical Reinforcement Learning)
☆111Updated 4 years ago
Jonathan-Pearce / DDPG_PER
Implementation of Deep Deterministic Policy Gradient (DDPG) with Prioritized Experience Replay (PER)
☆51Updated 5 months ago
YangRui2015 / Sparse-Reward-Algorithms
Implement many Sparse Reward algorithms in Gym Fetch environment
☆88Updated 5 years ago
dadadidodi / m3ddpg
☆53Updated 6 years ago
011235813 / hierarchical-marl
Hierarchical Cooperative Multi-Agent Reinforcement Learning with Skill Discovery
☆105Updated 3 years ago
mwufi / meta-rl-bandits
A simple RNN meta-learner
☆10Updated 6 years ago
feidieufo / homework
Assignments for CS294-112.
☆30Updated 5 years ago
Felhof / DiscreteSAC
☆40Updated 3 years ago
sumitsk / marl_transfer
Code for paper 'Learning transferable cooperative behaviors in multi-agent teams' (ICML 2019)
☆115Updated 2 years ago
adithya-subramanian / Multi_Agent_Soft_Actor_Critic
A Pytorch Implementation of Multi Agent Soft Actor Critic
☆40Updated 6 years ago
Sonkyunghwan / QTRAN
There will be updates later
☆84Updated 6 years ago
Jingliang-Duan / DSAC-v1
DSAC; Distributional Soft Actor-Critic
☆129Updated 5 months ago
skumar9876 / Hierarchical-DQN
Implementation of the paper Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation - https:/…
☆86Updated 7 years ago
watchernyu / REDQ
Author's PyTorch implementation of Randomized Ensembled Double Q-Learning (REDQ) algorithm.
☆171Updated 8 months ago
qian18long / epciclr2020
☆121Updated 2 years ago
chauncygu / Multi-Agent-Constrained-Policy-Optimisation
Multi-Agent Constrained Policy Optimisation (MACPO; MAPPO-L).
☆181Updated last year
cardwing / Codes-for-RL-PER
A novel DDPG method with prioritized experience replay (IEEE SMC 2017)
☆50Updated 6 years ago
shariqiqbal2810 / multiagent-particle-envs
☆48Updated 5 years ago
HaiyinPiao / pytorch-a2clstm-DRQN
using recurrent networks(LSTM) to solve POMDPs
☆35Updated 6 years ago
navuboy / gail_gym
Implementation of Generatve Adversarial Imitation Learning (GAIL) for classic environments from OpenAI Gym.
☆89Updated 6 years ago
AlgTUDelft / WCSAC
Code for the paper "WCSAC: Worst-Case Soft Actor Critic for Safety-Constrained Reinforcement Learning"
☆58Updated 2 years ago
ling-pan / SD3
☆60Updated 4 years ago
nikhilbarhate99 / Hierarchical-Actor-Critic-HAC-PyTorch
PyTorch implementation of Hierarchical Actor Critic (HAC) for OpenAI gym environments
☆319Updated 3 years ago
Johnny-Zhang92 / IRL-Essential-Code
Generate expert demonstrations; GAIL(Generative Adversarial Imitation Learning); IRL(Inverse Reinforcement Learning)
☆32Updated 3 years ago
lineCode / rl_atari_pytorch
ReinforcementLearning Learn Play Atari Using DDPG and LSTM.
☆20Updated 8 years ago
ZhongZ-Wang / Model-Based-RL
这是一个关于基于模型的强化学习的资料，包括一些代码地址、paper、slide等。
☆44Updated 4 years ago
BY571 / Soft-Actor-Critic-and-Extensions
PyTorch implementation of Soft-Actor-Critic and Prioritized Experience Replay (PER) + Emphasizing Recent Experience (ERE) + Munchausen RL…
☆289Updated 4 years ago
dkkim93 / meta-mapg
Source code for "A Policy Gradient Algorithm for Learning to Learn in Multiagent Reinforcement Learning" (ICML 2021)
☆33Updated 2 years ago
AgrawalAmey / safe-explorer
Pytorch implementation of "Safe Exploration in Continuous Action Spaces" [Dalal et al.]
☆72Updated 6 years ago
chanb / metalearning_RL
☆20Updated 2 years ago