andompesta / ppo2

Pytorch implementation of PPO2

☆17

Related projects ⓘ

Alternatives and complementary repositories for ppo2

createamind / DRL
☆92Updated 3 years ago
dhruvramani / Transformers-RL
An easy PyTorch implementation of "Stabilizing Transformers for Reinforcement Learning"
☆170Updated last year
skumar9876 / Hierarchical-DQN
Implementation of the paper Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation - https:/…
☆82Updated 7 years ago
adik993 / ppo-pytorch
Proximal Policy Optimization(PPO) with Intrinsic Curiosity Module(ICM)
☆133Updated 5 years ago
ChengTsang / PPO-clip-and-PPO-penalty-on-Atari-Domain
Implement PPO-clip and PPO-penalty on Atari, which is the only open source of PPO-penalty
☆56Updated 5 years ago
hungtuchen / pytorch-hdqn
Hierarchical-DQN in pytorch (not actively maintained)
☆68Updated 7 years ago
deligentfool / dqn_zoo
The implement of all kinds of dqn reinforcement learning with Pytorch
☆90Updated 3 years ago
nikhilbarhate99 / Hierarchical-Actor-Critic-HAC-PyTorch
PyTorch implementation of Hierarchical Actor Critic (HAC) for OpenAI gym environments
☆296Updated 3 years ago
ac-93 / soft-actor-critic
Modified versions of the SAC algorithm from spinningup for discrete action spaces and image observations.
☆94Updated 4 years ago
wwxFromTju / deepmind_MAS_enviroment
some Multiagent enviroment in 《Multi-agent Reinforcement Learning in Sequential Social Dilemmas》 and 《Value-Decomposition Networks For Co…
☆131Updated last year
aviralkumar2907 / BEAR
Code for Stabilizing Off-Policy RL via Bootstrapping Error Reduction
☆159Updated 4 years ago
tencent-ailab / TLeague
☆80Updated 5 months ago
TonghanWang / ROMA
Codes accompanying the paper "ROMA: Multi-Agent Reinforcement Learning with Emergent Roles" (ICML 2020 https://arxiv.org/abs/2003.08039)
☆149Updated last year
facebookresearch / CollaQ
A code implementation for our arXiv paper "Multi-agent Adhoc Team Play using Decompositional Q function"
☆128Updated last year
neka-nat / distributed_rl
Pytorch implementation of distributed deep reinforcement learning
☆74Updated 2 years ago
Farama-Foundation / D4RL-Evaluations
☆190Updated last year
Theohhhu / UPDeT
Official Implementation of 'UPDeT: Universal Multi-agent Reinforcement Learning via Policy Decoupling with Transformers' ICLR 2021(spotli…
☆129Updated 3 years ago
deligentfool / policy_based_RL
The implement of the policy gradient RL algorithm with pytorch
☆36Updated 3 years ago
YangRui2015 / Sparse-Reward-Algorithms
Implement many Sparse Reward algorithms in Gym Fetch environment
☆82Updated 4 years ago
navuboy / gail_gym
Implementation of Generatve Adversarial Imitation Learning (GAIL) for classic environments from OpenAI Gym.
☆88Updated 5 years ago
BY571 / DQN-Atari-Agents
DQN-Atari-Agents: Modularized & Parallel PyTorch implementation of several DQN Agents, i.a. DDQN, Dueling DQN, Noisy DQN, C51, Rainbow,…
☆120Updated 3 years ago
andrew-j-levy / Hierarchical-Actor-Critc-HAC-
This repository contains the code to implement the Hierarchical Actor-Critic (HAC) algorithm.
☆253Updated 4 years ago
RchalYang / Soft-Module
Code for "Multi-task Reinforcement Learning with Soft Modularization"
☆112Updated 3 years ago
TianhongDai / distributed-ppo
This is an pytorch implementation of Distributed Proximal Policy Optimization(DPPO).
☆61Updated 6 years ago
jmichaux / dqn-pytorch
DQN to play Atari Pong
☆111Updated 5 years ago
Improbable-AI / eipo
Official codebase for Redeeming Intrinsic Rewards via Constrained Policy Optimization
☆77Updated last year
sfujim / TD3_BC
Author's PyTorch implementation of TD3+BC, a simple variant of TD3 for offline RL
☆328Updated 2 years ago
orrivlin / MountainCar_DQN_RND
Playing Mountain-Car without reward engineering, by combining DQN and Random Network Distillation (RND)
☆40Updated 5 years ago
namidairo777 / Distributed-MADDPG
Distributed Multi-Agent Cooperation Algorithm based on MADDPG with prioritized batch data.
☆99Updated 3 years ago
Bigpig4396 / PyTorch-Counterfactual-Multi-Agent-Policy-Gradients-COMA
☆71Updated 5 years ago