YunjiaXi / Implementation-and-Some-Modification-about-DQN-and-SACLinks

In this project, I explore some typical value-based and policy-based RL algorithms. I do experiments on DQN and its six variants and their combination in Atari environments Pong and Boxing. I also do some experiments on SAC with DDPG as baseline on three MuJoCo environments Hopper-v2, Ant-v2, and HalfCheetah-v2.

☆11

Alternatives and similar repositories for Implementation-and-Some-Modification-about-DQN-and-SAC

Users that are interested in Implementation-and-Some-Modification-about-DQN-and-SAC are comparing it to the libraries listed below

Sorting:

qingshi9974 / PPO-pytorch-Mujoco
Implement PPO algorithm on mujoco environment，such as Ant-v2, Humanoid-v2, Hopper-v2, Halfcheeth-v2.
☆52Updated 4 years ago
Ericonaldo / ILSwiss
ILSwiss is an Easy-to-run Imitation Learning (IL, or Learning from Demonstration, LfD) and also Reinforcement Learning (RL) framework (te…
☆172Updated last year
qingshi9974 / DQN-pytorch-Atari
Implement DQN and DDQN algorithm on Atari games，such as BreakoutNoFrameskip-v4, PongNoFrameskip-v4,BoxingNoFrameskip-v4.
☆15Updated 4 years ago
a-big-tomato / reinforcement_learning_Interview_Notes-Chinese
强化学习面试（未完待续）
☆35Updated 5 years ago
skumar9876 / Hierarchical-DQN
Implementation of the paper Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation - https:/…
☆86Updated 7 years ago
mansicer / MAIC
The implementation of AAAI 2022 paper "Multi-Agent Incentive Communication via Decentralized Teammate Modeling".
☆56Updated last year
YangRui2015 / Sparse-Reward-Algorithms
Implement many Sparse Reward algorithms in Gym Fetch environment
☆88Updated 4 years ago
dadadidodi / m3ddpg
☆52Updated 6 years ago
TonghanWang / RODE
Codes accompanying the paper "RODE: Learning Roles to Decompose Multi-Agent Tasks (ICLR 2021, https://arxiv.org/abs/2010.01523). RODE is …
☆76Updated 6 months ago
TonghanWang / NDQ
Codes accompanying the paper "Learning Nearly Decomposable Value Functions with Communication Minimization" (ICLR 2020)
☆81Updated 2 years ago
laonahongchen / Bilevel-Optimization-in-Coordination-Game
code implementation for 'Bi-level Actor-Critic for Multi-agent Coordination'(AAAI2020)
☆59Updated 5 years ago
LxzGordon / Deep-Reinforcement-Learning-with-pytorch
Basic reinforcement learning algorithms. Including:DQN,Double DQN, Dueling DQN, SARSA, REINFORCE, baseline-REINFORCE, Actor-Critic,DDPG,D…
☆92Updated 4 years ago
XinJingHao / PPO-Discrete-Pytorch
A clean and robust Pytorch implementation of PPO on Discrete action space
☆70Updated last year
RoyalSkye / Atari-DRL
Play Atari(Breakout) Game by DRL - DQN, Noisy DQN and A3C
☆13Updated 5 years ago
mengwanglalala / RL-algorithms
RL algorithms
☆142Updated 4 years ago
zbzhu99 / Constrained-Decision-Making-Paper-List
Paper list for constrained policy optimization in reinforcement learning.
☆72Updated last year
maohangyu / marl_demo
demo of multi-agent reinforcement learning algorithms, such as ATT-MADDPG (Modelling the Dynamic Joint Policy of Teammates with Attention…
☆59Updated 3 years ago
watakandai / hiro_pytorch
Implementation of HIRO (Data-Efficient Hierarchical Reinforcement Learning)
☆109Updated 4 years ago
PKU-RL / I2C
☆44Updated 4 years ago
rlchina / RLCN
☆124Updated 3 years ago
polixir / OfflineRL
A collection of offline reinforcement learning algorithms.
☆189Updated 7 months ago
MadryLab / implementation-matters
☆131Updated 11 months ago
lich14 / CDS
[NeurIPS 2021] CDS achieves remarkable success in challenging benchmarks SMAC and GRF by balancing sharing and diversity.
☆86Updated 2 years ago
tuladhay / ATOC_COMA_PyTorch
☆22Updated 6 years ago
saizhang0218 / VBC
pytorch implementation of "Efficient Communication in Multi-Agent Reinforcement Learning via Variance Based Control"
☆53Updated 2 years ago
fiberleif / POfD
Reimplementation of Policy Optimization with Demonstrations (POfD) from ICML 2018.
☆15Updated 6 years ago
jidiai / ai_lib
☆165Updated last year
seolhokim / Mujoco-Pytorch
PPO, DDPG, SAC implementation on mujoco environment
☆111Updated 3 years ago
wjh720 / QPLEX
☆95Updated 4 years ago
Bigpig4396 / PyTorch-Counterfactual-Multi-Agent-Policy-Gradients-COMA
☆76Updated 5 years ago