cor3bit / bertsekas-marlLinks

PyTorch Implementation of the Sequential Multiagent Rollout algorithm

☆11

Alternatives and similar repositories for bertsekas-marl

Users that are interested in bertsekas-marl are comparing it to the libraries listed below

Sorting:

baitingzbt / PEDA
Scaling Pareto-Efficient Decision Making via Offline Multi-Objective RL, published in ICLR 2023
☆32Updated 6 months ago
ymzhang01 / focops
Pytorch Implementation for First Order Constrained Optimization in Policy Space (FOCOPS).
☆28Updated 3 years ago
huanzhang12 / ATLA_robust_RL
Robust Reinforcement Learning with the Alternating Training of Learned Adversaries (ATLA) framework
☆66Updated 4 years ago
awwang10 / sphinx
☆12Updated last year
moratodpg / imp_marl
IMP-MARL: a Suite of Environments for Large-scale Infrastructure Management Planning via MARL
☆42Updated 9 months ago
microsoft / ATAC
Code accompanying the paper Adversarially Trained Actor Critic for Offline Reinforcement Learning by Ching-An Cheng*, Tengyang Xie*, Nan …
☆70Updated 2 years ago
umd-huang-lab / WocaR-RL
Efficient Adversarial Training without Attacking: Worst-Case-Aware Robust Reinforcement Learning
☆26Updated last year
nigelyaoj / Quality-Similar-Diversity
Official Implementation for Quality-Similar Diversity via Population Based Reinforcement Learning
☆17Updated 2 years ago
LanqingLi1993 / FOCAL-ICLR
Code for FOCAL Paper Published at ICLR 2021
☆51Updated last year
liuzuxin / safe-rl-robustness
Code for "On the Robustness of Safe Reinforcement Learning under Observational Perturbations" (ICLR 2023)
☆46Updated 6 months ago
yardenas / la-mbda
LAMBDA is a model-based reinforcement learning agent that uses Bayesian world models for safe policy optimization
☆34Updated 2 years ago
waterhorse1 / NAC
(NeurIPS 2021) Neural Auto-Curricula in Two-Player Zero-Sum Games.
☆28Updated 3 years ago
dtak / mbrl-smdp-ode
PyTorch implementation of "Model-based Reinforcement Learning for Semi-Markov Decision Processes with Neural ODEs", NeurIPS 2020
☆42Updated 4 years ago
csiro-mlai / RL-BOED
☆13Updated 3 years ago
thu-rllab / CFCQL
Code for NeurIPS2023 accepted paper: Counterfactual Conservative Q Learning for Offline Multi-agent Reinforcement Learning.
☆36Updated 4 months ago
jon--lee / decision-pretrained-transformer
Implemention of the Decision-Pretrained Transformer (DPT) from the paper Supervised Pretraining Can Learn In-Context Reinforcement Learni…
☆68Updated last year
Dragon-Zhuang / BPPO
Author's Pytorch implementation of ICLR2023 paper Behavior Proximal Policy Optimization (BPPO).
☆87Updated last year
haotiansun14 / spectral-rl2
Representation Learning (RepL) Methods in Reinforcement Learning and Causal Inference
☆28Updated 8 months ago
ZishunYu / Actor-Critic-Alignment
Implementation of ``Actor-Critic Alignment for Offline-to-Online Reinforcement Learning''
☆13Updated last year
ajlangley / cpo-pytorch
An implementation of Constrained Policy Optimization (Achiam 2017) in PyTorch
☆25Updated 5 years ago
sfujim / TD7
Author's PyTorch implementation of TD7 for online and offline RL
☆145Updated last year
ryanxhr / POR
[NeurIPS 2022 Oral] The official implementation of POR in "A Policy-Guided Imitation Approach for Offline Reinforcement Learning"
☆57Updated 2 years ago
uoe-agents / smaclite
The Starcraft Multi-Agent challenge lite
☆42Updated 9 months ago
nuria95 / O-RAAC
Offline Risk-Averse Actor-Critic (O-RAAC). A model-free RL algorithm for risk-averse RL in a fully offline setting
☆35Updated 4 years ago
ido90 / RobustMetaRL
A variant of Varibad that is robust to difficult tasks
☆10Updated last year
StanfordVL / alignment
ELIGN: Expectation Alignment as a Multi-agent Intrinsic Reward
☆18Updated 2 years ago
huanzhang12 / SA_PPO
[NeurIPS 2020 Spotlight] State-adversarial PPO for robust deep reinforcement learning
☆28Updated 3 years ago
uoe-agents / lb-foraging
Level-Based Foraging (LBF): A multi-agent reinforcement learning environment
☆46Updated 9 months ago
cooperativex / SocialJax
SocialJax: sequential social dilemma environments
☆40Updated 2 weeks ago
liuzuxin / cvpo-safe-rl
Code for "Constrained Variational Policy Optimization for Safe Reinforcement Learning" (ICML 2022)
☆79Updated 2 years ago