ryan-dorazio / mmd-dilatedLinks

An implementation of the QRE solver magnetic mirror descent with dilated entropy (MMD).

☆8

Alternatives and similar repositories for mmd-dilated

Users that are interested in mmd-dilated are comparing it to the libraries listed below

Sorting:

npvoid / OnlineDoubleOracle
☆11Updated 4 years ago
waterhorse1 / NAC
(NeurIPS 2021) Neural Auto-Curricula in Two-Player Zero-Sum Games.
☆28Updated 3 years ago
uoe-agents / MATE
Learning Task Embeddings for Teamwork Adaptation in Multi-Agent Reinforcement Learning
☆13Updated last year
aicenter / openspiel_reproductions
Results reproductions & comparisons between OpenSpiel implementations, associated paper & originating works
☆16Updated 4 years ago
TARTRL / TiZero
Code accompanying the paper "TiZero: Mastering Multi-Agent Football with Curriculum Learning and Self-Play" (AAMAS 2023) 足球游戏智能体
☆14Updated 2 years ago
rocanaan / hanabi-ad-hoc-learning
☆6Updated 4 years ago
cgrivera / ai-arena
The AI Arena: A framework for distributed multi-agent reinforcement learning
☆15Updated 3 years ago
frt03 / mxt_bench
A System for Morphology-Task Generalization via Unified Representation and Behavior Distillation (ICLR2023)
☆13Updated 2 years ago
simsimiSION / pymarl-algorithm-extension-via-starcraft
☆12Updated 4 years ago
Jackory / RPBT
(AAAI24 oral) Implementation of RPPO(Risk-sensitive PPO) and RPBT(Population-based self-play with RPPO)
☆12Updated 2 years ago
diversepsro / diverse_psro
☆18Updated 4 years ago
ssokota / mmd
Code for magnetic mirror descent.
☆16Updated last year
princeton-nlp / SRL-NLC
Safe Reinforcement Learning with Natural Language Constraints
☆15Updated 3 years ago
matrl-project / matrl
☆12Updated 4 years ago
manantomar / Mirror-Descent-Policy-Optimization
Mirror Descent Policy Optimization
☆38Updated 4 years ago
indylab / tabular_xdo
☆9Updated 4 years ago
menglinjian / Deep-FTRL-ORW
Code for the paper "Deep FTRL-ORW: An Efficient Deep Reinforcement Learning Algorithm for Solving Imperfect Information Extensive-Form Ga…
☆11Updated 2 years ago
philipjball / TD3_PyTorch
♊ Minimal PyTorch Twin Delayed DDPG (TD3) implementation
☆10Updated 4 years ago
Cranial-XIX / marl-copa
PyTorch Implementation of COPA for coordinating teams that can dynamically change.
☆21Updated 3 years ago
nigelyaoj / Quality-Similar-Diversity
Official Implementation for Quality-Similar Diversity via Population Based Reinforcement Learning
☆17Updated 2 years ago
sail-sg / rosmo
Codes for "Efficient Offline Policy Optimization with a Learned Model", ICLR2023
☆29Updated 2 years ago
avillaflor / SPLT-transformer
☆18Updated 3 years ago
zuzuba / CISR_NeurIPS20
☆18Updated 4 years ago
Stanford-ILIAD / Conventions-ModularPolicy
PyTorch implementation for "On the Critical Role of Conventions in Adaptive Human-AI Collaboration", ICLR 2021
☆16Updated 4 years ago
robintyh1 / neurips2021-meta-gradient-offpolicy-evaluation
Code for Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation @ NeurIPS 2021
☆12Updated 3 years ago
ArnaudFickinger / adversarial-surprise
Explore and Control with Adversarial Surprise
☆10Updated 4 years ago
sjtu-marl / bd_rd_psro
Code for Towards Unifying Behavioral and Response Diversity for Open-ended Learning in Zero-sum Games
☆20Updated 3 years ago
YeTianJHU / GSCU
Repo for the Greedy when Sure and Conservative when Uncertain about the Opponents (GSCU)
☆21Updated 3 years ago
uoe-agents / TED
Official repository for "Temporal Disentanglement of Representations for Improved Generalisation in Reinforcement Learning".
☆13Updated 2 years ago
Sriram94 / DMFG
☆17Updated 2 years ago