wyjung0625 / QCPOLinks

Implementation of Quantile-Constrained Policy Optimization (QCPO)

☆11

Alternatives and similar repositories for QCPO

Users that are interested in QCPO are comparing it to the libraries listed below

Sorting:

JongseongChae / RIME
Implementation of Robust Imitation Learning against Variations in Environment Dynamics
☆84Updated 2 years ago
seungyulhan / mme
☆78Updated 2 years ago
JK-SHIN-PG / gamification-offrec
☆81Updated 7 months ago
wjkim1202 / ader
☆15Updated last year
Leo-Lee92 / Diet-Generation-As-Sequence
formulate diet optimization as sequence generation that produces a diet of recommended intake
☆76Updated 3 years ago
omnia-unist / Zico
Zico (ATC'21) source code (based on TensorFlow 1.13)
☆73Updated last year
uyoung-jeong / BoIR
BoIR: Box-Supervised Instance Representation for Multi-Person Pose Estimation
☆97Updated last year
HyunWookL / An-Empirical-Experiment-on-Deep-Learning-Models-for-Predicting-Traffic-Data
☆71Updated 3 years ago
swanilee / Image-free-domain-generalization-via-clip-for-3d-hand-pose-estimation
☆93Updated 2 years ago
bjhan1 / zeroshot_reflection_removal
☆85Updated 3 years ago
JoSangYoung / Official-POEM
Domain generalization method code based on DomainBed
☆100Updated 2 months ago
eai-lab / SoftmaxOutputApproximation
[NeurIPS 2023] Softmax Output Approximation for Activation Memory-Efficient Training of Attention-based Networks
☆81Updated last year
solangii / MICS
(WACV'24) MICS: Midpoint Interpolation to Learn Compact and Separated Representations for Few-Shot Class-Incremental Learning
☆86Updated last year
hyeon1996 / FoX
This repository considers the implementation of the paper "FoX: Formation-aware exploration in multi-agent reinforcement learning" which …
☆20Updated 8 months ago
LAIT-CVLab / TopPR
NeurIPS 2023 - TopP&R: Robust Support Estimation Approach for Evaluating Fidelity and Diversity in Generative Models Official Code
☆103Updated last year
conversation-chronicles / conversation-chronicles
Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations
☆113Updated last year
eai-lab / On-NAS
[SenSys 2023] On-NAS: On-Device Neural Architecture Search on Memory-Constrained Intelligent Embedded Systems
☆89Updated last year
SangyeopYeo / Edge-popup_with_MMD
Can We Find Strong Lottery Tickets in Generative Models? - Official Code (Pytorch)
☆99Updated 11 months ago
omnia-unist / CarM
Carousel Memory: Rethinking the Design of Episodic Memory for Continual Learning
☆83Updated 2 years ago
suyoung-lee / SDVT
solving ml10
☆24Updated last year
jk96491 / SMAC
StarCraft II Multi Agent Challenge : QMIX, COMA, LIIR, QTRAN, Central V, ROMA, RODE, DOP, Graph MIX
☆72Updated 3 years ago
yunshengtian / ppo-mujoco
A minimal codebase for PPO training on MuJoCo environments with some customization supports.
☆14Updated 3 years ago
ec2604 / ContraBAR
☆11Updated 2 years ago
HyunghoNa / EMU
(Official) PyTorch implementation for Efficient Episodic Memory Utilization of Cooperative Multi-Agent Reinforcement Learning (EMU) (ICLR…
☆48Updated last year
junkwhinger / PPO_PyTorch
This repo contains PPO implementation in PyTorch for LunarLander-v2
☆11Updated 5 years ago
aailabkaist / EMU
(Official) PyTorch implementation for Efficient Episodic Memory Utilization of Cooperative Multi-Agent Reinforcement Learning (EMU) in IC…
☆11Updated last year
DesikRengarajan / EMRLD
[NeurIPS 2022] Code for Enhanced Meta Reinforcement Learning using Demonstrations in Sparse Reward Environments
☆12Updated 2 years ago
aailabkaist / LAGMA
(Official) PyTorch implementation for LAGMA: LAtent Goal-guided Multi-Agent Reinforcement Learning (ICML 2024)
☆21Updated last year
aailabkaist / SAAL
Official PyTorch implementation For Sharpness-Aware Active Learning [ICML 2023]
☆11Updated last year
yeshenpy / PMIC
Original PyTorch implementation of PMIC from PMIC: Improving Multi-Agent Reinforcement Learning with Progressive Mutual Information Colla…
☆20Updated last year