sash-a / CleanRL.jl

Simple single file implementations of Reinforcement Learning algorithms in Julia

☆20

Related projects: ⓘ

instadeepai / matrax
A collection of matrix games in JAX
☆9Updated 8 months ago
RyanNavillus / PPO-v3
Adding Dreamer-v3's implementation tricks to CleanRL's PPO
☆11Updated last year
keraJLi / synthetic-gymnax
☆17Updated 3 months ago
luchris429 / JaxLife
An Open-Ended Agentic Simulator
☆17Updated last month
sdpkjc / abcdrl
Modular Single-file Reinfocement Learning Algorithms Library
☆37Updated last year
tseyde / decqn
☆33Updated last year
hr0nix / dejax
Accelerated replay buffers in JAX
☆39Updated 2 years ago
DramaCow / jaxued
☆56Updated 3 weeks ago
ucl-dark / pax
Scalable Opponent Shaping Experiments in JAX
☆19Updated 5 months ago
Michael-Beukman / RobocupGym
Reinforcement Learning inside a 3D soccer simulation
☆19Updated this week
instadeepai / fastpbrl
Vectorization techniques for fast population-based training.
☆52Updated 2 years ago
RedTachyon / coltra-rl
A modular implementation of PPO, and soon hopefully other algorithms.
☆26Updated 8 months ago
AlexGoldie / rl-learned-optimization
Official Implementation of "Can Learned Optimization Make Reinforcement Learning Less Difficult"
☆10Updated 2 months ago
ingambe / RayEnvWrapper
OpenAi's gym environment wrapper to vectorize them with Ray
☆22Updated last year
EmptyJackson / groove
Official implementation of the NeurIPS 2023 paper "Discovering General Reinforcement Learning Algorithms with Adversarial Environment Des…
☆22Updated 2 months ago
adityab / CrossQ
Official code release for "CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity"
☆53Updated 3 months ago
StoneT2000 / robojax
A high-performance reinforcement learning library in jax specialized for robotic learning
☆21Updated last year
instadeepai / awesome-marl
A categorised list of Multi-Agent Reinforcemnt Learning (MARL) papers
☆46Updated last year
ucl-dark / skillhack
SkillHack: A Benchmark for Skill Transfer in Open-Ended Reinforcement Learning
☆13Updated last year
Bellman-devs / bellman
Model-based reinforcement learning in TensorFlow
☆53Updated 3 years ago
XinJingHao / Actor-Sharer-Learner
Actor-Sharer-Learner training framework for off-policy DRL algorithms
☆19Updated last year
ethanluoyc / corax
Corax: Core RL in JAX
☆30Updated 6 months ago
sahandrez / homomorphic_policy_gradient
Author's PyTorch Implementation of Deep Homomorphic Policy Gradient (DHPG) - NeurIPS 2022 and JMLR 2024
☆21Updated 5 months ago
vwxyzjn / a2c_is_a_special_case_of_ppo
A2C is a special case of PPO!
☆19Updated 2 years ago
Howuhh / sac-n-jax
Single-file SAC-N implementation on jax with flax and equinox. 10x faster than pytorch
☆46Updated last year
google-deepmind / zipfian_environments
☆28Updated 2 years ago
seohongpark / METRA
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction (ICLR 2024)
☆49Updated 11 months ago
FLAIROx / cultural-accumulation
☆11Updated 2 months ago
RobertTLange / gymnax-blines
Baselines for gymnax 🤖
☆57Updated last year
facebookresearch / svg
On the model-based stochastic value gradient for continuous reinforcement learning
☆54Updated last year