aijunbai / thompson-samplingLinks

Thompson Sampling based Monte Carlo Tree Search for MDPs and POMDPs

☆15

Alternatives and similar repositories for thompson-sampling

Users that are interested in thompson-sampling are comparing it to the libraries listed below

Sorting:

sparisi / td-reg
TD-Regularized Actor-Critic Methods
☆36Updated 5 years ago
zuoxingdong / DeepPILCO
☆54Updated 7 years ago
mbchang / decentralized-rl
Decentralized Reinforcment Learning: Global Decision-Making via Local Economic Transactions (ICML 2020)
☆43Updated 2 years ago
two2tee / WorldModelPlanning
☆16Updated 4 years ago
StanfordASL / SNDL
Stabilizable Nonlinear Dynamics Learning
☆21Updated 5 years ago
eleurent / phd-defense
☆43Updated 4 years ago
jgeisler0303 / DDP-Generator
Generate taylored code for Differential Dynamic Programming (DDP) aka Iterative Linear Quadratic Gaussian (iLQG) solvers for finite time …
☆15Updated 7 years ago
kylewray / nova
CUDA optimized code for solving MDPs, POMDPs, and Dec-POMDPs.
☆18Updated 4 years ago
BerkeleyAutomation / rlqp
Accelerating Quadratic Optimization with Reinforcement Learning
☆91Updated 3 years ago
ermongroup / CalibratedModelBasedRL
Code for "Calibrated Model-Based Deep Reinforcement Learning", ICML 2019.
☆56Updated 6 years ago
JuliaPOMDP / POMCPOW.jl
Online solver based on Monte Carlo tree search for POMDPs with continuous state, action, and observation spaces.
☆56Updated last week
laurimi / multiagent-prediction-reward
Multi-agent active perception with prediction rewards
☆11Updated 4 years ago
wulfebw / hierarchical_rl
hierarchical deep reinforcement learning algorithms
☆41Updated 7 years ago
uidilr / deepirl_chainer
Implementation of GAIL and AIRL using chinerrl
☆17Updated 3 years ago
martinseilair / learningoptimalcontrol
Great resources for learning optimal control
☆18Updated 6 years ago
omron-sinicx / jaxmapp
JAX-based implementation for multi-agent path planning (MAPP) in continuous spaces.
☆53Updated 2 years ago
JuliaPOMDP / FactoredValueMCTS.jl
Scalable MCTS for team scenarios
☆16Updated last year
NiMlr / High-Dim-ES-RL
Paper: Challenges in High-dimensional Reinforcement Learning with Evolution Strategies
☆28Updated 3 years ago
ketatam / Exploring-Munchausen-Reinforcement-Learning
PyTorch implementation of Munchausen Reinforcement Learning based on DQN and SAC. Handles discrete and continuous action spaces
☆16Updated 3 years ago
geyang / plan2vec
Public Release of Plan2vec Implementation in pyTorch
☆56Updated 2 years ago
ArmaanSethi / Hindsight-Experience-Replay-and-Hierarchical-Reinforcement-Learning
Comp 781 Project
☆9Updated 6 years ago
laurimi / npgi
Non-linear policy graph improvement - planning for Dec-POMDPs
☆16Updated 4 years ago
dhananjaisharma10 / Model-based-Reinforcement-Learning
Model-based reinforcement learning using CEM, MPC and PETS
☆16Updated 5 years ago
mike-gimelfarb / bayesian-reward-shaping
Bayesian Reward Shaping Framework for Deep Reinforcement Learning
☆23Updated 6 years ago
gkahn13 / CAPs
☆32Updated 6 years ago
trey0 / zmdp
Planning algorithms for problems with uncertain world state and action outcomes (POMDP and MDP models)
☆53Updated 3 years ago
AdaCompNUS / sarsop
Efficient Point-Based POMDP Planning by Approximating
☆90Updated 5 years ago
alexlee-gk / citysim3d
CitySim3D: Simulated car following benchmark
☆27Updated 2 years ago
resibots / blackdrops
Code for the Black-DROPS algorithm: "Black-Box Data-efficient Policy Search for Robotics", IROS 2017/ICRA 2018
☆65Updated 3 years ago
MinRegret / TigerControl
Google AI Princeton control framework
☆38Updated 4 years ago