buyulian / Five-Chess-DQNLinks
用深度学习+强化学习编写的一个五子棋人工智障
☆42Updated 7 years ago
Alternatives and similar repositories for Five-Chess-DQN
Users that are interested in Five-Chess-DQN are comparing it to the libraries listed below
Sorting:
- 基于DQN的五子棋人机对弈☆60Updated 6 years ago
- 基于强化学习的五子棋☆11Updated 6 years ago
- A pytorch based Gomoku game model. Alpha Zero algorithm based reinforcement Learning and Monte Carlo Tree Search model.☆165Updated 6 years ago
- 强化学习-中文笔记&资源-以python实例为主-由浅入深☆106Updated 4 years ago
- ☆29Updated 7 years ago
- Dueling DQN Pytorch☆13Updated 3 years ago
- 使用pytorch构建深度强化学习模型DQN☆26Updated 7 years ago
- 强化学习☆67Updated 6 years ago
- 强化学习常见算法的实现,Q-Learning/DQN/PG/AC/DDPG/PPO/SAC☆24Updated 3 years ago
- 国立台湾大学李宏毅老师讲解的深度强化学习学习笔记☆149Updated 5 years ago
- 本项目以一个可视化配置的、以AgentRL为核心的强化学习框架,实现30分钟上手AgentRL 编程。后续增加AgentRL和本地Agent、MCP、A2A相关特性。☆76Updated 3 months ago
- 用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本☆94Updated 4 years ago
- reinforcement learning☆51Updated 4 years ago
- [动手学强化学习]系列,基于pytorch。☆57Updated 4 years ago
- 《深度强化学习:原理与实践》,Code of the book <Deep Reinforcement Learning: Principles and Practices>☆196Updated 6 years ago
- DQN flappy bird with tensorflow2☆16Updated 4 years ago
- 我的强化学习笔记和学习材料 still updating ... ...☆356Updated 2 weeks ago
- playing Atari game with Deep Q Learning (DQN & DDQN) in tensorflow☆14Updated 7 years ago
- 人工智能导论课程设计-用强化学习玩FlappyBird☆18Updated 5 years ago
- AlphaGo-Zero-Gobang 是一个基于强化学习的五子棋(Gobang)模型,主要用以了解AlphaGo Zero的运行原理的Demo,即神经网络是如何指导MCTS做出决策的,以及如何自我对弈学习。源码+教程☆108Updated 4 months ago
- 应用博弈树搜索,人工神经网络实现五子棋博弈AI。171129:计划更新基于RL训练的新版本,预计18年1月完成☆117Updated 7 years ago
- ☆20Updated 7 years ago
- 这是一个学习强化学习基础原理的仓库,主要包括了《深入浅出强化学习原理入门》书中一些例子和课后作业的代码☆267Updated 6 years ago
- 在PyTorch上重构multi-agent deep deterministic policy gradient(MADDPG),将https://github.com/xuemei-ye/maddpg-mpe 修改到自己电脑上可运行。因为本人笔记本没有CUDA,实验速度…☆13Updated 6 years ago
- Codes for understanding Reinforcement Learning( updating... )☆25Updated 6 years ago
- 引用整理https://blog.csdn.net/yellow_red_people/article/details/80465510 一文中PyTorch平台,利用DQN模型玩Flappy Bird游戏,是一个再励学习(强化学习)实验例子。☆49Updated 6 years ago
- alphaGo版本的五子棋(gobang, gomoku)☆68Updated 5 years ago
- DQN Pytorch☆14Updated 3 years ago
- ReforcementLearning in Action☆15Updated 7 years ago
- 强化学习经典算法(offline\online learning, q-learning, DQN)的实现在平衡杆游戏和几个Atari 游戏 (CartPole\Pong\Boxing\MsPacman)☆32Updated 7 years ago