buyulian / Five-Chess-DQNLinks
用深度学习+强化学习编写的一个五子棋人工智障
☆44Updated 7 years ago
Alternatives and similar repositories for Five-Chess-DQN
Users that are interested in Five-Chess-DQN are comparing it to the libraries listed below
Sorting:
- 基于DQN的五子棋人机对弈☆62Updated 6 years ago
- 基于强化学习的五子棋☆11Updated 7 years ago
- ☆29Updated 7 years ago
- 强化学习-中文笔记&资源-以python实例为主-由浅入深☆109Updated 5 years ago
- A pytorch based Gomoku game model. Alpha Zero algorithm based reinforcement Learning and Monte Carlo Tree Search model.☆165Updated 6 years ago
- ☆45Updated 6 years ago
- reinforcement learning☆51Updated 5 years ago
- 这是一个学习强化学习基础原理的仓库,主要包括了《深入浅出强化学习原理入门》书中一些例子和课后作业的代码☆268Updated 7 years ago
- 强化学习☆67Updated 6 years ago
- 强化学习常见算法的实现,Q-Learning/DQN/PG/AC/DDPG/PPO/SAC☆25Updated 3 years ago
- 强化学习经典算法(offline\online learning, q-learning, DQN)的实现在平衡杆游戏和几个Atari 游戏 (CartPole\Pong\Boxing\MsPacman)☆32Updated 7 years ago
- [动手学强化学习]系列,基于pytorch。☆59Updated 4 years ago
- AlphaGo-Zero-Gobang 是一个基于强化学习的五子棋(Gobang)模型,主要用以了解AlphaGo Zero的运行原理的Demo,即神经网络是如何指导MCTS做出决策的,以及如何自我对弈学习。源码+教程☆110Updated 7 months ago
- 我的强化学习笔记和学习材料 still updating ... ...☆363Updated 3 months ago
- ☆20Updated 7 years ago
- 《深度强化学习:原理与实践》,Code of the book <Deep Reinforcement Learning: Principles and Practices>☆199Updated 6 years ago
- 用 深度优先搜索 DFS 与 深度强化学习 DRL 分别自动控制 amazing brick 小游戏☆53Updated last year
- A Chinese Chess program and a AI based on Monte Carlo Tree Search and Neural Network(like AlphaGo)一个中国象棋程序和一个配套的基于蒙特卡洛算法及神经网络的人工智能(模仿阿尔法…☆121Updated 7 years ago
- 用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本☆95Updated 4 years ago
- 国立台湾大学李宏毅老师讲解的深度强化学习学习笔记☆150Updated 6 years ago
- alphaGo版本的五子棋(gobang, gomoku)☆67Updated 5 years ago
- AlphaZero implemented Chinese chess. AlphaGo Zero / AlphaZero实践项目,实现中国象棋。☆520Updated 2 years ago
- ReforcementLearning in Action☆15Updated 7 years ago
- 本项目以一个可视化配置的、以AgentRL为核心的强化学习框架,实现30分钟上手AgentRL 编程。后续增加AgentRL和本地Agent、MCP、A2A相关特性。☆77Updated 5 months ago
- 引用整理https://blog.csdn.net/yellow_red_people/article/details/80465510 一文中PyTorch平台,利用DQN模型玩Flappy Bird游戏,是一个再励学习(强化学习)实验例子。☆50Updated 6 years ago
- Reinforcement Learning Algorithms Based on PyTorch☆21Updated 3 years ago
- 应用博弈树搜索,人工神经网络实现五子棋博弈AI。171129:计划更新基于RL训练的新版本,预计18年1月完成☆120Updated 7 years ago
- Pytorch for Deep Reinforcement Learning☆255Updated 5 years ago
- ☆391Updated 5 years ago
- 多智能体强化学习☆106Updated 6 years ago