yfismine / AlphaZeroGomoku
本项目主要是采用蒙特卡洛搜索树与残差神经网络实现的一个可在小规模硬 件设施上短期训练一个拥有较强棋力的五子棋 AI。参考 AlphaGo Zero 原始论文 《Mastering the game of Go without human knowledge》实现的一个在五子棋游 戏上的复现,实现过程中采用相应的原创性方法进行改进,使其算法更加适应项 目需求并最终取得的较好的效果。MCTS 部分使用 C++编写的带虚拟损失的树并 行版本的 Python 扩展,训练管道与神经网络部分均使用 Python 编写。
☆26Updated 2 years ago
Related projects: ⓘ
- 基于Pytorch, 使用强化学习(自博弈+MCTS)训练一个五子棋AI☆21Updated 3 years ago
- 使用alphazero算法打造属于你自己的象棋AI☆203Updated 2 years ago
- Meta-Zeta是一个基于强化学习的五子棋(Gobang)模型,主要用以了解AlphaGo Zero的运行原理的Demo,即神经网络是如何指导MCTS做出决策的,以及如何自我对弈学习。源码+教程☆72Updated last year
- Gobang MCTS :蒙特卡洛搜索树使用C++实现五子棋AI算法 ——同济大学☆6Updated 10 months ago
- 基于miniGo的幻影围棋AI,2019中国计算机博弈大赛幻影围棋组冠军;AI of Phantom Go based on miniGo☆40Updated last year
- 使用Python制作的五子棋游戏