npnpwqf / RenjuLinks
基于强化学习的五子棋
☆11Updated 7 years ago
Alternatives and similar repositories for Renju
Users that are interested in Renju are comparing it to the libraries listed below
Sorting:
- 用深度学习+强化学习编写的一个五子棋人工智障☆44Updated 7 years ago
- A pytorch based Gomoku game model. Alpha Zero algorithm based reinforcement Learning and Monte Carlo Tree Search model.☆165Updated 6 years ago
- 国立台湾大学李宏毅老师讲解的深度强化学习学习笔记☆150Updated 6 years ago
- AI项目(强化学习、深度学习、计算机视觉、推荐系统、自然语言处理、机器导航、医学影像处理)☆92Updated 2 years ago
- 斯坦福 cs234 强化学习中文讲义☆208Updated 5 years ago
- 用 深度优先搜索 DFS 与 深度强化学习 DRL 分别自动控制 amazing brick 小游戏☆54Updated last year
- 📖斯坦福博弈论中文笔记☆208Updated 5 years ago
- 《数学建模算法与应 用》司守奎matlab程序☆46Updated 8 years ago
- 我的强化学习笔记和学习材料 still updating ... ...☆363Updated 3 months ago
- 基于DQN的五子棋人机对弈☆62Updated 6 years ago
- 此项目中将上传我在B站《强化学习理论基础》系列视频中的板书、参考资料等内容。☆85Updated 2 years ago
- Machine learning algorithms step by step with explanation☆41Updated 5 years ago
- Solutions for nndl/exercise☆116Updated 5 years ago
- 中山大学自然语言处理与知识图谱☆33Updated 6 years ago
- 天授中文文档☆62Updated last year
- 使用Python制作的五子棋游戏☆147Updated last year
- 强化学习求解迷宫问题,Q-learning和监督学习☆26Updated 5 years ago
- A pack of reinforcement learning algorithms.☆84Updated 4 years ago
- 西瓜书,课后习题☆139Updated 4 years ago
- 尝试了博弈树Min-Max + alpha-Beta剪枝方法,并找到了更好的适用于五子棋智能的棋局评估模型和选择模型☆54Updated 7 years ago
- 使用浅层神经网络和遗传算法训练一个可以自动驾驶小车的Demo☆86Updated 5 years ago
- 哈工大计算机研究生学位课的课程笔记,包括模式识别、自然语言处理、最优化方法、以及数理统计☆105Updated 7 years ago
- nju_ai_20☆57Updated 4 years ago
- Tensorflow 2.0 toy examples☆212Updated 5 years ago
- 深度强化学习贪吃蛇游戏。拥有完整游戏环境与AI接口。(项目未完成)☆40Updated 6 years ago
- ♟♟♟♟♟ A Gomoku game AI based on Monte Carlo Tree Search, can be trained on policy-value network now. 一个蒙特卡洛树搜索算法实现的五子棋 AI,现可用神经网络训练模型。☆52Updated 5 years ago
- 基于Python八数码问题算法(深广度算法,A星算法)☆37Updated 7 years ago
- 《Python数据挖掘入门与实践》 代码,数据以及教程☆106Updated 5 years ago
- 本项目以一个可视化配置的、以AgentRL为核心的强化学习框架,实现30分钟上手AgentRL 编程。后续增加AgentRL和本地Agent、MCP、A2A相关特性。☆79Updated 6 months ago
- 一些机器学习算法的demo。普通最小二乘法,决策树(Iris鸢尾花数据集),KNN(mnist手写数字数据集),朴素贝叶斯分类西瓜数据集,trec06c数据集垃圾邮件分类(spam),逻辑斯蒂回归,随机梯度下降SGD与全梯度下降的对比,mnist中8和9的二分类,泰坦尼克号…☆191Updated 7 years ago