LSTM-Kirigaya / egg-pancake
掼蛋AI
☆12Updated 4 years ago
Alternatives and similar repositories for egg-pancake:
Users that are interested in egg-pancake are comparing it to the libraries listed below
- 首届人工智能算法大赛☆9Updated 5 years ago
- 学生小项目,使用模仿学习+深度强化学习构建AI掼蛋系统☆19Updated 3 years ago
- mcc_second_guandan☆77Updated 2 years ago
- go语言开发的Ai掼蛋游戏后台服务☆21Updated last year
- 用 深度优先搜索 DFS 与 深度强化学习 DRL 分别自动控制 amazing brick 小游戏☆49Updated 8 months ago
- C++/python fight the lord with pybind11 (强化学习AI斗地主), Accepted to AIIDE-2020☆160Updated 3 years ago
- [NeurIPS 2022] PerfectDou: Dominating DouDizhu with Perfect Information Distillation☆174Updated 10 months ago
- 基于深度强化学习DQN的FlappyBird游戏AI开发☆15Updated 5 years ago
- 流水线系统(pipeline)构建基于本地知识库的ChatGLM问答☆87Updated last year
- ☆39Updated last year
- ☆42Updated 2 years ago
- Alignment成为GPT类大模型微调的必须环节,深度强化学习是Alignment的核心。本项目是一个支持非gym环境训练、支持可视化配置的深度强化学习应用编程框架,30分钟上手强化学习编程。☆73Updated 2 years ago
- SuperMario A3C Trainer for windows☆33Updated 6 years ago
- 强化学习训练斗地主 / doudizhu AI using reinforcement learning.☆15Updated 5 years ago
- 基于RLCard平台的麻将mahjong博弈游戏代码,包括基于规则和基于Dueling DQN的Agent模型。☆30Updated 2 years ago
- Resources of 3D Wizard Projects☆63Updated 3 years ago
- 使用python-opencv识别图片中的表格数据转换为csv☆109Updated 4 years ago
- A Deep Reinforcment Learning Aproach to Texas Holdem☆33Updated 2 years ago
- ☆20Updated 2 years ago
- 基于强化学习(RL)的冰壶游戏实例; 梯度下降的Sarsa(lambda) + 非均匀径向基特征表示☆20Updated 4 years ago
- 用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本☆88Updated 4 years ago
- 该论文主要介绍了美国卡内基梅隆大学团队,在多人德州扑克上的人工智能新思路,即不再简单寻找纳什均衡,而引入悔恨值的概念,自我博弈,并采用蒙特卡洛CFR方法,构建蓝图,该方法通用性强,该团队声称他们的德州扑克蓝图只在两枚CPU运算8天即可得出蓝图,即可以实现实时博弈。现已经有国…☆26Updated 5 years ago
- 使用Muzero算法进行中国象棋对弈☆9Updated 4 years ago
- 天授中文文档☆57Updated 3 months ago
- 斗地主人工智能的Python实现方案☆53Updated 7 years ago
- testing MLP, DQN, PPO, SAC, policy-gradient by snakeAI☆11Updated 3 months ago
- Yanglegeyang AI☆22Updated 2 years ago
- 强化学习算法实现自动炒股☆29Updated last year
- Learning-based agent for Google Research Football (足球游戏智能体)☆111Updated last year
- 使用jupyter进行langchain的代码练习☆18Updated last year