yeyupiaoling / Pytorch-PPOLinks
基于Pytorch实现的PPO强化学习模型,支持训练各种游戏,如超级马里奥,雪人兄弟,魂斗罗等等。
☆26Updated 4 years ago
Alternatives and similar repositories for Pytorch-PPO
Users that are interested in Pytorch-PPO are comparing it to the libraries listed below
Sorting:
- 强化学习玩超级马里奥☆76Updated 3 years ago
- 使用alphazero算法打造属于你自己的象棋AI☆278Updated 3 years ago
- ☆48Updated last year
- mcc_second_guandan☆89Updated 2 years ago
- D3QN 强化学习打只狼☆29Updated 3 years ago
- DQN_play_sekiro☆538Updated last year
- 基于stablebaseline3强化学习框架和gym-super-mario-bros马里奥游戏包,训练马里奥通关。☆123Updated 2 months ago
- 基于gym的pytorch深度强化学习(DRL)(PPO,PPG,DQN,SAC,DDPG,TD3等算法)☆125Updated last month
- 人工智能大作业项目:五子棋游戏 Artificial intelligence assignment project: Gobang Game☆49Updated 4 years ago
- use PPO Reinforcement Learning to play FlappyBird, code with pytorch☆26Updated 2 years ago
- 基于强化学习的黑神话悟空AI☆77Updated 2 months ago
- Honor of Kings AI Open Environment of Tencent☆761Updated last year
- 拳皇97、强化学习、对战游戏、AIAgent、人机交互、云端部署、PPO☆26Updated last year
- Using deep reinforcement learning to play Snake game(贪吃蛇).☆81Updated 3 years ago
- DQN_play_sekiro☆15Updated last year
- ☆24Updated 2 years ago
- NLP_Study_Demo☆159Updated last year
- 机巧围棋(CleverGo)基于Python+Pygame+PaddlePaddle打造一款点击按钮就能可视化地训练围棋人工智能的程序。☆78Updated 3 years ago
- [NeurIPS 2022] PerfectDou: Dominating DouDizhu with Perfect Information Distillation☆191Updated last year
- DeepSeek-R1本地化WebUI运行☆44Updated 6 months ago
- 用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本☆92Updated 4 years ago
- Douzero with ResNet and GPU support for Windows☆43Updated 3 years ago
- Play atari Tennis game by dqn☆76Updated 3 years ago
- 基于自回归模型与现有的开源大模型,训练小说大模型☆37Updated last year
- 本仓库提供了一个基于PyTorch实现的Transformer模型示例代码,专为初学者设计,用以深入浅出地讲解Transformer架构的工作原理和应用。通过阅读和运行此项目中的代码,学习者可以快速理解自注意力机制、编码器-解码器结构以及如何在实际任务中使用Transfor…☆65Updated last year
- ☆422Updated 2 months ago
- 用 深度优先搜索 DFS 与 深度强化学习 DRL 分别自动控制 amazing brick 小游戏☆52Updated last year
- ☆522Updated 10 months ago
- 中文 小说 多轮对话语料库 ,可以用来训练中文聊天模型,更新中,有想加的语料可以提issue☆21Updated last year
- 基于OpenVINO,本地部署大模型智能体Agent,控制TonyPi人形机器人☆144Updated 3 months ago