yeyupiaoling / Pytorch-PPOLinks
基于Pytorch实现的PPO强化学习模型,支持训练各种游戏,如超级马里奥,雪人兄弟,魂斗罗等等。
☆26Updated 4 years ago
Alternatives and similar repositories for Pytorch-PPO
Users that are interested in Pytorch-PPO are comparing it to the libraries listed below
Sorting:
- 强化学习玩超级马里奥☆82Updated 3 years ago
- 拳皇97、强化学习、对战游戏、AIAgent、人机交互、云端部署、PPO☆35Updated 2 years ago
- use PPO Reinforcement Learning to play FlappyBird, code with pytorch☆27Updated 2 years ago
- 人工智能大作业项目:五子棋游戏 Artificial intelligence assignment project: Gobang Game☆51Updated 4 years ago
- 基于stablebaseline3强化学习框架和gym-super-mario-bros马里奥游戏包,训练马里奥通关。☆167Updated this week
- Hugging Face 深度强化学习课程(中文版)☆22Updated 3 years ago
- A gobang robot based on reinforcement learning.☆159Updated 2 years ago
- NLP_Study_Demo☆168Updated last year
- This is the code of using machine learning to play Sekiro .☆102Updated 4 years ago
- bilibili video course src code☆407Updated 2 years ago
- DQN_play_sekiro☆15Updated last year
- 基于OpenVINO,本地部署大模型智能体Agent,控制TonyPi人形机器人☆149Updated 6 months ago
- 机巧围棋(CleverGo)基于Python+Pygame+PaddlePaddle打造一款点击按钮就能可视化地训练围棋人工智能的程序。☆79Updated 3 years ago
- 基于强化学习的黑神话悟空AI☆84Updated 5 months ago
- 离线语音合成☆34Updated 2 years ago
- simple decoder-only GTP model in pytorch☆43Updated last year
- DeepSeek-R1本地化WebUI运行☆43Updated 9 months ago
- 本仓库提供了一个基于PyTorch实现的Transformer模型示例代码,专为初学者设计,用以深入浅出地讲解Transformer架构的工作原理和应用。通过阅读和运行此项目中的代码,学习者可以快速理解自注意力机制、编码器-解码器结构以及如何在实际任务中使用Transfor…☆67Updated last year
- Gemma-SFT, gemma-2b/gemma-7b微调(finetune,transformers)/LORA(peft)/推理(inference)☆33Updated last year
- transformer,机器翻译,中文--英文☆81Updated 2 years ago
- 一个使用 PaddleSpeech 和 Streamlit 开发的中文语音识别与转写工具,可以将 MP3 格式的录音文件转换为带标点的文字。☆14Updated 2 years ago
- 深度学习、强化学习、模仿学习与机器人☆453Updated 5 years ago
- Aibote是江西爱伯特科技自主研发的一款纯代码RPA办公自动化框架,支持Android、Browser和Windows 三大平台。☆30Updated 2 years ago
- ☆211Updated 3 years ago
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆49Updated 2 years ago
- Retriever-0.1B☆95Updated last year
- ☆15Updated 3 years ago
- 用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本☆95Updated 4 years ago
- 用 深度优先搜索 DFS 与 深度强化学习 DRL 分别自动控制 amazing brick 小游戏☆52Updated last year
- 本人参加2020全国大学生物联网设计大赛所做项目负责的软件部分,获得华东赛区特等奖、全国总决赛二等奖。该项目包含了导航系统、语音系统、目标检测系统三个部分,涵盖语音唤醒、语音识别、语音合成、语音导航、目的地搜索、路径规划、车道分割、目标检测(车、车牌、违规车、路标等)、车牌…☆78Updated 3 years ago