yeyupiaoling / Pytorch-PPO
基于Pytorch实现的PPO强化学习模型,支持训练各种游戏,如超级马里奥,雪人兄弟,魂斗罗等等。
☆18Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for Pytorch-PPO
- 强化学习玩超级马里奥☆54Updated 2 years ago
- 基于OpenVINO,本地部署大模型智能体Agent,控制TonyPi人形机器人☆75Updated this week
- 以InternLM2-chat-7为基座模型,以常用中药等为数据集,微调的大模型。中医聊天小助手。☆11Updated 8 months ago
- use PPO Reinforcement Learning to play FlappyBird, code with pytorch☆17Updated last year
- 一个使用 PaddleSpeech 和 Streamlit 开发的中文语音识别与转写工具,可以将 MP3 格式的录音文件转换为带标点的文字。☆14Updated last year
- 用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本☆87Updated 3 years ago
- An easier PyTorch deep reinforcement learning library.☆165Updated 2 months ago
- 拳皇97、强化学习、对战游戏、AIAgent、人机交互、云端部署、PPO☆12Updated 11 months ago
- GPT学习☆18Updated 4 years ago
- 人工智能大作业项目:五子棋游戏 Artificial intelligence assignment project: Gobang Game☆42Updated 3 years ago
- 兼容 GPT2、Bloom 等 Pytorch 框架下的语言模型、人工智能标记语言 (AIML) 和任务型对话系统 (Task) 的深度中文智能对话机器人框架☆26Updated last year
- 基于深度强化学习DQN的FlappyBird游戏AI开发☆12Updated 5 years ago
- D3QN 强化学习打只狼☆21Updated 2 years ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项 目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated last year
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆45Updated last year
- 基于gym的pytorch深度强化学习(DRL)(PPO,PPG,DQN,SAC,DDPG,TD3等算法)☆64Updated 2 months ago
- ☆29Updated 3 years ago
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话,本地执行功能,支持 OpenAI,Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等API☆24Updated this week
- FastAPI PaddleSpeech 音频录音转文字☆47Updated 6 months ago
- 强化学习玩flappy bird☆22Updated 3 years ago
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆50Updated 2 months ago
- ☆46Updated 3 months ago
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- run chatglm3-6b in BM1684X☆39Updated 8 months ago
- Music large model based on InternLM2-chat.☆21Updated 3 months ago
- ☆104Updated 2 months ago
- This is the code of using machine learning to play Sekiro .☆96Updated 3 years ago
- 本人本科比赛期间开发的机器视觉相关的系统,包括完整的模型训练代码(机器学习代码参考众多大佬的开源项目实现),同时还含有完整的Web端(Vue)、小程序(Uniapp)、以及后端(FastApi)完整代码☆26Updated 2 years ago