XR-stb / DQN_WUKONGLinks
基于强化学习的黑神话悟空AI
☆84Updated 4 months ago
Alternatives and similar repositories for DQN_WUKONG
Users that are interested in DQN_WUKONG are comparing it to the libraries listed below
Sorting:
- AI demo for playing ARPG/Soul-like game with RL frame☆368Updated last year
- 强化学习玩超级马里奥☆81Updated 3 years ago
- 从小说中提取对话数据集☆267Updated last month
- 腾讯开悟智能体比赛(王者荣耀AI比赛,稳定版)☆54Updated 2 months ago
- Play atari Tennis game by dqn☆77Updated 3 years ago
- A non-embedded AI for Clash Royale based on RL and CV.☆338Updated last year
- This is the code of using machine learning to play Sekiro .☆102Updated 4 years ago
- use PPO Reinforcement Learning to play FlappyBird, code with pytorch☆26Updated 2 years ago
- 基于OpenVINO,本地部署大模型智能体Agent,控制TonyPi人形机器人☆146Updated 5 months ago
- bilibili video course src code☆388Updated last year
- a simple project to beat boss in Blackmyth Wukong, using yolo8 to detect boss movement and a script to react to certain detections☆151Updated last year
- 使用alphazero算法打造属于你自己的象棋AI☆279Updated 3 years ago
- ☆21Updated 7 months ago
- DQN_play_sekiro☆15Updated last year
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆751Updated 5 months ago
- ☆296Updated 2 months ago
- 基于stablebaseline3强化学习框架和gym-super-mario-bros马里奥游戏包,训练马里奥通关。☆148Updated 4 months ago
- 基于gym的pytorch深度强化学习(DRL)(PPO,PPG,DQN,SAC,DDPG,TD3等算法)☆129Updated 3 months ago
- ☆24Updated 2 years ago
- lecture32_AI挑战星际争霸II( 强化学习)☆18Updated 3 years ago
- 基于Pytorch实现的PPO强化学习模型,支持训练各种游戏,如超级马里奥,雪人兄弟,魂斗罗等等。☆26Updated 4 years ago
- An easier PyTorch deep reinforcement learning library.☆240Updated 10 months ago
- ☆39Updated last year
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,624Updated last year
- 拳皇97、强化学习、对战游戏、AIAgent、人机交互、云端部署、PPO☆33Updated last year
- Using deep reinforcement learning to play Snake game(贪吃蛇).☆82Updated 4 years ago
- 本项目为Generative Agents项目的重构+深度汉化版本,旨在为中文用户提供一个利于维护的基础版本,以便后续实验或功能拓展。☆196Updated 2 months ago
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数 据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆104Updated last year
- 基于文心一言和树莓派Pico的最简易桌面宠物☆82Updated last month
- Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。☆296Updated last year