sun1638650145 / deep-rl-class-zh
Hugging Face 深度强化学习课程(中文版)
☆20Updated 2 years ago
Alternatives and similar repositories for deep-rl-class-zh:
Users that are interested in deep-rl-class-zh are comparing it to the libraries listed below
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated last year
- 通过动画学强化学习笔记☆38Updated last month
- 使用langchain进行任务规划,构建子任务的会话场景资源,通过MCTS任务执行器,来让每个子任务通过在上下文中资源,通过自身反思探索来获取自身对问题的最优答案;这种方式依赖模型的对齐偏好,我们在每种偏好上设计了一个工程框架,来完成自我对不同答案的奖励进行采样策略☆29Updated last week
- 本项目用于大模型数学解题能力方面的数据集合成,模型训练及评测,相关文章记录。☆80Updated 6 months ago
- The Roadmap for LLMs☆84Updated last year
- ☆74Updated 4 months ago
- 使用单个24G显卡,从0开始训练LLM☆50Updated 5 months ago
- 解锁HuggingFace生态的百般用法☆88Updated 3 months ago
- Awesome Colab Projects Collection☆26Updated last year
- 大语言模型训练和服务调研☆37Updated last year
- 首个llama2 13b 中文版模型 (Base + 中文对话SFT,实现流畅多轮人机自然语言交互)☆90Updated last year
- 训练一个对中文支持更好的LLaVA模型,并开源训练代码和数据。☆54Updated 6 months ago
- Datawhale论文分享,阅读前沿论文,分享技术创新☆44Updated last year
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆59Updated 7 months ago
- 关于ChatGPT,以及AIGC的学习道路,里面包含的内容很多,有语言模型,还有RLHF,多模态论文等等,本人的公众号是船长尼莫,感兴趣可以关注一下~☆31Updated last year
- ☆19Updated last year
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆30Updated 8 months ago
- vLLM Documentation in Chinese Simplified / vLLM 中文文档☆55Updated 2 months ago
- 深蓝学院课程 - 生成式预训练语言模型:理论与实战☆42Updated last year
- 基于文心一言和树莓派Pico的最简易桌面宠物☆68Updated last month
- 大型语言模型实战指南:应用实践与场景落地☆67Updated 6 months ago
- LLM RAG 应用,支持 API 调用,语音交互。☆11Updated 9 months ago
- qwen models finetuning☆93Updated 3 weeks ago
- ☆21Updated last year
- 文本去重☆69Updated 10 months ago
- baichuan and baichuan2 finetuning and alpaca finetuning☆32Updated 3 weeks ago
- Not interactive deep reinforcement learning book with no-framework code, copied math, no discussions. Adopted at only -1 university(Shanh…☆23Updated 7 months ago
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆51Updated 2 months ago
- 一个面向小白的大模型应用开发课程☆57Updated last year
- 使用qlora对中文大语言模型进行微调,包含ChatGLM、Chinese-LLaMA-Alpaca、BELLE☆85Updated last year