haohaoXhang / RLHF_learnLinks
这是一个从零开始构建的强化学习人类反馈(RLHF)学习代码库,实现了 PPO、GRPO、GSPO 以及相关的策略优化算法,并提供了清晰、可复现的训练流程。由于文档是由latex文件转译过来,如果md文件渲染异常,请用VScode的md插件打开
☆55Updated 3 weeks ago
Alternatives and similar repositories for RLHF_learn
Users that are interested in RLHF_learn are comparing it to the libraries listed below
Sorting:
- llm相关内容,包括:基础知识、八股文、面经、经典论文☆296Updated last year
- ☆628Updated last week
- 一些大模型相关的开源网站☆77Updated last month
- 一个简单的多模态RAG项目☆284Updated 8 months ago
- ☆84Updated last month
- A lab to practice RAG techniques.☆34Updated 4 months ago
- ☆473Updated 5 months ago
- ☆68Updated 6 months ago
- ☆17Updated 8 months ago
- LLM大模型(重点)以及搜广推等 AI 算法中手写的面试题,(非 LeetCode),比如 Self-Attention, AUC等,一般比 LeetCode 更考察一个人的综合能力,又更贴近业务和基础知识一点☆467Updated last year
- 大模型算法岗面试题(含答案):常见问题和概念解析 "大模型面试题"、"算法岗面试"、"面试常见问题"、"大模型算法面试"、"大模型应用基础"☆1,540Updated this week
- 《EasyOffer》(<大模型面经合集>)是针对LLM宝宝们量身打造的大模型暑期实习Offer指南,主要记录大模型暑期实习和秋招准备的一些常见大厂手撕代码、大厂面经经验、常见大厂思考题等;小白一个,正在学习ing......有问题各位大佬随时指正,希望大家都能拿到心仪Of…☆622Updated 9 months ago
- Multi-Modal-AI-Orchestrator (Reset version),AI Full-modal Full-agent:Text → Image → Music → Lights → Video, Includes "Scenario Director,…☆70Updated 2 months ago
- 收集大语言模型的学习路径和各种最佳实践☆317Updated last year
- 整理算法岗面试八股☆66Updated 11 months ago
- 从 NLP 到 LLM 的全栈教程,在线阅读地址:https://datawhalechina.github.io/base-llm/☆175Updated this week
- 复现大模型相关算法及一些学习记录☆2,820Updated 3 weeks ago
- ☆233Updated 7 months ago
- 🚀 [从零构建 LLM] 极简大模型训练原理与实践指南。包含 Transformer, Pretraining, SFT 核心代码与对照实验。 | A minimal, principle-first guide to understanding and building…☆20Updated this week
- An awesome resume template.☆195Updated 10 months ago
- ☆99Updated 11 months ago
- 算法岗笔试面试大全,励志做算法届的《五年高考,三年模拟》!☆684Updated 9 months ago
- 面向新同学进组的学习指南☆107Updated 3 weeks ago
- DL & ML & RS☆646Updated last year
- ☆409Updated last year
- Learning Large Language Model (LLM)(大语言模型学习)☆872Updated last week
- 《动手做科研》面向科研初学者,一步一步地展示如何入门人工智能科研☆524Updated 10 months ago
- 【三年面试五年模拟】AIGC算法工程师面试秘籍。涵盖AIGC、传统深度学习、自动驾驶、AI Agent、机器学习、计算机视觉、自然语言处理、强化学习、大数据挖掘、具身智能、元宇宙、AGI等AI行业面试笔试干货经验与核心知识。☆2,753Updated last week
- ☆256Updated 7 months ago
- 夏令营截止日期DDL静态网页☆329Updated 4 months ago