hans0809 / MiniMind-in-DepthLinks
轻量级大语言模型MiniMind的源码解读,包含tokenizer、RoPE、MoE、KV Cache、pretraining、SFT、LoRA、DPO等完整流程
☆469Updated 5 months ago
Alternatives and similar repositories for MiniMind-in-Depth
Users that are interested in MiniMind-in-Depth are comparing it to the libraries listed below
Sorting:
- 个人构建MoE大模型:从预训练到DPO的完整实践☆1,938Updated last week
- LLM大模型(重点)以及搜广推等 AI 算法中手写的面试题,(非 LeetCode),比如 Self-Attention, AUC等,一般比 LeetCode 更考察一个人的综合能力,又更贴近业务和基础知识一点☆448Updated 11 months ago
- 这是一个从头训练大语言模型的项目,包括预训练、微调和直接偏好优化,模型拥有1B参数,支持中英文。☆690Updated 9 months ago
- Use interactive notebook to break down MiniMind code and learn from scratch.☆118Updated 8 months ago
- 复现大模型相关算法及一些学习记录☆2,648Updated this week
- 从零实现一个小参数量中文大语言模型。