hans0809 / MiniMind-in-DepthLinks
轻量级大语言模型MiniMind的源码解读,包含tokenizer、RoPE、MoE、KV Cache、pretraining、SFT、LoRA、DPO等完整流程
☆604Updated 7 months ago
Alternatives and similar repositories for MiniMind-in-Depth
Users that are interested in MiniMind-in-Depth are comparing it to the libraries listed below
Sorting:
- 从无名小卒到大模型(LLM)大英雄~ 欢迎关注后续!!!☆1,946Updated last month
- 这是一个从头训练大语言模型的项目,包括预训练、微调和直接偏好优化,模型拥有1B参数,支持中英文。☆722Updated 11 months ago
- LLM大模型(重点)以及搜广推等 AI 算法中手写的面试题,(非 LeetCode),比如 Self-Attention, AUC等,一般比 LeetCode 更考察一个人的综合能力,又更贴近业务和基础知识一点☆472Updated last year
- 从零实现一个小参数量中文大语言模型。☆928Updated last year
- Use interactive notebook to break down MiniMind code and learn from scratch.☆129Updated 2 weeks ago