wei-potato / Train-llm-from-scratch

使用deepspeed从头开始训练一个LLM,经过pretrain和sft阶段,验证llm学习知识、理解语言、回答问题的能力
155Updated 4 months ago

Related projects

Alternatives and complementary repositories for Train-llm-from-scratch