datawhalechina / llms-from-scratch-cn
仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理
☆2,271Updated 6 months ago
Alternatives and similar repositories for llms-from-scratch-cn:
Users that are interested in llms-from-scratch-cn are comparing it to the libraries listed below
- 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe☆2,238Updated last week
- 大模型基础: 一文了解大模型基础知识☆3,962Updated 2 weeks ago
- 从零实现一个 llama3 中文版☆673Updated 8 months ago
- 记录大模型相关的一些知识和方法☆832Updated last week
- 《大语言模型》作者:赵鑫,李军毅,周昆,唐天一,文继荣☆2,986Updated 9 months ago
- 《动手学大模型Dive into LLMs》系列编程实践教程☆4,383Updated 5 months ago
- ☆405Updated last month
- 本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/☆5,869Updated this week
- 《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程☆12,758Updated last week
- 中文翻译的 Hands-On-Large-Language-Models (hands-on-llms),动手学习大模型☆492Updated 2 weeks ago
- Practice to LLM.☆913Updated last week
- Learning Large Language Model (LLM)(大语言模型学习)☆518Updated 10 months ago
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,406Updated 10 months ago
- 🚀 「大模型」3小时从0训练27M参数的视觉多模态VLM!🌏 Train a 27M-parameter VLM from scratch in just 3 hours!☆1,126Updated last week
- 每个人都能看懂的大模型知识分享,LLMs春/秋招大模型面试前必看,让你和面试官侃侃而谈☆1,158Updated this week
- 制作懂人情世故的大语言模型 | 涵盖提示词工程、RAG、Agent、LLM微调教程☆1,145Updated last month
- LLM全栈优质资源汇总☆482Updated 2 months ago
- 收集和梳理垂直领域的开源模型、数据集及评测基准。☆2,374Updated last year
- ☆690Updated last month
- 从无名小卒到大模型(LLM)大英雄~ 欢迎关注后续!!!☆618Updated last week
- ☆1,190Updated this week
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆594Updated 5 months ago
- 主要记录大语言大模型(LLMs) 算法(应用)工程师相关的知识及面试题☆5,378Updated 3 months ago
- 这是一份入门AI/LLM大模型的逐步指南,包含教程和演示代码,带你从API走进本地大模型部署和微调,代码文件会提供Kaggle或Colab在线版本,即便没有显卡也可以进行学习。项目中还开设了一个小型的代码游乐场🎡,你可以尝试在里面实验一些有意思的AI脚本。同时,包含李宏毅…☆1,315Updated this week
- Llama3、Llama3.1 中文仓库(随书籍撰写中... 各种网友及厂商微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档)☆4,127Updated 5 months ago
- 手把手带你实战 Huggingface Transformers 课程视频同步更新在B站与YouTube☆2,471Updated 7 months ago
- 用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.☆2,671Updated 8 months ago
- 本项目旨在分享大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)☆14,362Updated last week
- 动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/☆825Updated this week
- Transformers 库快速入门教程☆1,320Updated 5 months ago