waylandzhang / Transformer-from-scratchLinks

☆420

Alternatives and similar repositories for Transformer-from-scratch

Users that are interested in Transformer-from-scratch are comparing it to the libraries listed below

Sorting:

wdndev / llama3-from-scratch-zh
从零实现一个 llama3 中文版
☆921Updated last year
AI-Study-Han / Zero-Chatgpt
从0开始，将chatgpt的技术路线跑一遍。
☆247Updated 10 months ago
wdndev / tiny-llm-zh
从零实现一个小参数量中文大语言模型。
☆751Updated 11 months ago
Tongjilibo / build_MiniLLM_from_scratch
从0到1构建一个MiniLLM (pretrain+sft+dpo实践中)
☆461Updated 4 months ago
blackinkkkxi / RAG_langchain
一个基于langchain实现RAG的简单示例
☆530Updated last month
REXWindW / my_llm
尝试自己从头写一个LLM，参考llama和nanogpt
☆64Updated last year
kebijuelun / Awesome-LLM-Learning
Learning Large Language Model (LLM）(大语言模型学习)
☆762Updated 3 months ago
Nipi64310 / RAG-Book
本项目为书籍《大模型RAG实战》的代码以及资料汇总。
☆245Updated 8 months ago
intro-llm / intro-llm-code
☆255Updated 3 months ago
little51 / llm-dev
《大模型项目实战：多领域智能应用开发》配套资源
☆159Updated last week
waylandzhang / learn-reinforcement-learning
《Reinforcement Learning》读书学习与视频分享笔记
☆56Updated 4 months ago
datawhalechina / llm-research
☆75Updated last year
GuoCoder / ai-app
本项目旨在分享人工智能相关应用技术以及实战经验，包括大模型、语音合成、数字人、图像生成等。
☆249Updated 10 months ago
liguodongiot / llm-resource
LLM全栈优质资源汇总
☆597Updated 2 weeks ago
qiufengqijun / mini_qwen
这是一个从头训练大语言模型的项目，包括预训练、微调和直接偏好优化，模型拥有1B参数，支持中英文。
☆522Updated 5 months ago
huangjia2019 / ai-agents
异步图书：《大模型应用开发动手做AI Agent》 - 这是一些非常简单的入门示例，重在引导新手入门，目前LLM开发领域发展很快，本书只是一个提纲挈领。更多的示例和代码大家可以去OpenAI Cookbook, LangChain Example中去挖掘。
☆375Updated 9 months ago
bbruceyuan / LLMs-101
从零到一实现一个 miniLLM～（动手学习LLM）
☆75Updated last year
bbruceyuan / Hands-On-Large-Language-Models-CN
中文翻译的 Hands-On-Large-Language-Models (hands-on-llms)，动手学习大模型
☆1,223Updated 3 weeks ago
ArronAI007 / Awesome-AGI
AGI资料汇总学习（主要包括LLM和AIGC），持续更新......
☆399Updated last month
waylandzhang / DeepSeek-RL-Qwen-0.5B-GRPO-gsm8k
☆84Updated 6 months ago
SmartFlowAI / Llama3-Tutorial
Llama3-Tutorial（XTuner、LMDeploy、OpenCompass）
☆511Updated last year
datawhalechina / wow-rag
A simple and trans-platform rag framework and tutorial
☆207Updated last week
datawhalechina / llm-deploy
大模型/LLM推理和部署理论与实践
☆299Updated 2 weeks ago
huangjia2019 / llm-gpt
异步图书：《 GPT图解大模型是怎样构建的》- 这套代码是AI Coder出现之前，自己用纯手工搭建的一套简单有效的NLP经典算法集合。在大语言模型推动的AI Coder兴起之后，很少有机会再创作这么有“手工风”的代码了，不知道这是值得开心还是值得遗憾的事情。
☆164Updated last year
datawhalechina / fun-transformer
通过带领大家解读Transformer模型来加深对模型的理解
☆205Updated 2 months ago
datawhalechina / wow-agent
A simple and trans-platform agent framework and tutorial
☆132Updated 3 weeks ago
Zeyi-Lin / LLM-Finetune
大语言模型微调，Qwen2VL、Qwen2、GLM4指令微调
☆458Updated 2 months ago
zhaibowen / Retriever
Retriever-0.1B
☆93Updated last year
charent / ChatLM-mini-Chinese
中文对话0.2B小模型（ChatLM-Chinese-0.2B），开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调，给出三元组信息抽取微调示例。
☆1,570Updated last year
GenTang / regression2chatgpt
《解构大语言模型：从线性回归到通用人工智能》配套代码
☆230Updated 2 weeks ago