大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调
☆603May 26, 2025Updated 9 months ago
Alternatives and similar repositories for LLM-Finetune
Users that are interested in LLM-Finetune are comparing it to the libraries listed below
Sorting:
- 天池Better Synth多模态大模型数据合成挑战赛-打赢baseline就算成功方案☆26Oct 30, 2025Updated 4 months ago
- Qwen3 Fine-tuning: Medical R1 Style Chat☆286May 31, 2025Updated 9 months ago
- 《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程☆28,676Feb 24, 2026Updated last week
- ModelScope+Transformers+SwanLab实现Qwen-1.5-7b的指令微调任务☆23Jun 9, 2024Updated last year
- 对llama3进行全参微调、lora微调以及qlora微调。☆217Oct 4, 2024Updated last year
- LLM for NER☆81Jul 29, 2024Updated last year
- 基于LLM的命名实体识别和实体关系抽取☆17Jan 4, 2024Updated 2 years ago
- 一个包含了多种主流大模型微调方案的实战代码库,基于Qwen3系列模型☆117Aug 10, 2025Updated 6 months ago
- Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.5, DeepSeek-R1, GLM4.5, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL,…☆12,820Updated this week
- ChatGLM4微调简介☆20Apr 8, 2025Updated 10 months ago
- 一些 LLM 方面的从零复现笔记☆243Apr 29, 2025Updated 10 months ago
- ⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with …☆3,629Updated this week
- 欢迎来到 LLM-Dojo,这里是一个开源大模型学习场所,使用简洁且易阅读的代码构建模型训练框架(支持各种主流模型如Qwen、Llama、GLM等等)、RLHF框架(DPO/CPO/KTO/PPO)等各种功能。👩🎓👨🎓☆929Dec 1, 2025Updated 3 months ago
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆74May 17, 2024Updated last year
- Train a 1B LLM with 1T tokens from scratch by personal☆789Apr 27, 2025Updated 10 months ago
- Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)☆67,659Updated this week
- SwanLab Official Documentation | SwanLab官方文档☆23Updated this week
- Smart LLM/Agent Management in One Line of Code☆21Updated this week
- 本项目旨在分享大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)☆23,265Updated this week
- Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、…☆6,638Oct 24, 2024Updated last year
- Qwen1.5大模型微调、基于PEFT框架LoRA微调,在数据集HC3-Chinese上实现文本分类。☆12Jun 29, 2024Updated last year
- 主要记录大语言大模型(LLMs) 算法(应用)工程师相关的知识及面试题☆12,768Apr 30, 2025Updated 10 months ago
- 2025.01:从零到一实现了一个多模态大模型,并命名为Reyes(睿视),R:睿,eyes:眼。Reyes的参数量为8B,视觉编码器使用的是InternViT-300M-448px-V2_5,语言模型侧使用的是Qwen2.5-7B-Instruct,Reyes也通过一个两…☆31Feb 10, 2026Updated 3 weeks ago
- 整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。☆22,318May 19, 2025Updated 9 months ago
- 基于Llamaindex微调qwen2.5-7b☆36Dec 23, 2024Updated last year
- 使用BERT-BILSTM-CRF进行中文命名实体识别。☆487Jan 9, 2025Updated last year
- 大模型学习--从模型部署到模型微调,此项目是经过训练营学习后,结合训练营项目,自我理解消化总结,以及创新型应用。可star/fork☆21Mar 26, 2024Updated last year
- 阿里云天池 - GLM 法律行业大模型挑战赛 - 我们小组实现基于大模型的对话机器人源码☆17Oct 23, 2024Updated last year
- GraphRAG 中文文档。GraphRAG是一种结构化的、分层的检索增强生成(RAG)方法,而不是使用纯文本片段的语义搜索方法。GraphRAG 过程包括从原始文本中提取出知识图谱,构建社群层级(这种结构通常用来描述个体、群体及它们之间的关系,帮助理解信息如何在社群内部传…☆19Jul 12, 2024Updated last year
- GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型☆7,066Jul 4, 2025Updated 8 months ago
- 基于BERT-MRC(阅读理解)的命名实体识别模型☆20Mar 15, 2022Updated 3 years ago
- CBLUE2.0-关系抽取模型,基于pytorch☆16Oct 23, 2024Updated last year
- ☆13Feb 17, 2025Updated last year
- Repository for initial POC NLP based SQL adapter using LLM.☆10May 6, 2025Updated 9 months ago
- [CVPR 2025] Docopilot: Improving Multimodal Models for Document-Level Understanding☆36Jul 22, 2025Updated 7 months ago
- 基于ChatGLM-6B、ChatGLM2-6B、ChatGLM3-6B模型,进行下游具体任务微调,涉及Freeze、Lora、P-tuning、全参微调等☆2,780Dec 12, 2023Updated 2 years ago
- 李白 作为唐代杰出诗人,其诗歌作品在中国文学史上具有重要地位。近年来,随着数字技术和人工智能的快速发展,传统文化普及推广的形式也面临着创新与变革。国内外对于李白诗歌的研究虽已相当深入,但在数字化、智能化普及方面仍存在不足。因此,本项目旨在通过构建李白知识图谱,结合大模…☆1,866Jul 12, 2025Updated 7 months ago
- 用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.☆2,897May 21, 2024Updated last year
- 基于大语言模型的RAG项目,分别实现了基于文本和知识图谱的RAG☆27Dec 11, 2025Updated 2 months ago