sunshine-JLU / deepseek-r1-distill-llama-8b-loraLinks
The objective of this project is to demonstrate how to fine-tune deepseek-r1-distill-llama-8b.
☆16Updated 4 months ago
Alternatives and similar repositories for deepseek-r1-distill-llama-8b-lora
Users that are interested in deepseek-r1-distill-llama-8b-lora are comparing it to the libraries listed below
Sorting:
- ☆41Updated 3 months ago
- baichuan-7B 微调 C++ 面试大模型☆15Updated last year
- 通义千问的DPO训练☆49Updated 9 months ago
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆63Updated last year
- 基于LLM的多轮问答系统。结合了意图识别和词槽填充技术☆20Updated last year
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆31Updated 6 months ago
- 此项目用于自动化采集、处理和可视化医疗问答数据,可助力构建高质量医疗问答对数据集。同时提供使用预处理后的数据集对Qwen-7B-Chat进行微调的详细说明。☆17Updated 6 months ago
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆60Updated 10 months ago
- ☆27Updated 8 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated 11 months ago
- 基于qwenvl微调一个多模态Xray识别的大模型☆21Updated 8 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆89Updated last year
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆23Updated 11 months ago
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆58Updated 3 weeks ago
- fine-tune deepseek r1☆122Updated 4 months ago
- 对深度学习中的NLP进行解释和代码使用☆54Updated last year
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated 2 years ago
- LightRAG与GraphRAG在索引构建、检索测试中的耗时、模型请求次数、Token消耗金额、检索质量等方面进行对比☆99Updated 6 months ago
- Qwen3 Fine-tuning: Medical R1 Style Chat☆91Updated 3 weeks ago
- 快速入门RAG与私有化部署☆192Updated last year
- graphrag的基础架构☆34Updated 8 months ago
- Repo for for paper "AgentRE: An Agent-Based Framework for Navigating Complex Information Landscapes in Relation Extraction".☆67Updated 11 months ago
- 本项目主要介绍prompt工程相关用例。包括模拟智能推荐客服系统构建和问答、思维链、自洽性、思维树等相关进阶demo,旨在帮助大家理解prompt。通过一份代码实现了同时支持多种大模型(如OpenAI、阿里通义千问等)并使用FastAPI对应用进行API封装。☆30Updated 9 months ago
- AI 应用示例合集☆98Updated last year
- qwen ai agent☆134Updated last year
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆57Updated last year
- LLM+RAG for QA☆21Updated last year
- run chatglm3-6b in BM1684X☆39Updated last year
- RAG向量召回示例☆127Updated last year
- llm-medical-data:用于大模型微调训练的医疗数据集☆116Updated 2 years ago