sunshine-JLU / deepseek-r1-distill-llama-8b-loraLinks
The objective of this project is to demonstrate how to fine-tune deepseek-r1-distill-llama-8b.
☆16Updated 7 months ago
Alternatives and similar repositories for deepseek-r1-distill-llama-8b-lora
Users that are interested in deepseek-r1-distill-llama-8b-lora are comparing it to the libraries listed below
Sorting:
- ☆53Updated 7 months ago
- fine-tune deepseek r1☆123Updated 8 months ago
- 基于qwenvl微调一个多模态Xray识别的大模型☆21Updated 11 months ago
- 基于Qwen2+SFT+DPO的医疗问答系统,项目中使用了LLaMA-Factory用于训练,fastllm和vllm用于推理,☆29Updated 3 months ago
- 基于Llamaindex微调qwen2.5-7b☆29Updated 9 months ago
- 使用FastAPI+vLLM部署Qwen2.5☆23Updated last year
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆53Updated 9 months ago
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆36Updated 9 months ago
- 此项目用于自动化采集、处理和可视化医疗问答数据,可助力构建高质量医疗问答对数据集。同时提供使用预处理后的数据集对Qwen-7B-Chat进行微调的详细说明。☆19Updated 9 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆36Updated last year
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆63Updated 3 weeks ago
- 筱可的工程实验仓库!☆85Updated this week
- 训练自己的中文 Embedding 模型☆22Updated 9 months ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆24Updated last year
- Here is a demo for PDF parser (Including OCR, object detection tools)☆36Updated 11 months ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆76Updated 9 months ago
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆59Updated 4 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆98Updated last year
- 视频理解:千问视频多模态模型 & Dify☆65Updated last year
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆68Updated last year
- ☆116Updated this week
- [2025-上海人工智能实验室书生实训营十佳、优秀项目]☆35Updated 3 weeks ago
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆23Updated last year
- ☆15Updated last year
- 一个包含了多种主流大模型微调方案的实战代码库,基于Qwen3系列模型☆73Updated 2 months ago
- Build a simple basic multimodal large model from scratch. 从零搭建一个简单的基础多模态大模型🤖☆46Updated last year
- Pytorch implementation of JointBERT: "BERT for Joint Intent Classification and Slot Filling"☆42Updated 2 years ago
- 🤖 基于AutoGen的AI辩论系统 | 🗣️ 支持中文交互 | 🔄 多智能体协作 | 📝 自动记录辩论过程 🤖 AI Debate System based on AutoGen | 🗣️ Chinese Interaction | 🔄 Multi-Age…☆19Updated 11 months ago
- ✏️0成本LLM微调上手项目,⚡️一步一步使用colab训练法律LLM,基于microsoft/phi-1_5、chatglm3,包含lora微调,全参微调☆78Updated last year
- RAG向量召回示例☆136Updated last year