sunshine-JLU / deepseek-r1-distill-llama-8b-loraLinks
The objective of this project is to demonstrate how to fine-tune deepseek-r1-distill-llama-8b.
☆16Updated 7 months ago
Alternatives and similar repositories for deepseek-r1-distill-llama-8b-lora
Users that are interested in deepseek-r1-distill-llama-8b-lora are comparing it to the libraries listed below
Sorting:
- ☆53Updated 6 months ago
- 基于qwenvl微调一个多模态Xray识别的大模型☆20Updated 11 months ago
- 此项目用于自动化采集、处理和可视化医疗问答数据,可助力构建高质量医疗问答对数据集。同时提供使用预处理后的数据集对Qwen-7B-Chat进行微调的详细说明。☆19Updated 8 months ago
- 基于Llamaindex微调qwen2.5-7b☆29Updated 8 months ago
- 训练自己的中文 Embedding 模型☆22Updated 8 months ago
- fine-tune deepseek r1☆123Updated 7 months ago
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆33Updated 8 months ago
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆59Updated 3 months ago
- 视频理解:千问视频多模态模型 & Dify☆64Updated last year
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆24Updated last year
- 筱可的工程实验仓库!☆82Updated 2 weeks ago
- ☆27Updated 11 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆95Updated last year
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆61Updated 3 weeks ago
- 本项目旨在提供一个微调酒店推荐垂直领域大模型并应用的完整闭环案例作为大家的参考案例。本项目使用的基础大模型为Qwen2.5-7B-Instruct。项目特色:完整的垂直应用案例闭环、项目源码剖析开源共享、详实的图文指导手册、手把手全流程实操演示视频☆62Updated 4 months ago
- [2025-上海人工智能实验室书生实训营十佳、优秀项目]☆34Updated 2 months ago
- ☆29Updated last year
- BASE-SQL: A powerful open source Text-To-SQL baseline approach☆10Updated 7 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆36Updated last year
- 使用FastAPI+vLLM部署Qwen2.5☆22Updated 11 months ago
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆105Updated 2 months ago
- ☆15Updated last year
- 大模型智能体Agent中文教程,博客代码仓库☆38Updated 2 weeks ago
- Rag Agentic的一个雏形,用于研究学习☆73Updated 7 months ago
- 基于Qwen2+SFT+DPO的医疗问答系统,项目中使用了LLaMA-Factory用于训练,fastllm和vllm用于推理,☆22Updated 2 months ago
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆52Updated 8 months ago
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆20Updated last year
- Real-time video understanding and interaction through text,audio,image and video with large multi-modal model. 利用多模态大模型的实时视频理解和交互框架,通过文本…☆24Updated last year
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆62Updated last year
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆67Updated last year