sunshine-JLU / deepseek-r1-distill-llama-8b-loraLinks
The objective of this project is to demonstrate how to fine-tune deepseek-r1-distill-llama-8b.
☆16Updated 6 months ago
Alternatives and similar repositories for deepseek-r1-distill-llama-8b-lora
Users that are interested in deepseek-r1-distill-llama-8b-lora are comparing it to the libraries listed below
Sorting:
- ☆51Updated 5 months ago
- fine-tune deepseek r1☆123Updated 6 months ago
- 基于qwenvl微调一个多模态Xray识别的大模型☆20Updated 10 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆95Updated last year
- 此项目用于自动化采集、处理和可视化医疗问答数据,可助力构建高质量医疗问答对数据集。同时提供使用预处理后的数据集对Qwen-7B-Chat进行微调的详细说明。☆19Updated 8 months ago
- 基于Llamaindex微调qwen2.5-7b☆25Updated 8 months ago
- baichuan-7B 微调 C++ 面试大模型☆14Updated 2 years ago
- 利用开源大模型,通过RAG(检索增强生成)技术,实现基于企业内部知识图谱的,可内网运行的大模型智能客服☆72Updated last year
- 训练自己的中文 Embedding 模型☆22Updated 7 months ago
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆57Updated last week
- ✏️0成本LLM微调上手项目,⚡️一步一步使用colab训练法律LLM,基于microsoft/phi-1_5、chatglm3,包含lora微调,全参微调☆77Updated last year
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆59Updated 3 months ago
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆33Updated 8 months ago
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆61Updated last year
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆51Updated 7 months ago
- llamafactory blog☆37Updated 10 months ago
- “筱可AI研习社”的工程实验仓库!☆79Updated this week
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆49Updated this week
- ☆29Updated last year
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆18Updated last year
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆75Updated 7 months ago
- ☆106Updated 3 weeks ago
- ☆139Updated 5 months ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆24Updated last year
- 视频理解:千问视频多模态模型 & Dify☆64Updated last year
- ☆28Updated 10 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆35Updated last year
- llm-medical-data:用于大模型微调训练的医疗数据集☆124Updated 2 years ago
- 大模型智能体Agent中文教程,博客代码仓库☆28Updated this week
- 使用FastAPI+vLLM部署Qwen2.5☆22Updated 11 months ago