Xiaolong-RRL / qwen2_5_vllm_fastapiLinks
使用FastAPI+vLLM部署Qwen2.5
☆22Updated 11 months ago
Alternatives and similar repositories for qwen2_5_vllm_fastapi
Users that are interested in qwen2_5_vllm_fastapi are comparing it to the libraries listed below
Sorting:
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆24Updated last year
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆57Updated 2 weeks ago
- 视频理解:千问视频多模态模型 & Dify☆64Updated 11 months ago
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆61Updated last year
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆59Updated 2 months ago
- 大模型API性能指标比较 - 深入分析TTFT、TPS等关键指标☆19Updated 11 months ago
- 基于vllm部署qwen2.5_vl实现视频流的实时识别☆18Updated 4 months ago
- 视觉信息抽取任务中,使用OCR识别结果规范多模态大模型的回答☆39Updated 7 months ago
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试 题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆51Updated 7 months ago
- 可以成功Lora微调的Qwen-VL模型☆17Updated last year
- ☆51Updated 5 months ago
- 一些大语言模型和多模态模型的生态,主要包括跨模态搜索、投机解码、QAT量化、多模态量化、ChatBot、OCR☆187Updated 2 weeks ago
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆33Updated 8 months ago
- Here is a demo for PDF parser (Including OCR, object detection tools)☆35Updated 10 months ago
- pdf multimodal rag 【pdf多模态rag问答】☆19Updated 6 months ago
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆17Updated last year
- 使用django+pyecharts+PP-Human开发的动态数据大屏, 有人流数据的采集入库, 打架、摔倒等事件警报,口罩检测等实用功能。边缘端版本使用onnx推理提升效率,服务端版本支持视频流推拉☆32Updated 2 years ago
- 安卓手机部署DeepSeek-R1 蒸馏的1.5B模型☆22Updated 6 months ago
- Programming with local large language model.☆21Updated 4 months ago
- 补充了一些Visualglm缺少的文件,可以对Visualglm进行训练,实例中 是对人脸做了面相的识别☆13Updated 2 years ago
- 研究GOT-OCR-项目落地加速,不限语言☆61Updated 10 months ago
- 基于电商数据微调的Qwen2.5系列的电商大模型,电商数据sft后电商大模型。是https://github.com/leeguandong/EcommerceLLM的升级版本。qwen2.5的效果很好。☆13Updated 10 months ago
- 一个包含了多种主流大模型微调方案的实战代码库,基于Qwen3系列模型☆48Updated 2 weeks ago
- ☆28Updated 10 months ago
- Qwen-Efficient-Tuning☆44Updated 2 years ago
- 欢迎来到“筱可AI研习社”的实战项目仓库!这个仓库主要用于存储和展示为公众号撰写的各类实战项目。我们会不断优化和迭代这些项目,以探索AI的无限可能。☆75Updated last month
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆99Updated last month
- gpt_server是一个用于生产级部署LLMs、Embedding、Reranker、ASR和TTS的开源框架。☆205Updated last week
- ☆58Updated 10 months ago
- 基于Llamaindex微调qwen2.5-7b☆25Updated 8 months ago