Xiaolong-RRL / qwen2_5_vllm_fastapiLinks
使用FastAPI+vLLM部署Qwen2.5
☆21Updated 10 months ago
Alternatives and similar repositories for qwen2_5_vllm_fastapi
Users that are interested in qwen2_5_vllm_fastapi are comparing it to the libraries listed below
Sorting:
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆52Updated this week
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆50Updated 6 months ago
- 视觉信息抽取任务中,使用OCR识别结果规范多模态大模型的回答☆39Updated 7 months ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆24Updated last year
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆95Updated 2 weeks ago
- 基于vllm部署qwen2.5_vl实现视频流的实时识别☆17Updated 4 months ago
- 视频理解:千问视频多模态模型 & Dify☆62Updated 11 months ago
- 大模型API性能指标比较 - 深入分析TTFT、TPS等关键指标☆18Updated 10 months ago
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆41Updated 3 years ago
- 基于电商数据微调的Qwen2.5系列的电商大模型,电商数据sft后电商大模型。是https://github.com/leeguandong/EcommerceLLM的升级版本。qwen2.5的效果很好。☆13Updated 10 months ago
- 研究GOT-OCR-项目落地加速,不限语言☆61Updated 9 months ago
- 使用django+pyecharts+PP-Human开发的动态数据大屏, 有人流数据的采集入库, 打架、摔倒等事件警报,口罩检测等实用功能。边 缘端版本使用onnx推理提升效率,服务端版本支持视频流推拉☆32Updated 2 years ago
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆32Updated 7 months ago
- 安卓手机部署DeepSeek-R1 蒸馏的1.5B模型☆22Updated 6 months ago
- 补充了一些Visualglm缺少的文件,可以对Visualglm进行训练,实例中是对人脸做了 面相的识别☆13Updated 2 years ago
- 一些大语言模型和多模态模型的生态,主要包括跨模态搜索、投机解码、QAT量化、多模态量化、ChatBot、OCR☆185Updated last week
- Programming with local large language model.☆21Updated 3 months ago
- 该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作☆55Updated 11 months ago
- 基于MNN-llm的安卓手机部署大语言模型:Qwen1.5-0.5B-Chat☆82Updated last year
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆58Updated 2 months ago
- ☆28Updated 9 months ago
- gpt_server是一个用于生产级部署LLMs、Embedding、Reranker、ASR和TTS的开源框架。☆204Updated 2 weeks ago
- Qwen-Efficient-Tuning☆43Updated last year
- ☆49Updated 4 months ago
- 基于yoloV5进行多类别+关键检测,关键点检测主要是计算车辆航向角☆16Updated 3 years ago
- 卡证和文档检测和矫正☆66Updated 10 months ago
- 轻量模型的图像分析web服务,包括倾斜矫正OCR,公章(印章)检测+识别,车牌识别。api方案使用FastAPI+Gunicorn,提供gradio展示。☆101Updated last year
- 一个基 于多模态大模型的图表解析器☆30Updated 4 months ago
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆50Updated this week
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆60Updated 11 months ago