songyn95 / Multimodel-seachLinks
2024.06.19 本项目使用Chinese-CLIP搭建文搜图/图搜图页面,旨在帮助用户快速使用跨模态检索任务。本项目代码针对MUGE数据集约19w(189585张)数据作为底库数据。本项目提供了提取特征, 检索, 以及uI代码。
☆20Updated last year
Alternatives and similar repositories for Multimodel-seach
Users that are interested in Multimodel-seach are comparing it to the libraries listed below
Sorting:
- 计算机视觉课程设计-基于Chinese-CLIP的图文检索系统☆100Updated 2 years ago
- DIP & NLP期末大作业 — 课程设计☆19Updated 3 years ago
- 一个基于可视水印检测识别的数字媒体溯源应用系统,是我的大作业项目,包含这个系统以及一个开源的大规模常见水印图像数据集(Large-scale Common Watermark Dataset, LCWD)。 输入一个带有可视水印的图片或视频,系统会检测定位到水印所在的区域…☆158Updated 3 years ago
- 基于CLIP实现以文精准搜图☆15Updated 2 years ago
- 基于qwenvl微调一个多模态Xray识别的大模型☆21Updated last year
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆251Updated 2 years ago
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 3 years ago
- 算法部署平台的前端服务器,主要用于与后端服务器进行数据的互传,可以接收后端mysql数据库中的用户信息,也可以接收后端算法推理后的文本检测结果图和文本识别结果。此外,添加了登录页面(无需注册哦~),可以通过判断表单输入信息来展示不同用户所应看到的网页。在后端管理系统页面中,…☆12Updated 2 years ago
- ☆20Updated 2 years ago
- 基于电商数据微调的Qwen2.5系列的电商大模型,电商数据sft后电商大模型。是https://github.com/leeguandong/EcommerceLLM的升级版本。qwen2.5的效果很好。☆13Updated last year
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆40Updated last year
- 基于多模态检索的互联网 图文匹配☆15Updated last year
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆85Updated 2 years ago
- 基于Flask开发后端、VUE开发前端框架,在WEB端部署YOLOv5目标检测模型☆378Updated 3 years ago
- NLP_Study_Demo☆169Updated last year
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆27Updated last year
- 一些大语言模型和多模态模型的生态,主要包括跨模态搜索、投机解码、QAT量化、多模态量化、ChatBot、OCR☆196Updated 5 months ago
- 中文CLIP预训练模型☆421Updated 3 years ago
- ☆108Updated 10 months ago
- 整理分类深度学习各方向公开数据集☆282Updated 2 years ago
- ☆89Updated 2 years ago
- 算法部署平台的后端服务器,主要用于与前端服务器进行数据的互传,格式包括但不限于文本/图片。项目的可扩展性非常强,操作也很简单,适用于任何算法的部署,如目标检测、实例分割,以及AIGC等。☆15Updated 2 years ago
- TinyAISearch 是一个轻量但强大的 AI 搜索项目,为你完整揭示从智能搜索规划、网页爬取、内容召回到流式问答的 RAG 全链路。 项目独创网页级召回 (V2) 模式,旨在为大语言模型提供更完整、连贯的上下文,超越传统 RAG 的碎片化知识。同时,项目内置多种可配置…☆77Updated 5 months ago
- 本项目使用LLaVA 1.6多模态模型实现以文搜图和以图搜图功能。☆28Updated last year
- Hugging Vision, Hugging AGI.☆178Updated 2 months ago
- 这是一个stable-diffusion的库。☆124Updated 2 years ago
- 基于Yolov5_DeepSort的物体计数器,可以统计车流或人流量等☆251Updated last year
- 基于大模型的视频监控危险行为检测系统,集成YOLOv8、GPT-4V等视觉和多模态AI模型,提供高精度危险行为识别、场景理解和智能告警分析。☆150Updated 9 months ago
- 重识别完整pipeline。支持视频/图像/遍历文件夹。reid模型采用2024行人重识别指标最高模型.行人检测采用yolov8,行人跟踪采用botsort。检索系统采用faiss。☆32Updated last year
- ☆56Updated last year