songyn95 / Multimodel-seach
2024.06.19 本项目使用Chinese-CLIP搭建文搜图/图搜图页面,旨在帮助用户快速使用跨模态检索任务。本项目代码针对MUGE数据集约19w(189585张)数据作为底库数据。本项目提供了提取特征, 检索, 以及uI代码。
☆17Updated 10 months ago
Alternatives and similar repositories for Multimodel-seach:
Users that are interested in Multimodel-seach are comparing it to the libraries listed below
- 计算机视觉课程设计-基于Chinese-CLIP的图文检索系统☆61Updated last year
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆37Updated last year
- 基于CLIP实现以文精准搜图☆12Updated last year
- DIP & NLP期末大作业 — 课程设计☆18Updated 2 years ago
- 一个基于可视水印检测识别的数字媒体溯源应用系统,是我的大作业项目,包含这个系统以及一个开源的大规模常见水印图像数据集(Large-scale Common Watermark Dataset, LCWD)。 输入一个带有可视水印的图片或视频,系统会检测定位到水印所在的区域…☆122Updated 2 years ago
- 毕业设计:《基于CLIP模型的视频文本检索设计与实现》☆11Updated 9 months ago
- Record some basic training on the stable diffusion series, including Lora, Controlnet, IP-adapter, and a bit of fun AIGC play!☆31Updated 8 months ago
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆223Updated 2 years ago
- Stable Diffusion模型训练样例代码☆35Updated 10 months ago
- 基于ClipCap的看图说话Image Caption模型☆300Updated 3 years ago
- 基于多模态检索的互联网图文匹配☆14Updated last year
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆72Updated last year
- ☆11Updated 6 months ago
- 🔥 [ICLR 2025] FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models☆210Updated last month
- The official repository of Real Text Manipulation (RTM)☆35Updated last month
- [CVPR2023] Towards Robust Tampered Text Detection in Document Image: New Dataset and New Solution☆151Updated 3 months ago
- 天池&ICDAR2023篡改图像检测比赛方案☆22Updated 2 years ago
- 「ICLR 2025」 A Sanity Check for AI-generated Image Detection☆137Updated last month
- A curated list of image manipulation detection and localization and related resources.☆80Updated 2 weeks ago
- 这是一个stable-diffusion的库。☆124Updated last year
- 算法部署平台的前端服务器,主要用于与后端服务器进行数据的互传,可以接收后端mysql数据库中的用户信息,也可以接收后端算法推理后的文本检测结果图和文本识别结果。此外,添加了登录页面(无需注册哦~),可以通过判断表单输入信息来展示不同用户所应看到的网页。在后端管理系统页面中,…☆12Updated last year
- 天池-真实场景篡改图像检测挑战赛☆13Updated 3 years ago
- A paper collection of recent diffusion models for text-image generation tasks, e,g., visual text generation, font generation, text remova…☆244Updated 4 months ago
- 商品图像检索、多模态、深度学习☆31Updated 3 years ago
- finetune stable diffusion with Dreambooth、LoRA、ControlNet☆56Updated 2 years ago
- 中文CLIP预训练模型☆410Updated 2 years ago
- PosterMaker [CVPR 2025] https://poster-maker.github.io/☆41Updated last week
- 2022阿里天池真实场景篡改图像检测挑战赛-冠军方案(1/1149)☆189Updated 2 years ago
- 算法部署平台的后端服务器,主要用于与前端服务器进行数据的互传,格式包括但不限于文本/图片。项目的可扩展性非常强,操作也很简单,适用于任何算法的部署,如目标检测、实例分割,以及AIGC等。☆15Updated last year
- Strong baselines for tampered text detection in pure vision domain☆24Updated 4 months ago