songyn95 / Multimodel-seachLinks
2024.06.19 本项目使用Chinese-CLIP搭建文搜图/图搜图页面,旨在帮助用户快速使用跨模态检索任务。本项目代码针对MUGE数据集约19w(189585张)数据作为底库数据。本项目提供了提取特征, 检索, 以及uI代码。
☆18Updated 11 months ago
Alternatives and similar repositories for Multimodel-seach
Users that are interested in Multimodel-seach are comparing it to the libraries listed below
Sorting:
- 计算机视觉课程设计-基于Chinese-CLIP的图文检索系统☆66Updated last year
- DIP & NLP期末大作业 — 课程设计☆18Updated 2 years ago
- 基于CLIP实现以文精准搜图☆13Updated last year
- 基于多模态检索的互联网图文匹配☆14Updated last year
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 2 years ago
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆228Updated 2 years ago
- 一个基于可视水印检测识别的数字媒体溯源应用系统,是我的大作业项目,包含这个系统以及一个开源的大规模常见水印图像数据集(Large-scale Common Watermark Dataset, LCWD)。 输入一个带有可视水印的图片或视频,系统会检测定位到水印所在的区域…☆129Updated 2 years ago
- 细粒度图像分类之十二猫分类,对比ResNet和ViT两者模型性能。☆44Updated 3 years ago
- 中山大学深度学习大作业——yolov5+lpr3+deepsort交通识别检测系统☆42Updated last year
- 用Torch1.7写的MNIST手写数字识别☆15Updated 4 years ago
- 这是一个stable-diffusion的库。☆125Updated last year
- 校园车辆人流监控系统主要基于Yolov5和DeepSORT算法,实现对校园内车辆和行人的追踪,并计算他们的速度以及检测是否发生碰撞。☆29Updated last year
- 商品图像检索、多模态、深度学习☆31Updated 3 years ago
- 基于ClipCap的看图说话Image Caption模型☆302Updated 3 years ago
- 本课题利用 CCPD 数据及自生成的高清车牌数据,基于加入注意力机制以及轻型卷积改良的 YOLO 目标检测算法检测车牌,同时利用自定义的 ResNet+Transformer 网络构成字符识别算法用于识别检测出的车牌内容信息。所设计的模型提升了平均精度(mAP)值,降低了计…☆81Updated last month
- 近年来,草莓采摘旅游进入到了人们的视野。通过设计一款基于人工智能的平台来实现草莓成熟度检测、农业信息大数据分析管理与农作物知识普及,使用一套智能化系统来替换农场的部分销售与莓农的工作,提高农场经济利润与工作效率,普及中小学生农村经验教育。☆42Updated 3 years ago
- 使用Pyqt5搭建YOLO系列多线程目标检测系统☆63Updated 2 years ago
- 使用pytorch创建图像分类的web网站☆12Updated 2 years ago
- ☆12Updated 8 months ago
- 基于深度学习算法的垃圾检测系统(YOLOv5 + Flask + Vue)☆34Updated last year
- 最近的研究表明,在图像修复问题中建立远程相互作用模型具有很高的重要性。为了实现这一目标,现有的方法要么利用古老的数字图像处理技术,要么利用单一且简单的CNN结构。但是,这些技术对于低分辨率下的复杂图像显然力不从心。本课题提出了一种新的基于对抗生成网络GAN与Transfor…☆44Updated last month
- 基于Swin-transformer训练图像分类并部署web端☆93Updated 3 years ago
- 重识别完整pipeline。支持视频/图像/遍历文件夹。reid模型采用2024行人重识别指标最高模型.行人检测采用yolov8,行人跟踪采用botsort。检索系统采用faiss。☆27Updated last year
- a super easy clip model with mnist dataset for study☆117Updated last year
- 基于VGG-16的图像检索系统☆42Updated 4 years ago
- 基于YOLOv8和PySide6的交通标志检测系统(数据集为处理后的TT100K2021)☆25Updated 11 months ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆23Updated 10 months ago
- 基于YOLO的食物卡路里检测系统(源码&部署教程&数据集)☆35Updated last year
- 钢材表面缺陷检测与分割竞赛的解决方案☆20Updated 6 months ago
- 基于大模型的视频监控危险行为检测系统,集成YOLOv8、GPT-4V等视觉和多模态AI模型,提供高精度危险行为识别、场景理解和智能告警分析。☆17Updated 2 months ago