songyn95 / Multimodel-seachLinks
2024.06.19 本项目使用Chinese-CLIP搭建文搜图/图搜图页面,旨在帮助用户快速使用跨模态检索任务。本项目代码针对MUGE数据集约19w(189585张)数据作为底库数据。本项目提供了提取特征, 检索, 以及uI代码。
☆20Updated last year
Alternatives and similar repositories for Multimodel-seach
Users that are interested in Multimodel-seach are comparing it to the libraries listed below
Sorting:
- DIP & NLP期末大作业 — 课程设计☆19Updated 2 years ago
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆42Updated 2 years ago
- 基于CLIP实现以文精准搜图☆14Updated 2 years ago
- 算法部署平台的前端服务器,主要用于与后端服务器进行数据的互传,可以接收后端mysql数据库中的用户信息,也可以接收后端算法推理后的文本检测结果图和文本识别结果。此外,添加了登录页面(无需注册哦~),可以通过判断表单输入信息来展示不 同用户所应看到的网页。在后端管理系统页面中,…☆12Updated 2 years ago
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 3 years ago
- 基于qwenvl微调一个多模态Xray识别的大模型☆21Updated last year
- 一个基于可视水印检测识别的数字媒体溯源应用系统,是我的大作业项目,包含这个系统以及一个开源的大规模常见水印图像数据集(Large-scale Common Watermark Dataset, LCWD)。 输入一个带有可视水印的图片或视频,系统会检测定位到水印所在的区域…☆147Updated 3 years ago
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆247Updated 2 years ago
- 算法部署平台的后端服务器,主要用于与前端服务器进行数据的互传,格式包括但不限于文本/图片。项目的可扩展性非常强,操作也很简单,适用于任何算法的部署,如目标检测、实例分割,以及AIGC等。☆15Updated 2 years ago
- ☆20Updated 2 years ago
- 整理分类深度学习各方向公开数据集☆275Updated last year
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆35Updated last year
- 基于多模态检索的互联网图文匹配☆15Updated last year
- 视频分类标注、视频时空标注☆44Updated 2 years ago
- 基于大模型的视频监控危险行为检测系统,集成YOLOv8、GPT-4V等视觉和多模态AI模型,提供高精度危险行为识别、场景理解和智能告警分析。☆135Updated 7 months ago
- 复现Drone-YOLOv8s,论文三明治结构中DW卷积核存在疑点,均改为3*3.☆24Updated last year
- 细粒度图像分类之十二猫分类,对比ResNet和ViT两者模型性能。☆45Updated 3 years ago
- Building a VLM model starts from the basic module.☆18Updated last year
- 这是一个stable-diffusion的库。☆125Updated 2 years ago
- yolo master 本课程主要对yolo系列模型进行介绍,包括各版本模型的结构,进行的改进等,旨在帮助学习者们可以了解和掌握主要yolo模型的发展脉络,以期在各自的应用领域可以进一步创新并在自己的任务上达到较好的效果。☆255Updated 4 months ago
- A mini assistant to help you read paper quickly☆54Updated 6 months ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆27Updated last year
- 视频理解:千问视频多模态模型 & Dify☆65Updated last year
- ☆21Updated 2 years ago
- 八戒-Chat是利用《西游记》剧本中所有关于猪八戒的台词和语句,以及Chat-GPT-3.5生成的相关问题结果,基于Internlm进行QLoRA微调得到的模仿猪八戒语气的聊天语言模型。☆26Updated 4 months ago
- Hugging Vision, Hugging AGI.☆173Updated 2 weeks ago
- 基于计算机视觉的智慧养老系统通过(模拟)多组摄像头实时拍摄到的画面,用计算机视觉技术实时分析老人的情感、是否有人摔倒、是否有人闯入禁止区域、老人是否有和义工互动、分析是否有陌生人出现并追踪陌生人。一旦上述事件发生,该事件会立即插入到数据库中。这些事件数据被实时地更新在报表中…☆186Updated 2 years ago
- 基于Yolov5的Vue前端目标检测和训练可视化系统☆77Updated 3 years ago
- NLP_Study_Demo☆167Updated last year
- 半自动标注系统是基于BS架构,由鹏城实验室自主研发,集成视频抽帧,目标检测、视频跟踪、ReID分类、人脸检测等算法,实现了对图像,视频的自动标注,并可以对自动算法的结果进行人工标注,最终得到标注结果,同时也可以对视频、图片、医疗(包括dicom文件及病理图像)相关的数据进行…☆193Updated 2 years ago