sugarandgugu / Text2Image-RetrievalLinks
计算机视觉课程设计-基于Chinese-CLIP的图文检索系统
☆66Updated last year
Alternatives and similar repositories for Text2Image-Retrieval
Users that are interested in Text2Image-Retrieval are comparing it to the libraries listed below
Sorting:
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆40Updated last year
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 2 years ago
- 基于多模态检索的互联网图文匹配☆14Updated last year
- 毕业设计:《基于CLIP模型的视频文本检索设计与实现》☆11Updated 10 months ago
- 多模态视频分类模型☆21Updated 2 years ago
- Building a VLM model starts from the basic module.☆16Updated last year
- 基于ClipCap的看图说话Image Caption模型☆302Updated 3 years ago
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆228Updated 2 years ago
- 2024.06.19 本项目使用Chinese-CLIP搭建文搜图/图搜图页面,旨在帮助用户快速使用跨模态检索任务。本项目代码针对MUGE数据集约19w(189585张)数据作为底库数据。本项目提供了提取特征, 检索, 以及uI代码。☆18Updated 11 months ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆23Updated 10 months ago
- Build a simple basic multimodal large model from scratch. 从零搭建一个简单的基础多模态大模型🤖☆40Updated 11 months ago
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆74Updated last year
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆77Updated 2 years ago
- WWW2025 Multimodal Intent Recognition for Dialogue Systems Challenge☆123Updated 6 months ago
- 商品图像检索、多模态、深度学习☆31Updated 3 years ago
- ☆56Updated last year
- ☆48Updated last year
- 一些大语言模型和多模态模型的应用,主要包括小模型,Agent,跨模态搜索,OCR、RAG、ChatBot等等☆171Updated 3 weeks ago
- Research Code for Multimodal-Cognition Team in Ant Group☆147Updated 2 weeks ago
- Implementation of our paper, 'Unifying Two-Stream Encoders with Transformers for Cross-Modal Retrieval.'☆24Updated last year
- a super easy clip model with mnist dataset for study☆117Updated last year
- 本项目使用LLaVA 1.6多模态模型实现以文搜图和以图搜图功能。☆23Updated last year
- A project that can generate ancient poems based on pictures, including CLIP, T5, GPT2 models☆22Updated 3 months ago
- 中文CLIP预训练模型☆413Updated 2 years ago
- transformers结构的中文OFA模型☆135Updated 2 years ago
- ☆25Updated 9 months ago
- 多模态 MM +Chat 合集☆266Updated 2 weeks ago
- Cross-Modal Implicit Relation Reasoning and Aligning for Text-to-Image Person Retrieval (CVPR 2023)☆235Updated 2 months ago
- 八戒-Chat是利用《西游记》剧本中所有关于猪八戒的台词和语句,以及Chat-GPT-3.5生成的相关问题结果,基于Internlm进行QLoRA微调得到的模仿猪八戒语气的聊天语言模型。☆23Updated 10 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated 10 months ago