sugarandgugu / Text2Image-Retrieval
计算机视觉课程设计-基于Chinese-CLIP的图文检索系统
☆53Updated last year
Alternatives and similar repositories for Text2Image-Retrieval:
Users that are interested in Text2Image-Retrieval are comparing it to the libraries listed below
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 2 years ago
- 基于多模态检索的互联网图文匹配☆12Updated 10 months ago
- DIP & NLP期末大作业 — 课程设计☆18Updated 2 years ago
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆30Updated last year
- 基于ClipCap的看图说话Image Caption模型☆294Updated 2 years ago
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆70Updated last year
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆19Updated 5 months ago
- 商品图像检索、多模态、深度学习☆31Updated 3 years ago
- 人工智能实验五:多模态情感分类☆14Updated 2 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆47Updated last year
- 细粒度图像分类之十二猫分类,对比ResNet和ViT两者模型性能。☆35Updated 2 years ago
- ☆15Updated 9 months ago
- 一些大语言模型和多模态模型的应用,主要包括Rag,小模型,Agent,跨模态搜索,OCR等等☆145Updated 2 months ago
- ☆81Updated 5 months ago
- 稷丰-首个开源中文农业多模态大模型☆54Updated 7 months ago
- Research Code for Multimodal-Cognition Team in Ant Group☆131Updated 6 months ago
- LLM+RAG for QA☆21Updated last year
- DeepSpeed Tutorial☆93Updated 5 months ago
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆62Updated last year
- 训练一个对中文支持更好的LLaVA模型,并开源训练代码和数据。☆44Updated 4 months ago
- 多模态视频分类模型☆16Updated 2 years ago
- WWW2025 Multimodal Intent Recognition for Dialogue Systems Challenge☆114Updated 2 months ago
- VLE: Vision-Language Encoder (VLE: 视觉-语言多模态预训练模型)☆186Updated last year
- 八戒-Chat是利用《西游记》剧本中所有关于猪八戒的台词和语句,以及Chat-GPT-3.5生成的相关问题结果,基于Internlm进行QLoRA微调得到的模仿猪八戒语气的聊天语言模型。☆24Updated 5 months ago
- 基于Pytorch的图像分类框架☆82Updated this week
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆206Updated last year
- 本项目采用多模态特征融合和引入外部知识的方式来检测短视频谣言,创新性地引入了对比学习的方式实现了谣言的区分☆17Updated last year
- 本项目使用LLaVA 1.6多模态模型实现以文搜图和以图搜图功能。☆19Updated 10 months ago
- 中文CLIP预训练模型☆400Updated 2 years ago
- 通义千问的DPO训练☆30Updated 3 months ago