soup-L / Multimodal_retrieval
基于多模态检索的互联网图文匹配
☆14Updated last year
Alternatives and similar repositories for Multimodal_retrieval
Users that are interested in Multimodal_retrieval are comparing it to the libraries listed below
Sorting:
- 计算机视觉课程设计-基于Chinese-CLIP的图文检索系统☆64Updated last year
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆77Updated 2 years ago
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆40Updated last year
- 商品图像检索、多模态、深度学习☆31Updated 3 years ago
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆21Updated 2 years ago
- 天池算法比赛《BetterMixture - 大模型数据混合挑战赛》的第一名top1解决方案☆30Updated 10 months ago
- 多模态情感分析——基于BERT+ResNet的多种融合方法☆302Updated 2 years ago
- WWW2025 Multimodal Intent Recognition for Dialogue Systems Challenge☆120Updated 6 months ago
- DIP & NLP期末大作业 — 课程设计☆18Updated 2 years ago
- 使用pytorch复现vit模型(图像分类)☆28Updated 3 years ago
- 本项目采用多模态特征融合和引入外部知识的方式来检测短视频谣言,创新性地引入了对比学习的方式实现了谣言的区分☆20Updated last year
- 个人总结的大模型、自然语言处理NLP、多模态、计算机视觉CV等方向paper的阅读笔记;收集到或者使用到的一些NLP、CV等领域的优秀开源仓库;其他:如数据集、评测leaderboard等☆45Updated last week
- 这里用来存储做人工智能项目的代码和参加数据挖掘比赛的代码☆99Updated 2 months ago
- 人工智能实验五:多模态情感分类☆15Updated 2 years ago
- 基于深度学习的影像学报告多模态检索☆9Updated 4 years ago
- GAIIC赛道一:影像学 NLP — 医学影像诊断报告生成 [A100换你大棚甜瓜 Rank-12 方案]☆66Updated last year
- kaggle 2024 Eedi 第10名 金牌方案☆34Updated 4 months ago
- a super easy clip model with mnist dataset for study☆113Updated last year
- 期末项目图片+文本多模态情感分析☆22Updated last year
- ☆42Updated this week
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆227Updated 2 years ago
- 多模态视频分类模型☆20Updated 2 years ago
- 阿里天池: 2023全球智能汽车AI挑战赛——赛道一:AI大模型检索问答 baseline 80+☆103Updated last year
- 2024.06.19 本项目使用Chinese-CLIP搭建文搜图/图搜图页面,旨在帮助用户快速使用跨模态检索任务。本项目代码针对MUGE数据集约19w(189585张)数据作为底库数据。本项目提供了提取特征, 检索, 以及uI代码。☆18Updated 10 months ago
- 2023全球智能汽车AI挑战赛——赛道一:AI大模型检索问答, 75+ baseline☆57Updated last year
- 基于Swin-transformer训练图像分类并部署web端☆93Updated 2 years ago
- 基于医疗领域知识图谱的问答系统,同时使用了chatGPT、chatGLM4等方式生成医学知识图谱。☆51Updated last year
- 毕业设计:《基于CLIP模型的视频文本检索设计与实现》☆11Updated 9 months ago
- 中文:方便好用的文本分类模型训练加推理全公开!欢迎star后礼貌获取!大体上本项目采用ERINE3.0的base版本将文本转换为语义向量而后做特征进行分类,实测上限极高可以优化后在61分类任务中达到92%准确率。☆47Updated last year
- 中文情感感知计算代码,将中文文本进行多分类,包括传统的字典法、基于bert活transformer的微调以及基于LLM的应用☆11Updated 2 years ago