soup-L / Multimodal_retrievalLinks
基于多模态检索的互联网图文匹配
☆14Updated last year
Alternatives and similar repositories for Multimodal_retrieval
Users that are interested in Multimodal_retrieval are comparing it to the libraries listed below
Sorting:
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆80Updated 2 years ago
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 2 years ago
- 商品图像检索、多模态、深度学习☆31Updated 3 years ago
- a super easy clip model with mnist dataset for study☆134Updated last year
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆41Updated 2 years ago
- 这里用来存储做人工智能项目的代码和参加数据挖掘比赛的代码☆102Updated last month
- WWW2025 Multimodal Intent Recognition for Dialogue Systems Challenge☆125Updated 9 months ago
- 人工智能实验五:多模态情感分类☆15Updated 3 years ago
- 本项目采用多模态特征融合和引入外部知识的方式来检测短视频谣言,创新性地引入了对比学习的方式实现了谣言的区分☆22Updated last year
- 大模型文本分类☆79Updated last year
- 多模态情感分析——基于BERT+ResNet的多种融合方法☆317Updated 2 years ago
- 基于ChatGLM3-6b的智能对话系统,集成了RAG、知识图谱、Agent、多模态等技术来增强大模型的回复质量。☆52Updated last year
- kaggle 2024 Eedi 第10名 金牌方案☆39Updated 8 months ago
- 这是一个clip-pytorch的模型,可以训练自己的数据集。☆239Updated 2 years ago
- ☆161Updated 2 years ago
- 基于医疗领域知识图谱的问答系统,同时使用了chatGPT、chatGLM4等方式生成医学知识图谱。☆56Updated last year
- 本项目利用医学领域的 CoT 数据对 Deepseek-R1-Distill-Qwen-7B 进行微调,通过 QLoRA 量化和 Unsloth 加速训练,显著提升模型在复杂医学推理任务中的慢思考能力。知识蒸馏技术使轻量级模型获得大模型的推理优势,实现高效、准确且具有解释性…☆25Updated 5 months ago
- 基于CLIP实现以文精准搜图☆14Updated last year
- 快速入门RAG与私有化部署☆204Updated last year
- transformer,机器翻译,中文--英文☆82Updated 2 years ago
- DIP & NLP期末大作业 — 课程设计☆19Updated 2 years ago
- GAIIC赛道一:影像学 NLP — 医学影像诊断报告生成 [A100换你大棚甜瓜 Rank-12 方案]☆66Updated 2 years ago
- 多模态视频分类模型☆22Updated 2 years ago
- 期末项目图片+文本多模态情感分析☆24Updated 2 years ago
- 对llama3进行全参微调、lora微调以及qlora微调。☆209Updated 10 months ago
- 学习深度学习不如边写代码边学习,实际操作一遍才能理解数据的变换过程,参数的训练过程,这里整合了B站的jupter代码,可以结合着B站的视频边看边练,希望能对大家有帮助。☆137Updated 2 years ago
- 通义千问的DPO训练☆52Updated 11 months ago
- 零基础入门推荐系统 - 新闻推荐 Top2☆271Updated 4 years ago
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆210Updated last year
- Transformer在CV和NLP领域的变体模型的从零解读:Transformer;VIT;Swin Transformer☆332Updated 3 years ago