paperClub-hub / chinese_clipLinks
中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。
☆22Updated 3 years ago
Alternatives and similar repositories for chinese_clip
Users that are interested in chinese_clip are comparing it to the libraries listed below
Sorting:
- 人工智能实验五:多模态情感分类☆16Updated 3 years ago
- 可以成功Lora微调的Qwen-VL模型☆16Updated 2 years ago
- 基于多模态检索的互联网图文匹配☆15Updated last year
- 基于ClipCap的看图说话Image Caption模型☆320Updated 3 years ago
- 一个多模态内容理解算法框架,其中包含数据处理、预训练模型、常见模型以及模型加速等模块。☆324Updated 4 years ago
- 【AIGC 实战入门笔记 —— AIGC 摩天大楼】分享 大语言模型(LLMs),大模型高效微调(SFT),检索增强生成(RAG),智能体(Agent),PPT自动生成, 角色扮演,文生图(Stable Diffusion) ,图像文字识别(OCR),语音识别(ASR),语…☆52Updated 8 months ago
- VLE: Vision-Language Encoder (VLE: 视觉-语言多模态预训练模型)☆194Updated 2 years ago
- Building a VLM model starts from the basic module.☆18Updated last year
- 基于Bilstm + CRF的信息抽取模型☆36Updated 4 years ago
- 基于BERT-CRF的命名实体识别模型☆13Updated 3 years ago
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆82Updated 2 years ago
- CLIP中文encoder☆22Updated 3 years ago
- 该项目旨在通过输入文本描述来检索与之相匹配的图片。☆43Updated 2 years ago
- Chinese CLIP models with SOTA performance.☆60Updated 2 years ago
- DIP & NLP期末大作业 — 课程设计☆19Updated 3 years ago
- 中文CLIP预训练模型☆421Updated 3 years ago
- 此项目用于自动化采集、处理和可视化医疗问答数据,可助力构建高质量医疗问答对数据集。同时提供使用预处理后的数据集对Qwen-7B-Chat进行微调的详细说明。☆23Updated last year
- 本项目主要是利用LSTM来对中文文本进行情感分类,包含四个类别(愤怒,焦虑,抑郁,伤感)☆58Updated 6 years ago
- transformers结构的中文OFA模型☆137Updated 2 years ago
- ATEC2023——赛道一: 大模型的知识引入Rank7方案分享☆26Updated last year
- 一个用YOLO足球视频分析的任务,检测视频中的人与球。 A task of football video analysis to detect people and balls in the video with YOLO☆12Updated 5 years ago
- 抽取式NLP模型(阅读理解模型,MRC)实现词义消歧(WSD)☆14Updated 3 years ago
- ☆31Updated last year
- Multimodal chatbot with computer vision capabilities integrated, our 1st-gen LMM☆101Updated last year
- DIY_resnet+迁移学习+风格迁移☆18Updated 6 years ago
- Workshop on Foundation Model 1st foundation model challenge Track1 codebase (Open TransMind v1.0)☆18Updated 2 years ago
- 使用LLaMA-Factory微调多模态大语言模型的示例代码 Demo of Finetuning Multimodal LLM with LLaMA-Factory☆56Updated last year
- 补充了一些Visualglm缺少的文件,可以对Visualglm进行训练,实例中是对人脸做了面相的识别☆13Updated 2 years ago
- ☆14Updated 2 years ago
- ☆16Updated last year