zglxjtu / Baidu-Business-AI-Technology-Innovation-Competition-Track-2-Advertising-Image-Description-Generation
百度商业AI技术创新大赛赛道二:广告图片描述生成 Rank3方案分享
☆10Updated 4 months ago
Alternatives and similar repositories for Baidu-Business-AI-Technology-Innovation-Competition-Track-2-Advertising-Image-Description-Generation:
Users that are interested in Baidu-Business-AI-Technology-Innovation-Competition-Track-2-Advertising-Image-Description-Generation are comparing it to the libraries listed below
- 基于多模态检索的互联网图文匹配☆12Updated 11 months ago
- WWW2025 Multimodal Intent Recognition for Dialogue Systems Challenge☆114Updated 3 months ago
- ATEC2023——赛道一: 大模型的知识引入Rank7方案分享☆21Updated 4 months ago
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆72Updated last year
- Strong baselines for tampered text detection in pure vision domain☆24Updated 2 months ago
- 本项目采用多模态特征融合和引入外部知识的方式来检测短视频谣言,创新性地引入了对比学习的方式实现了谣言的区分☆17Updated last year
- 🏆🥈🥉 TianChi/天池 AIStudio Kaggle iFLYTEKAI...☆72Updated 9 months ago
- ☆15Updated last year
- 2022阿里天池真实场景篡改图像检测挑战赛-冠军方案(1/1149)☆183Updated 2 years ago
- OpenMMLab Semantic Segmentation Toolbox and Benchmark.☆54Updated 2 years ago
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 2 years ago
- Share some deep learning knowledge and reproduce the model framework☆30Updated 3 years ago
- 一些大语言模型和多模态模型的应用,主要包括Rag,小模型,Agent,跨模态搜索,OCR等等☆156Updated 3 months ago
- 这里用来存储做人工智能项目的代码和参加数据挖掘比赛的代码☆87Updated 3 months ago
- [CVPR2023] Towards Robust Tampered Text Detection in Document Image: New Dataset and New Solution☆145Updated last month
- Build a simple basic multimodal large model from scratch. 从零搭建一个简单的基础多模态大模型🤖☆31Updated 8 months ago
- kaggle 2024 Eedi 第10名 金牌方案☆29Updated 2 months ago
- 在两位好友的帮助下,我利用过去几年的微信聊天记录微调(ptuning)清华的开源大模型ChatGLM2-6B,训练了一个“自己”,受Doctor Who里面一个角色的启发,我将这个娱乐项目命名为Me(吾)。☆10Updated 11 months ago
- 天池&ICDAR2023篡改图像检测比赛方案☆22Updated last year
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆186Updated last year
- pytorch☆40Updated last year
- 人工智能实验五:多模态情感分类☆14Updated 2 years ago
- 八戒-Chat是利用《西游记》剧本中所有关于猪八戒的台词和语句,以及Chat-GPT-3.5生成的相关问题结果,基于Internlm进行QLoRA微调得到的模仿猪八戒语气的聊天语言模型。☆23Updated 7 months ago
- MCM(Multimodal Chinese Medical LLM)多模态中医问诊大模型☆99Updated 8 months ago
- 天池-真实场景篡改图像检测挑战赛☆12Updated 2 years ago
- 多模态视频分类模型☆17Updated 2 years ago
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆46Updated last month
- 计算机视觉课程设计-基于Chinese-CLIP的图文检索系统☆57Updated last year
- GAIIC赛道一:影像学 NLP — 医学影像诊断报告生成 [A100换你大棚甜瓜 Rank-12 方案]☆61Updated last year
- Tianchi Competition "Forgeries and Forensics" Track 2☆70Updated last year