tianruochen / MultimodalVideoTagLinks
多模态视频分类模型
☆29Updated 3 years ago
Alternatives and similar repositories for MultimodalVideoTag
Users that are interested in MultimodalVideoTag are comparing it to the libraries listed below
Sorting:
- 这是一个基于Pytorch平台、Transformer框架实现的视频描述生成 (Video Captioning) 深度学习模型。 视频描述生成任务指的是:输入一个视频,输出一句描述整个视频内容的文字(前提是视频较短且可以用一句话来描述)。本repo主要目的是帮助视力障碍…☆99Updated 3 years ago
- 利用pytorch实现图像分类的一个完整的代码,训练,预测,TTA,模型融合,模型部署,cnn提取特征,svm或者随机森林等进行分类,模型蒸馏,一个完整的代码☆31Updated 5 years ago
- 中文CLIP:自定义数据集,可根据文图提取向量,实现文图匹配。☆22Updated 3 years ago
- 人脸识别、人脸细粒度表情识别、异常行为检测和识别☆12Updated 3 years ago
- 使用pytorch完成的一个多模态分类任务,文本和图像部分分别使用了bert和resnet提取特征(在config里可以组合多种模型),在我的小规模数据集上取得了良好的性能(验证集acc96%)☆83Updated 2 years ago
- 多模态融合情感分析☆139Updated 5 years ago
- Papers, codes collection of video summarization / video highlight detection / video key frame selection☆36Updated 4 years ago
- 基于ClipCap的看图说话Image Caption模型☆320Updated 3 years ago
- 基于PaddlePaddle的智慧课堂实时监测系统—EduWatching☆79Updated 2 years ago
- 基于内容的图像检索系统(Content Based Image Retrieval,简称 CBIR)☆69Updated 7 years ago
- DIP & NLP期末大作业 — 课程设计☆19Updated 3 years ago
- Frames Extraction With OpenCV and Python☆15Updated 5 years ago
- Tiny Kinetics-400 for test☆96Updated last year
- 可以成功Lora微调的Qwen-VL模型☆16Updated 2 years ago
- 多模态情感分析——基于BERT+ResNet的多种融合方法☆352Updated 3 years ago
- 毕业设计:《基于CLIP模型的视频文本检索设计与实现》☆17Updated last year
- 这个项目将 RAVDESS 数据集切割成 1s 短语音,利 用 openSMILE+CNN 进行训练,目标是将短语音分类到四种情感中,分别是:开心(happy)、悲伤(sad)、生气(angry)和中性(neutral)。最后准确率达到 76% 左右。☆64Updated 4 years ago
- 使用django+pyecharts+PP-Human开发的动态数据大屏, 有人流数据的采集入库, 打架、摔倒等事件警报,口罩检测等实用功能。边缘端版本使用onnx推理提升效率,服务端版本支持视频流推拉☆33Updated 2 years ago
- 视频分类标注、视频时空标注☆44Updated 2 years ago
- ☆22Updated 2 years ago
- 基于ultralytics训练的行人跌倒检测模型☆19Updated 2 years ago
- 疲劳检测☆11Updated 4 years ago
- 视频的文本摘要(标注),输入一段视频,通过深度学习网络和人工智能程序识别视频主要表达的意思(Input a video output a txt decribing the video)。☆188Updated 7 years ago
- 人脸全家桶--RetinaFace(MobileNetV2 and ResNet50 with Gender)、ArcFace、FaceBeautyRank and FaceRetrieval☆47Updated 5 years ago
- 多模态融合情感分析☆38Updated 4 years ago
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆85Updated 2 years ago
- 商品图像检索、多模态、深度学习☆32Updated 4 years ago
- A demo for multi-modal emotion recognition.(多模态情感识别demo)☆91Updated last year
- Multimodal short video classification task, integrating video, image, audio and text modes for short video classification☆19Updated 5 years ago
- 人工智能实验五:多模态情感分类☆16Updated 3 years ago