abdelhadie-almalla / image_captioningLinks

☆12

Alternatives and similar repositories for image_captioning

Users that are interested in image_captioning are comparing it to the libraries listed below

Sorting:

tbmoon / basic_vqa
Pytorch VQA : Visual Question Answering (https://arxiv.org/pdf/1505.00468.pdf)
☆98Updated 2 years ago
Dantekk / Image-Captioning
Image Captioning using CNN and Transformer.
☆55Updated 4 years ago
yikuan8 / Transformers-VQA
An implementation that downstreams pre-trained V+L models to VQA tasks. Now support: VisualBERT, LXMERT, and UNITER
☆165Updated 2 years ago
PaulCCCCCCH / Multimodal-Categorization-of-Crisis-Events-in-Social-Media
An unofficial implementation of the CVPR 2020 paper Multimodal Categorization of Crisis Events in Social Media
☆17Updated 3 years ago
ajamjoom / Image-Captions
BERT + Image Captioning
☆134Updated 4 years ago
krasserm / fairseq-image-captioning
Transformer-based image captioning extension for pytorch/fairseq
☆317Updated 4 years ago
RoyalSkye / Image-Caption
Using LSTM or Transformer to solve Image Captioning in Pytorch
☆79Updated 4 years ago
tanishqgautam / Image-Captioning
Implemented 3 different architectures to tackle the Image Caption problem, i.e, Merged Encoder-Decoder - Bahdanau Attention - Transformer…
☆40Updated 4 years ago
Shivanshu-Gupta / Visual-Question-Answering
CNN+LSTM, Attention based, and MUTAN-based models for Visual Question Answering
☆76Updated 5 years ago
saahiluppal / catr
Image Captioning Using Transformer
☆271Updated 3 years ago
bharathichezhiyan / Multimodal-Meme-Classification-Identifying-Offensive-Content-in-Image-and-Text
Multimodal Meme Classification: Identifying Offensive Content in Image and Text
☆71Updated 2 years ago
LuoweiZhou / VLP
Vision-Language Pre-training for Image Captioning and Question Answering
☆424Updated 3 years ago
SatyamGaba / visual_question_answering
Visual Question Answering in PyTorch with various Attention Models
☆20Updated 5 years ago
ahmedssabir / Textual-Visual-Semantic-Dataset
Visual Semantic Relatedness Dataset for Captioning. CVPRW 2023
☆10Updated last year
Shreyz-max / Video-Captioning
Video Captioning is an encoder decoder mode based on sequence to sequence learning
☆138Updated last year
yashkolli / Video-Summarization-Using-Attention
A Keras Implementation of Supervised Video Summarization using Attention Based Encoder-Decoder Networks
☆29Updated 3 years ago
v-iashin / BMT
Source code for "Bi-modal Transformer for Dense Video Captioning" (BMVC 2020)
☆229Updated 2 years ago
airsplay / py-bottom-up-attention
PyTorch bottom-up attention with Detectron2
☆238Updated 3 years ago
ntusteeian / VQA_CNN-LSTM
Pytorch implementation of VQA: Visual Question Answering (https://arxiv.org/pdf/1505.00468.pdf) using VQA v2.0 dataset for open-ended ta…
☆21Updated 5 years ago
aimagelab / meshed-memory-transformer
Meshed-Memory Transformer for Image Captioning. CVPR 2020
☆540Updated 2 years ago
aravindvarier / Image-Captioning-Pytorch
Hyperparameter analysis for Image Captioning using LSTMs and Transformers
☆26Updated 2 years ago
zarzouram / image_captioning_with_transformers
Pytorch implementation of image captioning using transformer-based model.
☆68Updated 2 years ago
daveredrum / image-captioning
Image captioning models "show and tell" + "show, attend and tell" in PyTorch
☆19Updated 7 years ago
thoailinh / Sentiment-Analysis-using-BERT
☆37Updated 5 years ago
amankhullar / mast
Code for the paper Multimodal Abstractive Summarization with Trimodal Hierarchical Attention
☆20Updated 3 years ago
poojahira / image-captioning-bottom-up-top-down
PyTorch implementation of Image captioning with Bottom-up, Top-down Attention
☆167Updated 6 years ago
salaniz / pycocoevalcap
Python 3 support for the MS COCO caption evaluation tools
☆333Updated last year
232525 / PureT
Implementation of 'End-to-End Transformer Based Model for Image Captioning' [AAAI 2022]
☆69Updated last year
siddsriv / Image-captioning
Using a CNN-LSTM hybrid network to generate captions for images
☆18Updated 6 years ago
WasifurRahman / BERT_multimodal_transformer
☆213Updated 3 years ago