tanishqgautam / Image-CaptioningLinks

Implemented 3 different architectures to tackle the Image Caption problem, i.e, Merged Encoder-Decoder - Bahdanau Attention - Transformers

☆40

Alternatives and similar repositories for Image-Captioning

Users that are interested in Image-Captioning are comparing it to the libraries listed below

Sorting:

Dantekk / Image-Captioning
Image Captioning using CNN and Transformer.
☆54Updated 3 years ago
dksifoua / Neural-Image-Caption-Generator
In this project, I define and train an image-to-caption model that can produce descriptions for real world images with Flickr-8k dataset.
☆7Updated last year
ajamjoom / Image-Captions
BERT + Image Captioning
☆132Updated 4 years ago
aravindvarier / Image-Captioning-Pytorch
Hyperparameter analysis for Image Captioning using LSTMs and Transformers
☆26Updated last year
SubhamIO / Image-Captioning-using-Attention-Mechanism-Local-Attention-and-Global-Attention-
Implemented Image Captioning Model using both Local and Global Attention Techniques and API'fied the model using FLASK
☆26Updated 5 years ago
saahiluppal / catr
Image Captioning Using Transformer
☆268Updated 3 years ago
dabasajay / Image-Caption-Generator
A neural network to generate captions for an image using CNN and RNN with BEAM Search.
☆305Updated 4 years ago
RoyalSkye / Image-Caption
Using LSTM or Transformer to solve Image Captioning in Pytorch
☆78Updated 4 years ago
Shreyz-max / Video-Captioning
Video Captioning is an encoder decoder mode based on sequence to sequence learning
☆136Updated last year
hlamba28 / Automatic-Image-Captioning
Generating Captions for images using Deep Learning
☆121Updated 6 years ago
rajesh-bhat / dhs_summit_2019_image_captioning
Image captioning using attention models
☆39Updated 5 years ago
krasserm / fairseq-image-captioning
Transformer-based image captioning extension for pytorch/fairseq
☆317Updated 4 years ago
ntrang086 / image_captioning
generate captions for images using a CNN-RNN model that is trained on the Microsoft Common Objects in COntext (MS COCO) dataset
☆80Updated 7 years ago
ntusteeian / VQA_CNN-LSTM
Pytorch implementation of VQA: Visual Question Answering (https://arxiv.org/pdf/1505.00468.pdf) using VQA v2.0 dataset for open-ended ta…
☆20Updated 5 years ago
kaylode / caption-transformer
Image captioning with Transformer
☆14Updated 3 years ago
rammyram / image_captioning
image captioning trained using COCO dataset in pytorch
☆36Updated 5 years ago
kahotsang / image-captioning
Simple image-captioning model using Flickr8K dataset
☆15Updated 3 years ago
tbmoon / basic_vqa
Pytorch VQA : Visual Question Answering (https://arxiv.org/pdf/1505.00468.pdf)
☆95Updated last year
anhtuan85 / TensorFlow-Advanced-Techniques-Specialization
Deeplearning.AI TensorFlow Advanced Techniques Specialization Solution
☆49Updated 4 years ago
siddsriv / Image-captioning
Using a CNN-LSTM hybrid network to generate captions for images
☆17Updated 5 years ago
IsaacRodgz / ConcatBERT
Baseline model for multimodal classification based on images and text. Text representation obtained from pretrained BERT base model and i…
☆41Updated 2 years ago
rizavelioglu / hateful_memes-hate_detectron
[NeurIPS'20-Competition] Detecting Hate Speech in Memes Using Multimodal Deep Learning Approaches: Prize-winning solution to Hateful Meme…
☆61Updated last year
VinitSR7 / Image-Caption-Generation
Image Captioning: Implementing the Neural Image Caption Generator
☆21Updated 4 years ago
MiteshPuthran / Image-Caption-Generator
The LSTM model generates captions for the input images after extracting features from pre-trained VGG-16 model. (Computer Vision, NLP, De…
☆87Updated 5 years ago
kalpesh22-21 / Image_Captioning_using_Hugging_Face
In this project Flikr8K dataset was used to train an Image Captioning model Using Hugging face Transformer.
☆9Updated 3 years ago
diardanoraihan / Text_Classification_Capstone
Evaluate the performance of several state-of-the-art deep learning techniques on various text classification datasets. This project is pa…
☆27Updated 4 years ago
yurayli / image-caption-pytorch
image captioning with flikr8k dataset
☆14Updated 3 years ago
abdelhadie-almalla / image_captioning
☆12Updated last year
sauravraghuvanshi / Udacity-Computer-Vision-Nanodegree-Program
This repositary contain all my exercises and projects of Udacity Computer Vision Nanodegree Program
☆55Updated 2 years ago
yikuan8 / Transformers-VQA
An implementation that downstreams pre-trained V+L models to VQA tasks. Now support: VisualBERT, LXMERT, and UNITER
☆164Updated 2 years ago