ajaysub110 / A-Neural-Compositional-Paradigm-for-Image-CaptioningLinks

Implementation of 'A Neural Compositional Paradigm for Image Captioning' by B. Dai, S.Fidler, D. Lin

☆12

Alternatives and similar repositories for A-Neural-Compositional-Paradigm-for-Image-Captioning

Users that are interested in A-Neural-Compositional-Paradigm-for-Image-Captioning are comparing it to the libraries listed below

Sorting:

daqingliu / CAVP
Code release for Context-Aware Visual Policy Network for Sequence-Level Image Captioning (MM 2018) and Context-Aware Visual Policy Networ…
☆46Updated 5 years ago
andyweizhao / Multitask_Image_Captioning
☆22Updated 6 years ago
cswhjiang / Recurrent_Fusion_Network
Source code for "Recurrent Fusion Network for Image Captioning".
☆23Updated 6 years ago
jialinwu17 / self_critical_vqa
Code for NeurIPS 2019 paper ``Self-Critical Reasoning for Robust Visual Question Answering''
☆41Updated 5 years ago
shijx12 / XNM-Net
Pytorch implementation of "Explainable and Explicit Visual Reasoning over Scene Graphs "
☆93Updated 6 years ago
gujiuxiang / Stack-Captioning
Stack-Captioning: Coarse-to-Fine Learning for Image Captioning
☆62Updated 7 years ago
gujiuxiang / unpaired_image_captioning
Unpaired Image Captioning
☆36Updated 4 years ago
fanchenyou / HME-VideoQA
Heterogeneous Memory Enhanced Multimodal Attention Model for VideoQA
☆54Updated 3 years ago
mtanti / coco-caption
☆38Updated 7 years ago
lukemelas / image-paragraph-captioning
[EMNLP 2018] Training for Diversity in Image Paragraph Captioning
☆89Updated 5 years ago
yuleiniu / rva
Code for CVPR'19 "Recursive Visual Attention in Visual Dialog"
☆64Updated 2 years ago
zilongzheng / visdial-gnn
PyTorch code for Reasoning Visual Dialogs with Structural and Partial Observations
☆42Updated 4 years ago
jayleicn / TVQAplus
[ACL 2020] PyTorch code for TVQA+: Spatio-Temporal Grounding for Video Question Answering
☆129Updated 2 years ago
AishwaryaAgrawal / GVQA
Code for the Grounded Visual Question Answering (GVQA) model from the paper -- Don't Just Assume; Look and Answer: Overcoming Priors for …
☆23Updated 3 years ago
ruotianluo / DiscCaptioning
Code for Discriminability objective for training descriptive captions(CVPR 2018)
☆109Updated 5 years ago
doubledaibo / clcaption_nips2017
Contrastive Learning for Image Captioning
☆50Updated 7 years ago
erobic / negative_analysis_of_grounding
Shows visual grounding methods can be right for the wrong reasons! (ACL 2020)
☆23Updated 5 years ago
AmingWu / CCN
Connective Cognition Network for Directional Visual Commonsense Reasoning
☆15Updated 4 years ago
qingzwang / DiversityMetrics
This is the implementation of self-CIDEr and LSA-based diversity metrics (only for python 2.7).
☆36Updated 3 years ago
chitwansaharia / HACAModel
Implementation of "Watch, Listen, and Describe: Globally and Locally Aligned Cross-Modal Attentions for Video Captioning" (https://arxiv.…
☆26Updated 6 years ago
XgDuan / WSDEC
Weakly Supervised Dense Event Captioning in Videos, i.e. generating multiple sentence descriptions for a video in a weakly-supervised man…
☆104Updated 5 years ago
jamespark3922 / adv-inf
Adversarial Inference for Multi-Sentence Video Descriptions (CVPR 2019)
☆34Updated 5 years ago
wenhuchen / Semi-Supervised-Image-Captioning
Code for "bootstrap, review, decode: using out-of-domain textual data to improve image captioning"
☆20Updated 8 years ago
chrisc36 / bottom-up-attention-vqa
BottomUpTopDown VQA model with question-type debiasing
☆22Updated 5 years ago
yiyang92 / caption-stylenet_tensorflow
Tensorflow implementation of C. Gan, Z. Gan, X. He, J. Gao, and L. Deng, “StyleNet: Generating Attractive Visual Captions with Styles”
☆9Updated 6 years ago
szq0214 / MSR-VTT-Challenge
Video to Language Challenge (MSR-VTT Challenge 2016)
☆31Updated 7 years ago
ramakanth-pasunuru / video_captioning_rl
Code and Models for paper "Reinforced Video Captioning with Entailment Rewards (EMNLP 2017)"
☆44Updated 5 years ago
VisionLearningGroup / Text-to-Clip_Retrieval
Implementation for "Multilevel Language and Vision Integration for Text-to-Clip Retrieval"
☆50Updated 6 years ago
Deanplayerljx / tab-vcr
Pytorch implementation for our NeurIPS 2019 paper "TAB-VCR: Tags and Attributes based VCR Baselines" https://arxiv.org/abs/1910.14671
☆18Updated 4 years ago
husthuaan / AAT
Code for paper "Adaptively Aligned Image Captioning via Adaptive Attention Time". NeurIPS 2019
☆50Updated 5 years ago