eric-xw / Zero-Shot-Video-Captioning

☆33

Related projects: ⓘ

AmingWu / CCN
Connective Cognition Network for Directional Visual Commonsense Reasoning
☆15Updated 3 years ago
JonghwanMun / TextguidedATT
The implementation of Text-guided Attention Model for Image Captioning
☆22Updated 6 years ago
tgGuo15 / PriorImageCaption
☆29Updated 5 years ago
doubledaibo / 2dcaption_eccv2018
Rethinking the Form of Latent States in Image Captioning
☆21Updated 6 years ago
chitwansaharia / HACAModel
Implementation of "Watch, Listen, and Describe: Globally and Locally Aligned Cross-Modal Attentions for Video Captioning" (https://arxiv.…
☆26Updated 5 years ago
rasoolfa / videocap
Memory-augmented Attention Modelling for Videos
☆10Updated 7 years ago
AmingWu / Multi-modal-Circulant-Fusion
the source code of Multi-modal Circulant Fusion (MCF) for Temporal Activity Localization
☆22Updated 5 years ago
yiyang92 / vae_captioning
Implementation of Diverse and Accurate Image Description Using a Variational Auto-Encoder with an Additive Gaussian Encoding Space
☆57Updated 6 years ago
doubledaibo / clcaption_nips2017
Contrastive Learning for Image Captioning
☆51Updated 6 years ago
yj-yu / lsmdc
☆31Updated 5 years ago
gujiuxiang / Video_Captioning.pytorch
☆34Updated this week
ruotianluo / refexp-comprehension
Referring expression comprehension on ReferIt(RefClef)
☆10Updated 7 years ago
KaihuaTang / VCTree-Visual-Question-Answering
Code for the Visual Question Answering (VQA) part of CVPR 2019 oral paper: "Learning to Compose Dynamic Tree Structures for Visual Contex…
☆35Updated 5 years ago
zhaoluffy / hLSTMat
The paper of "Hierarchical LSTM with Adjusted Temporal Attention for Video Captioning" accepted in International Joint Conference on Arti…
☆18Updated 7 years ago
gujiuxiang / Visual_Question_Answering.pytorch
☆26Updated this week
yikang-li / iQAN
Visaul Question Generation as Dual Task of Visual Question Answering (PyTorch Version)
☆82Updated 6 years ago
LuoweiZhou / densecap
Dense video captioning in PyTorch
☆41Updated 5 years ago
lichengunc / speaker_listener_reinforcer
Torch Implementation of Speaker-Listener-Reinforcer for Referring Expression Generation and Comprehension
☆33Updated 6 years ago
bupt-cist / DFAF-for-VQA.pytorch
☆47Updated this week
Yusics / bist-parser
Scene Graph Parsing as Dependency Parsing
☆41Updated 5 years ago
captanlevi / Meaning-guided-video-captioning-
Here we describe a new approach to train a video captioning neural network , that is not only based on the normal cross entropy loss for …
☆8Updated 4 years ago
danieljf24 / w2vv
Word2VisualVec : Predicting Visual Features from Text for Image and Video Caption Retrieval
☆69Updated 4 years ago
ruotianluo / Context-aware-ZSR
Official code for paper Context-aware Zero-shot Recognition (https://arxiv.org/abs/1904.09320 to appear at AAAI2020)
☆57Updated 4 years ago
bezorro / ACMN-Pytorch
Visual Question Reasoning on General Dependency Tree
☆30Updated 6 years ago
XiangChenchao / DDPN
Rethinking Diversified and Discriminative Proposal Generation for Visual Grounding
☆22Updated 6 years ago
batra-mlp-lab / avsd
[CVPR 2019] Pytorch code for Audio Visual Scene-Aware Dialog
☆33Updated 3 years ago
wenhuchen / Semi-Supervised-Image-Captioning
Code for "bootstrap, review, decode: using out-of-domain textual data to improve image captioning"
☆20Updated 7 years ago
zilongzheng / visdial-gnn
PyTorch code for Reasoning Visual Dialogs with Structural and Partial Observations
☆42Updated 3 years ago
jamespark3922 / adv-inf
Adversarial Inference for Multi-Sentence Video Descriptions (CVPR 2019)
☆34Updated 5 years ago
bupt-cist / vqa-playground-pytorch
Code for NIPS 2018 paper, "Chain of Reasoning for Visual Question Answering"
☆28Updated 5 years ago