nocaps-org / image-feature-extractorsLinks

Feature extraction and visualization scripts for nocaps baselines.

☆18

Alternatives and similar repositories for image-feature-extractors

Users that are interested in image-feature-extractors are comparing it to the libraries listed below

Sorting:

ruotianluo / GoogleConceptualCaptioning
☆54Updated 5 years ago
nocaps-org / updown-baseline
Baseline model for nocaps benchmark, ICCV 2019 paper "nocaps: novel object captioning at scale".
☆76Updated 2 years ago
airsplay / VisualRelationships
Data of ACL 2019 Paper "Expressing Visual Relationships via Language".
☆62Updated 5 years ago
lichengunc / pretrain-vl-data
Pre-trained V+L Data Preparation
☆46Updated 5 years ago
yuleiniu / rva
Code for CVPR'19 "Recursive Visual Attention in Visual Dialog"
☆64Updated 2 years ago
SeleenaJM / CapEval
An image-oriented evaluation tool for image captioning systems (EMNLP-IJCNLP 2019)
☆38Updated 5 years ago
jayleicn / TVQA
[EMNLP 2018] PyTorch code for TVQA: Localized, Compositional Video Question Answering
☆181Updated 3 years ago
TheShadow29 / zsgnet-pytorch
Official implementation of ICCV19 oral paper Zero-Shot grounding of Objects from Natural Language Queries (https://arxiv.org/abs/1908.071…
☆71Updated 5 years ago
Yusics / bist-parser
Scene Graph Parsing as Dependency Parsing
☆41Updated 6 years ago
LuoweiZhou / densecap
Dense video captioning in PyTorch
☆41Updated 6 years ago
ronghanghu / snmn
Code release for Hu et al., Explainable Neural Computation via Stack Neural Module Networks. in ECCV, 2018
☆71Updated 6 years ago
XiangChenchao / DDPN
Rethinking Diversified and Discriminative Proposal Generation for Visual Grounding
☆23Updated 7 years ago
lichengunc / speaker_listener_reinforcer
Torch Implementation of Speaker-Listener-Reinforcer for Referring Expression Generation and Comprehension
☆34Updated 7 years ago
ruotianluo / DiscCaptioning
Code for Discriminability objective for training descriptive captions(CVPR 2018)
☆109Updated 5 years ago
lichengunc / refer-parser2
Referring Expression Parser
☆27Updated 7 years ago
yuleiniu / vc
Code for CVPR'18 "Grounding Referring Expressions in Images by Variational Context"
☆30Updated 7 years ago
ronghanghu / lcgn
Code release for Hu et al., Language-Conditioned Graph Networks for Relational Reasoning. in ICCV, 2019
☆92Updated 6 years ago
satwikkottur / clevr-dialog
Repository to generate CLEVR-Dialog: A diagnostic dataset for Visual Dialog
☆49Updated 5 years ago
GuessWhatGame / guesswhat
GuessWhat?! Baselines
☆74Updated 3 years ago
zilongzheng / visdial-gnn
PyTorch code for Reasoning Visual Dialogs with Structural and Partial Observations
☆42Updated 4 years ago
Cold-Winter / vqs
VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation
☆23Updated 8 years ago
ronghanghu / gqa_single_hop_baseline
A simple but well-performing "single-hop" visual attention model for the GQA dataset
☆20Updated 6 years ago
bezorro / ACMN-Pytorch
Visual Question Reasoning on General Dependency Tree
☆30Updated 7 years ago
aimagelab / speaksee
PyTorch library for Visual-Semantic tasks
☆29Updated 3 years ago
yiyang92 / vae_captioning
Implementation of Diverse and Accurate Image Description Using a Variational Auto-Encoder with an Additive Gaussian Encoding Space
☆59Updated 7 years ago
ExplorerFreda / VSE-C
[COLING 2018] Learning Visually-Grounded Semantics from Contrastive Adversarial Samples.
☆57Updated 6 years ago
tgGuo15 / PriorImageCaption
☆30Updated 7 years ago
doubledaibo / clcaption_nips2017
Contrastive Learning for Image Captioning
☆51Updated 7 years ago
richardaecn / cvpr18-caption-eval
Learning to Evaluate Image Captioning. CVPR 2018
☆84Updated 7 years ago
jayleicn / TVQAplus
[ACL 2020] PyTorch code for TVQA+: Spatio-Temporal Grounding for Video Question Answering
☆130Updated 3 years ago