iacercalixto / variational_mmtLinks

Code base for the paper "Latent variable model for multi-modal translation".

☆17

Alternatives and similar repositories for variational_mmt

Users that are interested in variational_mmt are comparing it to the libraries listed below

Sorting:

cooelf / UVR-NMT
Neural Machine Translation with universal Visual Representation (ICLR 2020)
☆90Updated 5 years ago
Eurus-Holmes / MNMT
Pytorch implementation of Multimodal Neural Machine Translation(MNMT).
☆12Updated 4 years ago
iacercalixto / MultimodalNMT
Multi-modal Neural Machine Translation in PyTorch
☆44Updated 7 years ago
henryhungle / MTN
Code for the paper Multimodal Transformer Networks for End-to-End Video-Grounded Dialogue Systems (ACL19)
☆100Updated 3 years ago
shubhamagarwal92 / visdial_conv
This repository contains code used in our ACL'20 paper History for Visual Dialog: Do we really need it?
☆34Updated 2 years ago
yaushian / Tree-Transformer
Implementation of the paper Tree Transformer
☆214Updated 5 years ago
HLTCHKUST / VG-GPLMs
The code repository for EMNLP 2021 paper "Vision Guided Generative Pre-trained Language Models for Multimodal Abstractive Summarization".
☆55Updated 3 years ago
berniebear / Multi-HT100M
☆53Updated 3 years ago
vmurahari3 / visdial-bert
Implementation for "Large-scale Pretraining for Visual Dialog" https://arxiv.org/abs/1912.02379
☆97Updated 5 years ago
ck0123 / improved-bertscore-for-image-captioning-evaluation
☆21Updated last year
dialogtekgeek / AudioVisualSceneAwareDialog
☆27Updated 5 years ago
XMUDeepLIT / DCCN
Code for "Dynamic Context-guided Capsule Network for Multimodal Machine Translation" （ACM MM2020）
☆42Updated 3 years ago
Eurus-Holmes / VAG-NMT
[Reproduce] Code for the EMNLP2018 paper "A Visual Attention Grounding Neural Model for Multimodal Machine Translation".
☆11Updated 5 years ago
hudaAlamri / DSTC7-Audio-Visual-Scene-Aware-Dialog-AVSD-Challenge
☆53Updated 5 years ago
ARIES-LM / GMNMT
☆30Updated 4 years ago
LividWo / Revisit-MMT
☆25Updated 4 years ago
microsoft / M3P
Multitask Multilingual Multimodal Pre-training
☆71Updated 2 years ago
hwanheelee1993 / UMIC
An unreferenced image captioning metric (ACL-21)
☆30Updated last year
ranjaykrishna / iq
Information Maximizing Visual Question Generation
☆67Updated 2 years ago
ChenWu98 / Point-Then-Operate
Code for the ACL 2019 paper ``A Hierarchical Reinforced Sequence Operation Method for Unsupervised Text Style Transfer``
☆45Updated last year
lichengunc / vist_eval
vist story telling evaluation tool
☆21Updated last year
yuleiniu / rva
Code for CVPR'19 "Recursive Visual Attention in Visual Dialog"
☆64Updated 2 years ago
lukemelas / image-paragraph-captioning
[EMNLP 2018] Training for Diversity in Image Paragraph Captioning
☆90Updated 6 years ago
ZihengZZH / awesome-multimodal-machine-translation
A curated list of AWESOME papers, datasets and tutorials within Multimodal Machine Translation.
☆36Updated 4 years ago
ustctf-zz / delibnet
☆14Updated 2 years ago
ShannonAI / OpenViDial
Code, Models and Datasets for OpenViDial Dataset
☆132Updated 3 years ago
hyounghk / VideoQADenseCapFrameGate-ACL2020
Code for ACL 2020 paper "Dense-Caption Matching and Frame-Selection Gating for Temporal Localization in VideoQA." Hyounghun Kim, Zineng T…
☆34Updated 5 years ago
gicheonkang / dan-visdial
✨ Official PyTorch Implementation for EMNLP'19 Paper, "Dual Attention Networks for Visual Reference Resolution in Visual Dialog"
☆45Updated 2 years ago
eric-xw / AREL
Code for the ACL paper "No Metrics Are Perfect: Adversarial Reward Learning for Visual Storytelling"
☆137Updated 4 years ago
Nrgeup / controllable-text-attribute-transfer
Code for "Controllable Unsupervised Text Attribute Transfer via Editing Entangled Latent Representation" (NeurIPS 2019)
☆127Updated 6 years ago