tm4roon / data-augmentation-for-nlpLinks

An implementation of data augmentation methods for natural language processing tasks.

☆13

Alternatives and similar repositories for data-augmentation-for-nlp

Users that are interested in data-augmentation-for-nlp are comparing it to the libraries listed below

Sorting:

N-Almarwani / DCT_Sentence_Embedding
Efficient-Sentence-Embedding-using-Discrete-Cosine-Transform
☆17Updated 4 years ago
ntunlp / Zero-Shot-Cross-Lingual-NER
A repository for our AAAI-2020 Cross-lingual-NER paper. Code will be updated shortly.
☆47Updated 2 years ago
uclanlp / synpg
Code for our EACL-2021 paper "Generating Syntactically Controlled Paraphrases without Using Annotated Parallel Pairs".
☆39Updated last year
sebastianruder / emnlp2021-multiqa-tutorial
EMNLP 2021 Tutorial: Multi-Domain Multilingual Question Answering
☆38Updated 3 years ago
timoschick / bertram
This repository contains the code for "BERTRAM: Improved Word Embeddings Have Big Impact on Contextualized Representations".
☆64Updated 4 years ago
vgupta123 / P-SIF
Source code for our AAAI 2020 paper P-SIF: Document Embeddings using Partition Averaging
☆34Updated 5 years ago
sumanbanerjee1 / Code-Mixed-Dialog
☆33Updated 7 years ago
HSLCY / GlossBERT
GlossBERT: BERT for Word Sense Disambiguation with Gloss Knowledge (EMNLP 2019)
☆95Updated 2 years ago
jerbarnes / domain_blse
Projecting Embeddings for Domain Adaptation: Joint Modeling of Sentiment in Diverse Domains
☆16Updated 7 years ago
evasharma / bigpatent
☆25Updated 6 years ago
ethanachi / multilingual-probing-visualization
Codebase for probing and visualizing multilingual models.
☆49Updated 5 years ago
timoschick / form-context-model
This repository contains the code for the Form-Context Model and its Attentive Mimicking variant.
☆31Updated 5 years ago
neulab / REALSumm
REALSumm: Re-evaluating Evaluation in Text Summarization
☆71Updated 2 years ago
tomhosking / torchseq
Pytorch Seq2Seq framework
☆27Updated 8 months ago
LC-John / Yahoo-Answers-Topic-Classification-Dataset
☆54Updated 7 years ago
AkariAsai / extractive_rc_by_runtime_mt
Code and datasets of "Multilingual Extractive Reading Comprehension by Runtime Machine Translation"
☆40Updated 6 years ago
eaclark07 / sms
☆43Updated 5 years ago
yg211 / acl20-ref-free-eval
SUPERT: Unsupervised multi-document summarization evaluation & generation
☆94Updated 2 years ago
google-research-datasets / MultiReQA
We are creating a challenging new benchmark MultiReQA: A Cross-Domain Evaluation for Retrieval Question Answering Models. Retrieval quest…
☆31Updated 4 years ago
lanwuwei / GigaBERT
Zero-shot Transfer Learning from English to Arabic
☆29Updated 3 years ago
bcmi220 / unified_syn_srl
A Unified Syntax-aware Framework for Semantic Role Labeling
☆22Updated 6 years ago
thespectrewithin / joint_align
Cross-lingual Alignment vs Joint Training: A Comparative Study and A Simple Unified Framework
☆52Updated 5 years ago
sbu-dsl / chapter-captor
Code for the EMNLP 2020 paper titled "Chapter Captor: Text Segmentation in Novels"
☆30Updated 4 years ago
PrekshaNema25 / RefNet-QG
RefNet for Question Generation
☆46Updated 4 years ago
allenai / sequential_sentence_classification
https://arxiv.org/pdf/1909.04054
☆79Updated 2 years ago
harsh19 / Reasoning-Chains-MultihopQA
Code and Data for our EMNLP 2020 paper titled 'Learning to Explain: Datasets and Models for Identifying Valid Reasoning Chains in Multiho…
☆28Updated 3 years ago
rit-git / Snippext_public
Snippext: Semi-supervised Opinion Mining with Augmented Data
☆58Updated 2 years ago
L-Zhe / CoRPG
Code for paper Document-Level Paraphrase Generation with Sentence Rewriting and Reordering by Zhe Lin, Yitao Cai and Xiaojun Wan. This pa…
☆25Updated 3 years ago
malllabiisc / SGCP
TACL 2020: Syntax-Guided Controlled Generation of Paraphrases
☆71Updated last year
liukun95 / Noisy-NER-Confidence-Estimation
The source code for 'Noisy-Labeled NER with Confidence Estimation' accepted by NAACL 2021
☆34Updated 4 years ago