rosewang2008 / language_modeling_via_stochastic_processesLinks

Language modeling via stochastic processes. Oral @ ICLR 2022.

☆138

Alternatives and similar repositories for language_modeling_via_stochastic_processes

Users that are interested in language_modeling_via_stochastic_processes are comparing it to the libraries listed below

Sorting:

qkaren / COLD_decoding
☆108Updated 3 years ago
machelreid / diffuser
DiffusER: Discrete Diffusion via Edit-based Reconstruction (Reid, Hellendoorn & Neubig, 2022)
☆54Updated this week
xhan77 / ssd-lm
Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control
☆74Updated 2 years ago
HanGuo97 / soft-Q-learning-for-text-generation
☆70Updated 2 years ago
Sachin19 / mucoco
Official Code for the papers: "Controlled Text Generation as Continuous Optimization with Multiple Constraints" and "Gradient-based Const…
☆62Updated last year
FranxYao / Distributional-Generalization-in-Natural-Language-Processing
Distributional Generalization in NLP. A roadmap.
☆88Updated 2 years ago
nicola-decao / KnowledgeEditor
Code for Editing Factual Knowledge in Language Models
☆139Updated 3 years ago
GXimingLu / Quark
☆75Updated last year
INK-USC / CrossFit
Code for paper "CrossFit : A Few-shot Learning Challenge for Cross-task Generalization in NLP" (https://arxiv.org/abs/2104.08835)
☆112Updated 3 years ago
naver / gdc
Code accompanying our papers on the "Generative Distributional Control" framework
☆118Updated 2 years ago
facebookresearch / MetaICL
An original implementation of "MetaICL Learning to Learn In Context" by Sewon Min, Mike Lewis, Luke Zettlemoyer and Hannaneh Hajishirzi
☆270Updated 2 years ago
princeton-nlp / DinkyTrain
Princeton NLP's pre-training library based on fairseq with DeepSpeed kernel integration 🚃
☆114Updated 2 years ago
allenai / csqa2
☆36Updated last year
Alrope123 / rethinking-demonstrations
☆178Updated last year
mireshghallah / mixmatch
Repository for ACL 2022 paper Mix and Match: Learning-free Controllable Text Generation using Energy Language Models
☆44Updated 3 years ago
eric-mitchell / mend
MEND: Fast Model Editing at Scale
☆249Updated last year
kernelmachine / demix
DEMix Layers for Modular Language Modeling
☆53Updated 3 years ago
bigscience-workshop / architecture-objective
☆97Updated 2 years ago
AkariAsai / ATTEMPT
This is the oficial repository for "Parameter-Efficient Multi-task Tuning via Attentional Mixtures of Soft Prompts" (EMNLP 2022)
☆102Updated 2 years ago
jiacheng-ye / ZeroGen
[EMNLP 2022] Code for our paper “ZeroGen: Efficient Zero-shot Learning via Dataset Generation”.
☆48Updated 3 years ago
GXimingLu / neurologic_decoding
☆82Updated 2 years ago
yangkevin2 / naacl-2021-fudge-controlled-generation
☆100Updated 2 years ago
Shark-NLP / CoNT
[NeurIPS'22 Spotlight] Data and code for our paper CoNT: Contrastive Neural Text Generation
☆154Updated 2 years ago
microsoft / KID
Knowledge Infused Decoding
☆71Updated last year
XiangLi1999 / ContrastiveDecoding
contrastive decoding
☆203Updated 2 years ago
lemaoliu / retrieval-generation-reading-list
This project maintains a reading list for general text generation tasks
☆65Updated 3 years ago
mega002 / ff-layers
The accompanying code for "Transformer Feed-Forward Layers Are Key-Value Memories". Mor Geva, Roei Schuster, Jonathan Berant, and Omer Le…
☆94Updated 3 years ago
princeton-nlp / ShortcutGrammar
EMNLP 2022: Finding Dataset Shortcuts with Grammar Induction https://arxiv.org/abs/2210.11560
☆58Updated 5 months ago
princeton-nlp / TRIME
[EMNLP 2022] Training Language Models with Memory Augmentation https://arxiv.org/abs/2205.12674
☆197Updated 2 years ago
HKUNLP / icl-ceil
[ICML 2023] Code for our paper “Compositional Exemplars for In-context Learning”.
☆102Updated 2 years ago