ThomasScialom / QuestEvalLinks

☆102

Alternatives and similar repositories for QuestEval

Users that are interested in QuestEval are comparing it to the libraries listed below

Sorting:

danieldeutsch / sacrerouge
SacreROUGE is a library dedicated to the use and development of text generation evaluation metrics with an emphasis on summarization.
☆148Updated 3 years ago
google-research-datasets / xsum_hallucination_annotations
Faithfulness and factuality annotations of XSum summaries from our paper "On Faithfulness and Factuality in Abstractive Summarization" (h…
☆84Updated 5 years ago
shmsw25 / AmbigQA
An original implementation of EMNLP 2020, "AmbigQA: Answering Ambiguous Open-domain Questions"
☆120Updated 3 years ago
salesforce / QAFactEval
☆53Updated 2 years ago
violet-zct / fairseq-detect-hallucination
Detect hallucinated tokens for conditional sequence generation.
☆64Updated 3 years ago
McGill-NLP / FaithDial
☆50Updated 2 years ago
Yale-LILY / dart
Dataset for NAACL 2021 paper: "DART: Open-Domain Structured Data Record to Text Generation"
☆155Updated 3 years ago
salesforce / QGen
☆33Updated 2 years ago
artidoro / frank
FRANK: Factuality Evaluation Benchmark
☆59Updated 2 years ago
esdurmus / feqa
Data and code for "A Question Answering Evaluation Framework for Faithfulness Assessment in Abstractive Summarization" (ACL 2020)
☆48Updated 2 years ago
salesforce / query-focused-sum
Official code repository for "Exploring Neural Models for Query-Focused Summarization".
☆50Updated 2 years ago
cambridgeltl / xcopa
XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning
☆104Updated 4 years ago
tingofurro / summac
Codebase, data and models for the SummaC paper in TACL
☆105Updated 10 months ago
peterwestuw / surface-form-competition
☆58Updated 3 years ago
danieldeutsch / qaeval
☆15Updated 4 years ago
alisawuffles / DExperts
code associated with ACL 2021 DExperts paper
☆118Updated 2 years ago
Yale-LILY / ROSE
☆39Updated 2 years ago
dapascual / K2T
☆71Updated 4 years ago
awebson / prompt_semantics
This repository accompanies our paper “Do Prompt-Based Models Really Understand the Meaning of Their Prompts?”
☆85Updated 3 years ago
meetdavidwan / factpegasus
PyTorch code for "FactPEGASUS: Factuality-Aware Pre-training and Fine-tuning for Abstractive Summarization" (NAACL 2022)
☆40Updated 3 years ago
neulab / REALSumm
REALSumm: Re-evaluating Evaluation in Text Summarization
☆73Updated 2 months ago
amazon-science / fact-check-summarization
☆78Updated last year
timoschick / self-debiasing
This repository contains the code for "Self-Diagnosis and Self-Debiasing: A Proposal for Reducing Corpus-Based Bias in NLP".
☆88Updated 4 years ago
tanyuqian / ctc-gen-eval
EMNLP 2021 - CTC: A Unified Framework for Evaluating Natural Language Generation
☆98Updated 2 years ago
TalSchuster / VitaminC
Contrastive Fact Verification
☆73Updated 3 years ago
salesforce / DocNLI
☆68Updated 7 months ago
vipulraheja / iterater
Official implementation of the paper "IteraTeR: Understanding Iterative Revision from Human-Written Text" (ACL 2022)
☆80Updated 2 years ago
facebookresearch / asset
A Dataset for Tuning and Evaluation of Sentence Simplification Models with Multiple Rewriting Transformations
☆57Updated 3 years ago
allenai / PRIMER
The official code for PRIMERA: Pyramid-based Masked Sentence Pre-training for Multi-document Summarization
☆157Updated 3 years ago
AIPHES / emnlp19-moverscore
MoverScore: Text Generation Evaluating with Contextualized Embeddings and Earth Mover Distance
☆210Updated 2 years ago