VinAIResearch / WhoQALinks

Who's Who: Large Language Models Meet Knowledge Conflicts in Practice (EMNLP 2024 Findings)

☆10

Alternatives and similar repositories for WhoQA

Users that are interested in WhoQA are comparing it to the libraries listed below

Sorting:

nlp-uoregon / mlmm-evaluation
Multilingual Large Language Models Evaluation Benchmark
☆131Updated last year
RUCAIBox / Language-Specific-Neurons
☆84Updated 9 months ago
AlexTMallen / adaptive-retrieval
☆189Updated 2 months ago
nlp-uoregon / Okapi
Okapi: Instruction-tuned Large Language Models in Multiple Languages with Reinforcement Learning from Human Feedback
☆97Updated 2 years ago
DevSinghSachan / unsupervised-passage-reranking
Code, datasets, and checkpoints for the paper "Improving Passage Retrieval with Zero-Shot Question Generation (EMNLP 2022)"
☆101Updated 2 years ago
ehsk / OpenQA-eval
ACL 2023: Evaluating Open-Domain Question Answering in the Era of Large Language Models
☆47Updated last year
Betswish / Cross-Lingual-Consistency
Easy-to-use framework for evaluating cross-lingual consistency of factual knowledge (Supported LLaMA, BLOOM, mT5, RoBERTa, etc.) Paper he…
☆26Updated last month
cordercorder / knn-models
A retrieval augmented sequence modeling toolkit implemented based on Fairseq
☆29Updated 2 years ago
NJUNLP / knn-box
an easy-to-use knn-mt toolkit
☆104Updated 2 years ago
hsing-wang / Awesome-LLM-MT
☆245Updated last year
BatsResearch / crosslingual-test-time-scaling
Crosslingual Reasoning through Test-Time Scaling
☆19Updated 4 months ago
xlang-ai / BRIGHT
[ICLR 2025] BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval
☆167Updated 2 weeks ago
luyug / GC-DPR
Train Dense Passage Retriever (DPR) with a single GPU
☆133Updated 4 years ago
neulab / knn-transformers
PyTorch + HuggingFace code for RetoMaton: "Neuro-Symbolic Language Modeling with Automaton-augmented Retrieval" (ICML 2022), including an…
☆280Updated 2 years ago
XiangLi1999 / ContrastiveDecoding
contrastive decoding
☆203Updated 2 years ago
tingofurro / summac
Codebase, data and models for the SummaC paper in TACL
☆102Updated 7 months ago
DAMO-NLP-SG / multilingual_analysis
[NeurIPS 2024] How do Large Language Models Handle Multilingualism?
☆41Updated 10 months ago
maszhongming / UniEval
Repository for EMNLP 2022 Paper: Towards a Unified Multi-Dimensional Evaluator for Text Generation
☆210Updated last year
jinlanfu / GPTScore
Source Code of Paper "GPTScore: Evaluate as You Desire"
☆257Updated 2 years ago
OSU-NLP-Group / LLM-Knowledge-Conflict
[ICLR'24 Spotlight] "Adaptive Chameleon or Stubborn Sloth: Revealing the Behavior of Large Language Models in Knowledge Conflicts"
☆76Updated last year
kojima-takeshi188 / lang_neuron
☆18Updated last year
SeaEval / SeaEval
NAACL 2024: SeaEval for Multilingual Foundation Models: From Cross-Lingual Alignment to Cultural Reasoning
☆26Updated 6 months ago
tylerachang / multilingual-geometry
The geometry of multilingual language model representations (EMNLP 2022).
☆21Updated 2 years ago
Shivanshu-Gupta / icl-coverage
☆13Updated last year
acl-org / aclpubcheck
Tools for checking ACL paper submissions
☆789Updated last month
StonyBrookNLP / musique
Repository for MuSiQue: Multi-hop Questions via Single-hop Question Composition, TACL 2022
☆167Updated last year
wangcunxiang / QA-Eval
The repository for paper <Evaluating Open-QA Evaluation>
☆25Updated last year
Alab-NII / 2wikimultihop
☆121Updated 2 years ago
Hannibal046 / nanoDPR
Simple replication of DPR (Dense Passage Retrieval)
☆48Updated last year
princeton-nlp / QuRating
[ICML 2024] Selecting High-Quality Data for Training Language Models
☆187Updated last year