wala / blancaLinks

BLANCA - Benchmarks for LANguage models on Coding Artifacts

☆9

Alternatives and similar repositories for blanca

Users that are interested in blanca are comparing it to the libraries listed below

Sorting:

zorazrw / odex
[EMNLP'23] Execution-Based Evaluation for Open Domain Code Generation
☆48Updated last year
SalesforceAIResearch / CodeChain
Official code for the paper "CodeChain: Towards Modular Code Generation Through Chain of Self-revisions with Representative Sub-modules"
☆45Updated 6 months ago
terryyz / ice-score
[EACL 2024] ICE-Score: Instructing Large Language Models to Evaluate Code
☆76Updated last year
jianguda / afm4acs
☆15Updated 3 years ago
rizwan09 / REDCODER
☆45Updated last month
code4me-me / code4me
Two Automatic code completion IDE extensions for @JetBrains and @microsoft/vscode based on Transformer-based large language models for so…
☆55Updated last year
shrivastavadisha / repo_level_prompt_generation
☆124Updated 2 years ago
logic-star-ai / swt-bench
[NeurIPS 2024] Evaluation harness for SWT-Bench, a benchmark for evaluating LLM repository-level test-generation
☆51Updated last month
nyu-mll / ILF-for-code-generation
☆78Updated 4 months ago
gonglinyuan / ast_t5
☆65Updated last year
FSoft-AI4Code / RepoHyper
[FORGE 2025] Graph-based method for end-to-end code completion with context awareness on repository
☆64Updated 10 months ago
reddy-lab-code-research / PPOCoder
Code for the TMLR 2023 paper "PPOCoder: Execution-based Code Generation using Deep Reinforcement Learning"
☆114Updated last year
facebookresearch / mbr-exec
code for "Natural Language to Code Translation with Execution"
☆41Updated 2 years ago
berlino / grammar-prompting
Grammar Prompting for Domain-Specific Language Generation with Large Language Models
☆75Updated last year
microsoft / Search4Code
Web queries dataset for code search
☆32Updated 2 years ago
amazon-science / recode
Releasing code for "ReCode: Robustness Evaluation of Code Generation Models"
☆52Updated last year
xlang-ai / EVOR
☆68Updated 7 months ago
neulab / tranX-plugin
A plugin for code generation in PyCharm/IntelliJ using tranX
☆36Updated 3 years ago
csinva / iprompt
Finding semantically meaningful and accurate prompts.
☆47Updated last year
SalesforceAIResearch / swecomm
☆27Updated 6 months ago
martysai / source-code-summarization
Transformer-based approaches for an efficient docstrings generation on a piece of Python's code.
☆17Updated 4 years ago
reasoning-machines / CoCoGen
Language Models of Code are Few-Shot Commonsense Learners (EMNLP 2022)
☆86Updated 2 years ago
facebookresearch / coder_reviewer_reranking
Official code release for the paper Coder Reviewer Reranking for Code Generation.
☆45Updated 2 years ago
ntunlp / ExecEval
A distributed, extensible, secure solution for evaluating machine generated code with unit tests in multiple programming languages.
☆55Updated 9 months ago
ARiSE-Lab / CYCLE_OOPSLA_24
Open-source repository for the OOPSLA'24 paper "CYCLE: Learning to Self-Refine Code Generation"
☆10Updated last year
Zyq-scut / RLTF
Accepted by Transactions on Machine Learning Research (TMLR)
☆130Updated 9 months ago
shuyanzhou / docprompting
Data and code for "DocPrompting: Generating Code by Retrieving the Docs" @ICLR 2023
☆248Updated last year
NL2Code / CodeM
☆44Updated last year
ntunlp / xCodeEval
xCodeEval: A Large Scale Multilingual Multitask Benchmark for Code Understanding, Generation, Translation and Retrieval
☆85Updated 10 months ago
waingram / code-embeddings
A Comparative Study of Various Code Embeddings in Software Semantic Matching
☆16Updated 2 years ago