Ayanami0730/deep_research_bench

Readme badge preview -

If you own this repo, copy the snippet below and add it to your README.md

[![RelatedRepos](https://img.shields.io/badge/related-repos-yellow)](https://relatedrepos.com/gh/Ayanami0730/deep_research_bench)

Ayanami0730 / deep_research_bench

DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents

☆803

Alternatives and similar repositories for deep_research_bench

Users that are interested in deep_research_bench are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.

Sorting:

imlrz / DeepResearch-Bench-II
View on GitHub
DeepResearch Bench II (DRB2) is the follow-up to DeepResearch Bench, with a stronger focus on measuring the gap between deep research sys…
☆74May 14, 2026Updated 2 months ago
cxcscmu / deepresearch_benchmarking
View on GitHub
☆29Mar 10, 2026Updated 4 months ago
GAIR-NLP / DeepResearcher
View on GitHub
Scaling Deep Research via Reinforcement Learning in Real-world Environments.
☆784May 10, 2026Updated 2 months ago
scienceaix / deepresearch
View on GitHub
Awesome Deep Research list! For more details, please refer to our survey paper -- A Comprehensive Survey of Deep Research: Systems, Metho…
☆436Oct 22, 2025Updated 9 months ago
thinkdepthai / Deep_Research
View on GitHub
ThinkDepth.ai Deep Research
☆187Jan 5, 2026Updated 6 months ago
GPU virtual machines on DigitalOcean Gradient AI • Ad
Get to production fast with high-performance AMD and NVIDIA GPUs you can spin up in seconds. The definition of operational simplicity.
OSU-NLP-Group / Mind2Web-2
View on GitHub
[NeurIPS'25 D&B] Mind2Web-2 Benchmark: Evaluating Agentic Search with Agent-as-a-Judge
☆112May 17, 2026Updated 2 months ago
BstWPY / WildGraphBench
View on GitHub
[ACL 2026] WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora
☆16May 11, 2026Updated 2 months ago
ByteDance-BandAI / ReportBench
View on GitHub
A comprehensive benchmark for evaluating deep research agents on academic survey tasks
☆56Sep 4, 2025Updated 10 months ago
youdotcom-oss / ydc-deep-research-evals
View on GitHub
you.com's framework for evaluating deep research systems.
☆76May 15, 2025Updated last year
ByteDance-Seed / WideSearch
View on GitHub
WideSearch: Benchmarking Agentic Broad Info-Seeking
☆149Oct 9, 2025Updated 9 months ago
Alibaba-NLP / DeepResearch
View on GitHub
Tongyi Deep Research, the Leading Open-source Deep Research Agent
☆19,741Feb 27, 2026Updated 5 months ago
hkust-nlp / WebExplorer
View on GitHub
The official repo of "WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents"
☆120Sep 29, 2025Updated 10 months ago
DavidZWZ / Awesome-Deep-Research
View on GitHub
[ACL 2026 KnowFM] Awesome Agentic Deep Research Resources
☆822Updated this week
RUC-NLPIR / WebThinker
View on GitHub
[NeurIPS 2025] 🌐 WebThinker: Empowering Large Reasoning Models with Deep Research Capability
☆1,463Dec 8, 2025Updated 7 months ago
Wordpress hosting with auto-scaling - Free Trial Offer • Ad
Fully Managed hosting for WordPress and WooCommerce businesses that need reliable, auto-scalable performance. Cloudways SafeUpdates now available.
xbench-ai / xbench-evals
View on GitHub
Evergreen, contamination-free, real-world, domain-specific AI evaluation framework
☆139Jan 11, 2026Updated 6 months ago
NVIDIA-AI-Blueprints / aiq
View on GitHub
The AI-Q NVIDIA Blueprint is an open reference example for building intelligent AI agents that connect to your enterprise data, reason us…
☆815Updated this week
texttron / BrowseComp-Plus
View on GitHub
BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent (ACL 2026 Main)
☆319May 28, 2026Updated 2 months ago
PeterGriffinJin / Search-R1
View on GitHub
Search-R1: An Efficient, Scalable RL Training Framework for Reasoning & Search Engine Calling interleaved LLM based on veRL
☆5,170Nov 13, 2025Updated 8 months ago
langchain-ai / open_deep_research
View on GitHub
☆12,457Updated this week
baidubce / qianfan-deepresearch
View on GitHub
Baidu Qianfan Deep Research
☆36Jun 8, 2026Updated last month
OpenPipe / open_deep_research_training
View on GitHub
Training setup for Langchain's Open Deep Research
☆77Aug 28, 2025Updated 11 months ago
RUC-NLPIR / Search-o1
View on GitHub
🔍 Search-o1: Agentic Search-Enhanced Large Reasoning Models [EMNLP 2025]
☆1,240Nov 17, 2025Updated 8 months ago
SkyworkAI / DeepResearchAgent
View on GitHub
DeepResearchAgent is a hierarchical multi-agent system designed not only for deep research tasks but also for general-purpose task solvin…
☆3,500May 4, 2026Updated 2 months ago
Deploy on Railway without the complexity - Free Credits Offer • Ad
Connect your repo and Railway handles the rest with instant previews. Quickly provision container image services, databases, and storage volumes.
GAIR-NLP / ResearcherBench
View on GitHub
ResearcherBench: Evaluating Deep AI Research Systems on the Frontiers of Scientific Inquiry
☆51Jul 21, 2026Updated last week
OPPO-PersonalAI / FINDER_DEFT
View on GitHub
Official implementation for paper "How Far Are We from Genuinely Useful Deep Research Agents?"
☆66Dec 10, 2025Updated 7 months ago
rlresearch / dr-tulu
View on GitHub
Official repository for DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research
☆692Jun 17, 2026Updated last month
SalesforceAIResearch / enterprise-deep-research
View on GitHub
Salesforce Enterprise Deep Research
☆1,196Jun 2, 2026Updated last month
mangopy / Deep-Research-Survey
View on GitHub
A Systematic Survey of Deep Research
☆321Jan 1, 2026Updated 6 months ago
GenseeAI / open_deep_research
View on GitHub
☆48Nov 15, 2025Updated 8 months ago
Agent-RL / ReCall
View on GitHub
ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning & ReCall: Learning to Reason with Tool Call for LLMs via Rei…
☆1,425May 16, 2025Updated last year
PALIN2018 / BrowseComp-ZH
View on GitHub
☆158May 14, 2025Updated last year
inclusionAI / ASearcher
View on GitHub
An Open-Source Large-Scale Reinforcement Learning Project for Search Agents
☆602Nov 26, 2025Updated 8 months ago
Managed hosting for WordPress and PHP on Cloudways • Ad
Managed hosting for WordPress, Magento, Laravel, or PHP apps, on multiple cloud providers. Deploy in minutes on Cloudways by DigitalOcean.
RUC-NLPIR / HiRA
View on GitHub
The code for paper: Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search [SIGIR 2026]
☆65Jul 4, 2025Updated last year
Infinity-AILab / DeepResearchEval
View on GitHub
DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation.
☆142Feb 10, 2026Updated 5 months ago
THUDM / slime
View on GitHub
slime is an LLM post-training framework for RL Scaling.
☆7,679Updated this week
stepfun-ai / StepDeepResearch
View on GitHub
Step-DeepResearch
☆570Mar 24, 2026Updated 4 months ago
ai-agents-2030 / awesome-deep-research-agent
View on GitHub
☆630Sep 18, 2025Updated 10 months ago
OPPO-PersonalAI / Flash-Searcher
View on GitHub
Official Implementation of Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
☆88Dec 8, 2025Updated 7 months ago
EvolvingLMMs-Lab / multimodal-search-r1
View on GitHub
[ACL-2026] MMSearch-R1 is an end-to-end RL framework that enables LMMs to perform on-demand, multi-turn search with real-world multimodal…
☆470Apr 7, 2026Updated 3 months ago