lework / llm-benchmark
LLM 并发性能测试工具,支持自动化压力测试和性能报告生成。
☆63Updated last month
Alternatives and similar repositories for llm-benchmark
Users that are interested in llm-benchmark are comparing it to the libraries listed below
Sorting:
- dify's rag patch module☆228Updated this week
- 通义千问VLLM推理部署DEMO☆577Updated last year
- A streamlined and customizable framework for efficient large model evaluation and performance benchmarking☆961Updated this week
- ☆246Updated 4 months ago
- An easy-to-use framework for modular RAG☆359Updated this week
- gpt_server是一个用于生产级部署LLMs、Embedding、Reranker、ASR和TTS的开源框架。☆180Updated this week
- 专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。☆93Updated 10 months ago
- 支持查询主流agent框架技术文档的MCP server(支持stdio和sse两种传输协议), 支持 langchain、llama-index、autogen、agno、openai-agents-sdk、mcp-doc、camel-ai 和 crew-ai☆99Updated last week
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆173Updated 4 months ago
- DIFY PULGIN 插件源码集合☆205Updated last week
- 企业级RAG系统从入门到精通☆462Updated 2 months ago
- 自动批量上传并解析文档至 RagFlow 知识库, 省去手动操作,提升效率。☆314Updated last week
- 一些大语言模型和多模态模型的应用,主要包括小模型,Agent,跨模态搜索,OCR、RAG、ChatBot等等☆170Updated this week
- 基于大语言模型的检索增强生成RAG示例☆147Updated 2 weeks ago
- Ragflow-Plus 是 Ragflow 的二次开发版本,使其更为简洁实用☆392Updated this week
- 属于每个人的公众号”查特查特“上线啦!新问题、新方法、新发现,欢迎提PR!☆45Updated last year
- ragflow中的ocr部分,非官方项目☆40Updated 8 months ago
- Community maintained hardware plugin for vLLM on Ascend☆631Updated this week
- 大模型/LLM推理和部署理论与实践☆259Updated 2 months ago
- ☆40Updated 2 months ago
- 《赋范大模型技术社区》是针对各阶大模型学习者量身打造的基于各类大模型,包括环境设置、本地部署、高效微调、开发实战等技能在内的全流程指导!☆377Updated 2 months ago
- qwen ai agent☆131Updated last year
- KAG开源框架介绍及使用KAG实现知识增强生成应用(产品模式测试、开发者模式测试),KAG是OpenSPG发布v0.5版本中推出的知识增强生成(KAG)的专业领域知识服务框架,旨在充分利用知识图谱和向量检索的优势,增强大型语言模型和知识图谱,以解决 RAG 挑战☆97Updated last month
- ☆44Updated 6 months ago
- unify-easy-llm(ULM)旨在打造一个简易的一键式大模型训练工具,支持Nvidia GPU、Ascend NPU等不同硬件以及常用的大模型。☆55Updated 9 months ago
- 添加🚀流式 Web 服务到 GraphRAG,兼容 OpenAI SDK,支持可访问的实体链接🔗,支持建议问题,兼容本地嵌入模型,修复诸多问题。Add streaming web server to GraphRAG, compatible with OpenAI SD…☆251Updated last month
- vLLM Documentation in Chinese Simplified / vLLM 中文文档☆69Updated this week
- 使用LangGraph+DeepSeek-R1+FastAPI+Gradio实现一个带有记忆功能的流量包推荐智能客服web端用例,同时也支持gpt大模型、国产大模型(OneApi方式)、Ollama本地开源大模型、阿里通义千问大模型☆128Updated last month
- llamafactory blog☆26Updated 7 months ago
- Easy-to-Use RAG Framework; CCF AIOps International Challenge 2024 Top3 Solution; CCF AIOps 国际挑战赛 2024 季军方案☆443Updated 6 months ago