zhangnengwei123 / vLLM-docker-Qwen2Links
学习vLLM,使用vLLM部署Qwen2-0.5B的模型,并使用docker部署。
☆18Updated 11 months ago
Alternatives and similar repositories for vLLM-docker-Qwen2
Users that are interested in vLLM-docker-Qwen2 are comparing it to the libraries listed below
Sorting:
- 如需体验textin文档解析,请点击https://cc.co/16YSIy☆22Updated 10 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated 10 months ago
- 欢迎来到“筱可AI研习社”的实战项目仓库!这个仓库主要用于存储和展示为公众号撰写的各类实战项目。我们会不断优化和迭代这些项目,以探索AI的无限可能。☆43Updated this week
- 利用免费的大模型api来结合你的私域数据来生成sft训练数据(妥妥白嫖)支持llamafactory等工具的训练数据格式synthetic data☆161Updated 6 months ago
- TPO 是一个优化 LLM 输出文本的框架,通过迭代反馈和优化提示的方式来“微调模型”,而非直接调整模型的参数,使模型在推理过程中与人类偏好对齐以生成更好的结果。本项目提供了一个友好的 WebUI 来加载模型,实时优化基础模型并展示最佳结果。☆10Updated 3 months ago
- optimize your prompt like promptperfect|万能提示词|大语言模型提示词优化☆41Updated last year
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆59Updated 4 months ago
- 首个llama2 13b 中文版模型 (Base + 中文对话SFT,实现流畅多轮人机自然语言交互)☆90Updated last year
- 通过paddle ocr实现pdf转markdown☆69Updated 7 months ago
- 视频理解:千问视频多模态模型 & Dify☆57Updated 9 months ago
- An open-source chat text to control actions agentic workflow framework/showcase powered by Agently AI application development framework.☆28Updated 8 months ago
- Finetune Llama 3, Mistral & Gemma LLMs 2-5x faster with 80% less memory☆27Updated last year
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- 基于 Dify + Langfuse 的自动化评估服务☆63Updated this week
- ☆15Updated 11 months ago
- The Level-Navi Agent, a framework that requires no training and utilizes large language models for deep query understanding and precise s…☆79Updated 5 months ago
- (撰写ing..)本仓库偏教程性质,以「模型中文化」为一个典型的模型训练问题切入场景,指导读者上手学习LLM二次微调训练。☆34Updated 9 months ago
- A Python Package to Access World-Class Generative Models☆128Updated 11 months ago
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆82Updated 4 months ago
- ☆27Updated 7 months ago
- DSPy中文文档☆27Updated 11 months ago
- MinerU API Server☆15Updated 8 months ago
- Agentica: Effortlessly Build Intelligent, Reflective, and Collaborative Multimodal AI Agents! 轻松构建智能、具备反思能力、可协作的多模态AI Agent。☆168Updated this week
- LLama3中文个人版本☆39Updated last year
- Qwen GRPO Graph Extraction RL Finetune☆49Updated 2 months ago
- LLM RAG 应用, 支持 API 调用,语音交互。☆11Updated 11 months ago
- A gradio webui for Andrewyng translation-agent☆29Updated 6 months ago
- 基于Gradio开发的ChatGPT聊天应用,可以文字 或 语音对话,发送的音频通过OpenAI的STT转文本后,再通过ChatGPT生成回复,回复的内容通过OpenAI TTS合成后返回并自动播放,实现语音聊天功能。☆36Updated last year
- zlai☆22Updated 8 months ago
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆49Updated this week