openvino-dev-samples / Qwen2.openvino
This sample shows how to deploy Qwen2 using OpenVINO
☆33Updated last month
Related projects ⓘ
Alternatives and complementary repositories for Qwen2.openvino
- 部署你自己的OpenAI api🤩, 基于flask, transformers (使用 Baichuan2-13B-Chat-4bits 模型, 可以运行在单张Tesla T4显卡) ,实现了OpenAI中Chat, Models和Completions接 口,包含流式响…☆84Updated last year
- run chatglm3-6b in BM1684X☆39Updated 8 months ago
- unify-easy-llm(ULM)旨在打造一个简易的一键式大模型训练工具,支持Nvidia GPU、Ascend NPU等不同硬件以及常用的大模型。☆39Updated 3 months ago
- chatglm-6B for tools application using langchain☆76Updated last year
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆52Updated 3 months ago
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆168Updated 6 months ago
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆42Updated 4 months ago
- 训练一个对中文支持更好的LLaVA模型,并开源训练代码和数据。☆38Updated 2 months ago
- run ChatGLM2-6B in BM1684X☆48Updated 8 months ago
- ChatGLM 6B 的模型与UI,通过 LangChain 与向量匹配实现本地知识库问答,支持流式输出☆109Updated last year
- 属于每个人的公众号”查特查特“上线啦!新问题、新方法、新发现,欢迎提PR!☆39Updated 11 months ago
- (1)弹性区间标准化的旋转位置词嵌入编码器+peft LORA量化训练,提高万级tokens性能支持。(2)证据理论解释学习,提升模型的复杂逻辑推理能力(3)兼容alpaca数据格式。☆45Updated last year
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- 千问14B和7B的逐行解释☆51Updated last year
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆42Updated this week
- Finetune Llama 3, Mistral & Gemma LLMs 2-5x faster with 80% less memory☆25Updated 6 months ago
- qwen2 and llama3 cpp implementation☆34Updated 5 months ago
- ☆76Updated 3 months ago
- 研究GOT-OCR-项目落地加速,不限语言☆51Updated 3 weeks ago
- Agentica: Build Multi-Agent Workflow with 3 lines code. 三行代码打造个人助手智能体。☆88Updated last week
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆488Updated 4 months ago
- Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o持续更新】☆185Updated last month
- 专注于Python/C++/CUDA、ML/DL/RL和NLP/KG/DS/LLM领域的技术分享。☆63Updated 4 months ago
- DashInfer is a native LLM inference engine aiming to deliver industry-leading performance atop various hardware architectures, including …☆137Updated 2 months ago
- qwen ai agent☆109Updated 9 months ago
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆44Updated 6 months ago
- 演示 vllm 对中文大语言模型的神奇效果☆31Updated last year
- 文本语料转训练集工具,txt转dataset☆78Updated 6 months ago
- 百度QA100万数据集☆49Updated 11 months ago
- 大模型部署实战:TensorRT-LLM, Triton Inference Server, vLLM☆26Updated 8 months ago