owenliang / mnist-onnx-runtimeLinks
MoE model with onnx runtime
☆56Updated last year
Alternatives and similar repositories for mnist-onnx-runtime
Users that are interested in mnist-onnx-runtime are comparing it to the libraries listed below
Sorting:
- vLLM Documentation in Chinese Simplified / vLLM 中文文档☆117Updated 3 weeks ago
- ☆54Updated 8 months ago
- 通义千问VLLM推理部署DEMO☆617Updated last year
- LLM101n: Let's build a Storyteller 中文版☆135Updated last year
- LLM 推理服务性能测试☆44Updated last year
- 大模型/LLM推理和部署理论与实践☆355Updated 3 months ago
- 一些大语言模型和多模态模型的生态,主要包括跨模态搜索、投机解码、QAT量化、多模态量化、ChatBot、OCR☆192Updated 2 months ago
- 筱可的工程实验仓库!☆96Updated last week
- ☆103Updated 8 months ago
- LLM Tokenizer with BPE algorithm☆44Updated last year
- TinyRAG☆359Updated 4 months ago
- 将SmolVLM2的视觉头与Qwen3-0.6B模型进行了拼接微调☆421Updated 2 months ago
- 训练一个对中文支持更好的LLaVA模型,并开源训练代码和数据。☆75Updated last year
- qwen ai agent☆140Updated last year
- ☆71Updated last year
- DeepSpeed Tutorial☆102Updated last year
- 《自然语言处理:大模型理论与实践》配套数据和代码☆72Updated this week
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆37Updated 10 months ago
- 人工智能培训课件资源☆130Updated last week
- ☆51Updated last year
- unify-easy-llm(ULM)旨在打造一个简易的一键式大模型训练工具,支持Nvidia GPU、Ascend NPU等不同硬件以及常用的大模型。☆58Updated last year
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆68Updated last year
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆105Updated last year
- This is a user guide for the MiniCPM and MiniCPM-V series of small language models (SLMs) developed by ModelBest. “面壁小钢炮” focuses on achi…☆293Updated 4 months ago
- 大模型技术栈一览☆117Updated last year
- 模型压缩的小白入门教程,PDF下载地址 https://github.com/datawhalechina/awesome-compression/releases☆334Updated 4 months ago
- 从零到一实现一个 miniLLM~(动手学习LLM)☆77Updated last year
- Alpaca Chinese Dataset -- 中文指令微调数据集☆216Updated last year
- 通义千问的DPO训练☆56Updated last year
- pretrain a wiki llm using transformers☆55Updated last year