owenliang / mnist-onnx-runtimeLinks
MoE model with onnx runtime
☆55Updated last year
Alternatives and similar repositories for mnist-onnx-runtime
Users that are interested in mnist-onnx-runtime are comparing it to the libraries listed below
Sorting:
- vLLM Documentation in Chinese Simplified / vLLM 中文文档☆114Updated this week
- LLM101n: Let's build a Storyteller 中文版☆133Updated last year
- 一些大语言模型和 多模态模型的生态,主要包括跨模态搜索、投机解码、QAT量化、多模态量化、ChatBot、OCR☆190Updated 2 months ago
- ☆103Updated 7 months ago
- ☆69Updated last year
- 将SmolVLM2的视觉头与Qwen3-0.6B模型进行了拼接微调☆393Updated last month
- 筱可的工程实验仓库!☆87Updated last week
- 训练一个对中文支持更好的LLaVA模型,并开源训练代码和数据。☆74Updated last year
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆104Updated last year
- 在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。☆36Updated 9 months ago
- 大模型/LLM推理和部署理论与实践☆352Updated 3 months ago
- LLM 推理服务性能测试☆43Updated last year
- 人工智能培训课件资源☆117Updated this week
- TinyRAG☆350Updated 3 months ago
- pretrain a wiki llm using transformers☆54Updated last year
- ☆54Updated 7 months ago
- 看图学大模型☆320Updated last year
- LLM Tokenizer with BPE algorithm☆41Updated last year
- 通义千问VLLM推理部署DEMO☆611Updated last year
- 顾名思义:手搓的RAG☆128Updated last year
- bilibili视频讲解所使用的课件代码记录☆22Updated 3 weeks ago
- 项目的issue会存放我的所有blog☆16Updated last month
- This is a user guide for the MiniCPM and MiniCPM-V series of small language models (SLMs) developed by ModelBest. “面壁小钢炮” focuses on achi…☆292Updated 3 months ago
- unify-easy-llm(ULM)旨在打造一个简易的一键式大模型训练工具,支持Nvidia GPU、Ascend NPU等不同硬件以及常用的大模型。☆57Updated last year
- 《自然语言处理:大模型理论与实践》配套数据和代码☆72Updated last month
- ☆103Updated last year
- Inference code for LLaMA models☆125Updated 2 years ago
- run ChatGLM2-6B in BM1684X☆50Updated last year
- 《多模态大模型:新一代人工智能技术范式》作者:刘阳,林倞☆246Updated 10 months ago
- simple decoder-only GTP model in pytorch☆42Updated last year