owenliang / mnist-onnx-runtime
MoE model with onnx runtime
☆23Updated 6 months ago
Related projects ⓘ
Alternatives and complementary repositories for mnist-onnx-runtime
- LLM Tokenizer with BPE algorithm☆27Updated 6 months ago
- 通义千问的DPO训练☆27Updated 2 months ago
- 在本项目中模拟 健康档案私有知识库构建和检索全流程,通过一份代码实现了同时支持多种大模型(如OpenAI、阿里通义千问等)的RAG(检索增强生成)功能:(1)离线步骤:文档加载->文档切分->向量化->灌入向量数据库;在线步骤:获取用户问题->用户问题向量化->检索向量数据库…☆58Updated 2 months ago
- DeepSpeed Tutorial☆90Updated 3 months ago
- 实现一个PyTorch框架☆26Updated 10 months ago
- 帮助新手快速入门、快速使用、习惯 OpenMMLab 开源库官方文档且能够自主上手实验,自由选择阅读更深层的知识。☆55Updated last year
- 大模型/LLM推理和部署理论与实践☆82Updated this week
- Xtuner Factory☆32Updated 8 months ago
- 顾名思义:手搓的RAG☆111Updated 8 months ago
- ☆51Updated 8 months ago
- 《多模态大模型:新一代人工智能技术范式》作者:刘阳,林倞☆135Updated 5 months ago
- 基于ReAct手搓一个Agent Demo☆105Updated 6 months ago
- 《自然语言处理:大模型理论与实践》配套数据和代码☆35Updated last month
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆44Updated 6 months ago
- 训练一个对中文支持更好的LLaVA模型,并开源训练代码和数据。☆38Updated 2 months ago
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆48Updated 5 months ago
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆82Updated 7 months ago
- ☆68Updated last week
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆42Updated 4 months ago
- Deploying LLMs offline on the NVIDIA Jetson platform marks the dawn of a new era in embodied intelligence, where devices can function ind…☆80Updated 8 months ago
- 个人项目地址,一些大语言模型和多模态模型的应用☆123Updated 2 weeks ago
- ☆77Updated 3 months ago
- ☆37Updated 3 months ago
- 使用煤矿历史事故案例,事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据,微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。☆38Updated 2 months ago
- 基于InternLM2大模型的离线具身智能导盲犬☆66Updated 7 months ago
- Music large model based on InternLM2-chat.☆21Updated 4 months ago
- 天池算法比赛《BetterMixture - 大模型数据混合挑战赛》的第一名top1解决方案☆22Updated 4 months ago
- pytorch单精度、半精度、混合精度、单卡、多卡(DP / DDP)、FSDP、DeepSpeed模型训练代码,并对比不同方法的训练速度以及GPU内存的使用☆78Updated 8 months ago
- Vision Search Assistant: Empower Vision-Language Models as Multimodal Search Engines☆89Updated 2 weeks ago
- qwen ai agent☆109Updated 9 months ago