jingyaogong / minimind
「大模型」3小时完全从0训练26M的小参数GPT,个人显卡即可推理训练!
☆2,603Updated this week
Related projects ⓘ
Alternatives and complementary repositories for minimind
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码 。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,228Updated 6 months ago
- 「大模型」3小时从0训练27M参数的视觉多模态VLM,个人显卡即可推理训练!☆338Updated this week
- 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe☆1,325Updated last week
- 从零实现一个 llama3 中文版☆529Updated 4 months ago
- HuixiangDou: Overcoming Group Chat Scenarios with LLM-based Technical Assistance☆1,511Updated last week
- 仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理☆1,458Updated 2 months ago
- 🧑🚀 全世界最好的LLM资料总结 | Summary of the world's best LLM resources.☆2,139Updated this week
- Examples and guides for using the GLM APIs☆795Updated 3 weeks ago
- 李白 作为唐代杰出诗人,其诗歌作品在中国文学史上具有重要地位。近年来,随着数字技术和人工智能的快速发展,传统文化普及推广的形式也面临着创新与变革。国内外对于李白诗歌的研究虽 已相当深入,但在数字化、智能化普及方面仍存在不足。因此,本项目旨在通过构建李白知识图谱,结合大模…☆1,242Updated 2 months ago
- 中文羊驼大模型三期项目 (Chinese Llama-3 LLMs) developed from Meta Llama 3☆1,675Updated last month
- 大模型基础: 一文了解大模型基础知识☆2,915Updated last week
- Llama3、Llama3.1 中文仓库(随书籍撰写中... 各种网友及厂商微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档)☆4,018Updated last month
- LLM&VLM Tutorial☆1,503Updated this week
- 心理健康大模型、LLM、The Big Model of Mental Health、Finetune、InternLM2、InternLM2.5、Qwen、ChatGLM、Baichuan、DeepSeek、Mixtral、LLama3、GLM4、Qwen2、LLama3…☆831Updated 2 weeks ago
- ☆479Updated last week
- 制作懂人情世故的大语言模型 | 提示词工程、RAG、Agent、微调全流程教程☆852Updated this week
- GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型☆5,189Updated last week
- Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、…☆5,834Updated 2 weeks ago
- Netease Youdao's open-source embedding and reranker models for RAG products.☆1,475Updated 2 months ago
- Practice to LLM.☆448Updated last week
- 《大语言模型》作者:赵鑫,李军毅,周昆,唐天一,文继荣☆2,286Updated 6 months ago
- 中文大模型能力评测榜单:目前已囊括128个大模型,覆盖chatgpt、gpt-4o、谷歌gemini、百度文心一言、阿里通义千问、百川、讯飞星火、商汤senseChat、minimax等商用模型, 以及qwen2.5、llama3.1、glm4、书生internLM2.5、…☆2,767Updated this week
- the resources about the application based on LLM with RAG pattern☆852Updated 2 months ago
- 用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.☆2,526Updated 5 months ago
- Streamer-Sales 销冠 —— 卖货主播 LLM 大模型🛒🎁,一个能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。🚀⭐内含详细的数据生成流程❗ 📦另外还集成了 LMDeploy 加速推理🚀、RAG检索增强生成 📚、TTS文…☆2,545Updated this week
- 《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程☆9,195Updated 2 weeks ago
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆504Updated 2 months ago
- 分享一些好用的 Dify DSL 工作流程,自用、学习两相宜。 Sharing some Dify workflows.☆1,366Updated this week
- Skywork series models are pre-trained on 3.2TB of high-quality multilingual (mainly Chinese and English) and code data. We have open-sour…☆1,222Updated 7 months ago
- Llama3-Tutorial(XTuner、LMDeploy、OpenCompass)☆490Updated 5 months ago