jingyaogong / minimind
「大模型」3小时完全从0训练26M的小参数GPT,个人显卡即可推理训练!
☆2,738Updated last week
Related projects ⓘ
Alternatives and complementary repositories for minimind
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化 等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,246Updated 7 months ago
- 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe☆1,363Updated 3 weeks ago
- 「大模型」3小时从0训练27M参数的视觉多模态VLM,个人显卡即可推理训练!☆365Updated this week
- 大模型基础: 一文了解大模型基础知识☆3,001Updated 2 weeks ago
- 从零实现一个 llama3 中文版☆553Updated 5 months ago
- 仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理☆1,558Updated 3 months ago
- HuixiangDou: Overcoming Group Chat Scenarios with LLM-based Technical Assistance☆1,519Updated 3 weeks ago
- 中文羊驼大模型三期项目 (Chinese Llama-3 LLMs) developed from Meta Llama 3☆1,693Updated last month
- 🧑🚀 全世界最好的LLM资料总结 | Summary of the world's best LLM resources.☆2,335Updated this week
- Llama3、Llama3.1 中文仓库(随书籍撰写中... 各种网友及厂商微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档)☆4,036Updated 2 months ago
- Examples and guides for using the GLM APIs☆806Updated last week
- 李白 作为唐代杰出诗人,其诗歌作品在中国文学史上具有重要地位。近年来,随着数字技术和人工智能的快速发展,传统文化普及推广的形式也面临着创新与变革。国内外对于李白诗歌的研究虽已相当深入,但在数字化、智能化普及方面仍存在不足。因此,本项目旨在通过构建李白知识图谱,结合大模…☆1,273Updated 2 months ago
- 《大语言模型》作者:赵鑫,李军毅,周昆,唐天一,文继荣☆2,315Updated 6 months ago
- GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型☆5,294Updated last week
- Llama3-Tutorial(XTuner、LMDeploy、OpenCompass)☆492Updated 6 months ago
- 心理健康大模型、LLM、The Big Model of Mental Health、Finetune、InternLM2、InternLM2.5、Qwen、ChatGLM、Baichuan、DeepSeek、Mixtral、LLama3、GLM4、Qwen2、LLama3…☆859Updated last month
- 用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.☆2,541Updated 6 months ago
- 本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/☆4,774Updated last month
- 制作懂人情世故的大语言模型 | 提示词工程、RAG、Agent、微调全流程教程☆868Updated 2 weeks ago
- ☆506Updated 2 weeks ago
- LLM&VLM Tutorial☆1,534Updated this week
- Skywork series models are pre-trained on 3.2TB of high-quality multilingual (mainly Chinese and English) and code data. We have open-sour…☆1,223Updated 7 months ago
- Netease Youdao's open-source embedding and reranker models for RAG products.☆1,487Updated 2 months ago
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆510Updated 2 months ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆488Updated 4 months ago
- Use PEFT or Full-parameter to finetune 400+ LLMs or 100+ MLLMs. (LLM: Qwen2.5, Llama3.2, GLM4, Internlm2.5, Yi1.5, Mistral, Baichuan2, D…☆4,289Updated this week
- Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、…☆5,865Updated 3 weeks ago
- 【LLMs九层妖塔】分享 LLMs在自然语言处理(ChatGLM、Chinese-LLaMA-Alpaca、小羊驼 Vicuna、LLaMA、GPT4ALL等)、信息检索(langchain)、语言合成、语言识别、多模态等领域(Stable Diffusion、MiniGP…☆1,798Updated 7 months ago
- ModelScope-Agent: An agent framework connecting models in ModelScope with the world☆2,722Updated last week
- 中文大模型能力评测榜单:目前已囊括128个大模型,覆盖chatgpt、gpt-4o、谷歌gemini、百度文心一言、阿里通义千问、百川、讯飞星火、商汤senseChat、minimax等商用模型, 以及qwen2.5、llama3.1、glm4、书生internLM2.5、…☆2,830Updated this week