ShaohonChen / transformers_from_scratch
pretrain a wiki llm using transformers
☆32Updated 6 months ago
Alternatives and similar repositories for transformers_from_scratch:
Users that are interested in transformers_from_scratch are comparing it to the libraries listed below
- A mini assistant to help you read paper quickly☆35Updated 3 weeks ago
- ☆37Updated 4 months ago
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆58Updated last month
- 🎓Automatically Update agent Papers Daily using Github Actions (Update Every 12th hours)☆28Updated this week
- 专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。☆87Updated 8 months ago
- 快速入门RAG与私有化部署☆162Updated 11 months ago
- unify-easy-llm(ULM)旨在打造一个简易的一键式大模型训练工具,支持Nvidia GPU、Ascend NPU等不同硬件以及常用的大模型。☆55Updated 8 months ago
- 大型语言模型实战指南:应用实践与场景落地☆67Updated 6 months ago
- qwen ai agent☆130Updated last year
- LLM101n: Let's build a Storyteller 中文版☆130Updated 7 months ago
- 通义千问的DPO训练☆40Updated 6 months ago
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆51Updated 2 months ago
- 顾名思义:手搓的RAG☆121Updated last year
- ☆22Updated last month
- ☆135Updated 10 months ago
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆99Updated 11 months ago
- 大模型检索增强生成技术最佳实践。☆69Updated 6 months ago
- 探索 LLM 在法律行业的应用潜力☆85Updated 3 months ago
- 大模型/LLM推理和部署理论与实践☆218Updated 2 weeks ago
- 基于ReAct手搓一个Agent Demo☆117Updated 10 months ago
- Retriever-0.1B☆85Updated 9 months ago
- ☆72Updated last month
- RAG向量召回示例☆115Updated last year
- qwen models finetuning☆93Updated 2 weeks ago
- 本项目主要介绍prompt工程相关用例。包括模拟智能推荐客服系统构建和问答、思维链、自洽性、思维树等相关进阶demo,旨在帮助大家理解prompt。通过一份代码实现了同时支持多种大模型(如OpenAI、阿里通义千问等)并使用FastAPI对应用进行API封装。☆27Updated 6 months ago
- 与Datawhale组织的现有仓库以及学习内容对话——快速找到你想学习的内容和贡献内容!☆42Updated 11 months ago
- ☆85Updated 2 weeks ago
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆63Updated 6 months ago
- 解锁HuggingFace生态的百般用法☆88Updated 3 months ago
- simple decoder-only GTP model in pytorch☆37Updated 10 months ago