Aorunfa / transformerselfLinks
一个用于快速入门transformer的仓库,梳理相关nlp和vit模型结构、原理,训练的基本步骤及微调方法, 配套能快速学习的代码实战项目
☆34Updated 10 months ago
Alternatives and similar repositories for transformerself
Users that are interested in transformerself are comparing it to the libraries listed below
Sorting:
- 《多模态大模型:新一代人工智能技术范式》作者:刘阳,林倞☆259Updated last year
- LLM大模型(重点)以及搜广推等 AI 算法中手写的面试题,(非 LeetCode),比如 Self-Attention, AUC等,一般比 LeetCode 更考察一个人的综合能力,又更贴近业务和基础知识一点☆479Updated last year
- RAG兴趣小组,全手写的一个RAG应用。Langchain的大部分库会很方便,但是你不一定理解其中原理,所以代码尽可能展现基本算法,主打理解RAG的原理☆252Updated last year
- ☆110Updated 7 months ago
- 一个简单的多模态RAG项目☆297Updated 8 months ago
- ☆268Updated 8 months ago
- 从零复现 minimind👉minimind-v☆118Updated last month
- ☆136Updated last year
- 个人总结的大模型、自然语言处理NLP、多模态、计算机视觉CV等方向paper的阅读笔记;收集到或者使用到的一些NLP、CV等领域的优秀开源仓库;其他:如数据集、评测leaderboard等☆61Updated this week
- 简单易理解的代码,用于在qwen上使用grpo加强数学能力☆46Updated 8 months ago
- A simple and trans-platform rag framework and tutorial☆229Updated 3 weeks ago
- A simple and trans-platform agent framework and tutorial☆199Updated 3 weeks ago
- For People! For Freedom!☆142Updated 5 months ago
- 一个很小很小的RAG系统☆347Updated 9 months ago
- 一个用于预防经济诈骗的文本分类检测微调项目。☆77Updated last year
- 大模型/LLM推理和部署理论与实践☆374Updated 6 months ago
- ☆286Updated 2 months ago
- 大模型进阶面经☆97Updated 9 months ago
- 本项目利用医学领域的 CoT 数据对 Deepseek-R1-Distill-Qwen-7B 进行微调,通过 QLoRA 量化和 Unsloth 加速训练,显著提升模型在复杂医学推理任务中的慢思考能力。知识蒸馏技术使轻量级模型获得大模型的推理优势,实现高效、准确且具有解释性…☆39Updated 11 months ago
- Learning LLM Implementaion and Theory for Practical Landing☆195Updated last year
- LLM Tokenizer with BPE algorithm☆47Updated last year
- 本项目为书籍《大模型RAG实战》的代码以及资料汇总。☆274Updated last year
- graphrag的基础架构☆46Updated last year
- Build a simple basic multimodal large model from scratch. 从零搭建一个简单的基础多模态大模型🤖☆47Updated last year
- ☆61Updated last year
- TinyRAG☆413Updated 7 months ago
- 理工科-大模型入门实训课程☆116Updated 5 months ago
- 本项目将基于多模态,RAG以及LLM等技术,打造了一个基于手相算命 的系统☆29Updated last year
- 人工智能培训课件资源☆148Updated 2 months ago
- ThinkLLM:🚀 轻量、高效的大语言模型算法实现☆115Updated 8 months ago