owenliang / pytorch-transformerLinks
pytorch复现transformer
☆79Updated last year
Alternatives and similar repositories for pytorch-transformer
Users that are interested in pytorch-transformer are comparing it to the libraries listed below
Sorting:
- vision transformer on mnist dataset☆34Updated last year
- pytorch复现stable diffusion☆173Updated last year
- Diffusion Transformers (DiTs) trained on MNIST dataset☆113Updated last year
- 大模型/LLM推理和部署理论与实践☆266Updated 2 months ago
- 模型压缩的小白入门教程☆283Updated 6 months ago
- 童发发的大模型学习之旅☆79Updated last week
- Qwen2.5 0.5B GRPO☆49Updated 3 months ago
- TinyRAG☆298Updated last month
- 通义千问VLLM推理部署DEMO☆580Updated last year
- DeepSpeed Tutorial☆97Updated 9 months ago
- ☆329Updated 3 months ago
- pytorch distribute tutorials☆136Updated last week
- 一些大语言模型和多模态模型的应用,主要包括小模型,Agent,跨模态搜索,OCR、RAG、ChatBot等等☆171Updated 3 weeks ago
- LLM大模型(重点)以及搜广推等 AI 算法中手写的面试题,(非 LeetCode),比如 Self-Attention, AUC等,一般比 LeetCode 更考察一个人的综合能力,又更贴近业务和基础知识一点☆275Updated 5 months ago
- 这是一个从头训练大语言模型的项目,包括预训练、微调和直接偏好优化,模型拥有1B参数,支持中英文。☆408Updated 3 months ago
- Huggingface transformers的中文文档☆251Updated last year
- 通义千问的DPO训练☆48Updated 8 months ago
- ☆76Updated 9 months ago
- 从0开始,将chatgpt的技术路线跑一遍。☆238Updated 9 months ago
- Train a 1B LLM with 1T tokens from scratch by personal☆665Updated last month
- WWW2025 Multimodal Intent Recognition for Dialogue Systems Challenge☆123Updated 6 months ago
- RAG兴趣小组,全手写的一个RAG应用。Langchain的大部分库会很方便,但是你不一定理解其中原理,所以代码尽可能展现基本算法,主打理解RAG的原理☆219Updated 8 months ago
- Transformer是谷歌在17年发表的Attention Is All You Need 中使用的模型,经过这些年的大量的工业使用和论文验证,在深度学习领域已经占据重要地位。Bert就是从Transformer中衍生出来的语言模型。我会以中文翻译英文为例,来解释Tran…☆258Updated last year
- Demos for deep learning☆615Updated 6 months ago
- 深度学习系统笔记,包含深度学习数学基础知识、神经网络基础部件详解、深度学习炼丹策略、模型压缩算法详解。☆471Updated last month
- Inference code for LLaMA models☆121Updated last year
- 从零实现一个小参数量中文大语言模型。☆665Updated 9 months ago
- ☆179Updated last month
- LLM Tokenizer with BPE algorithm☆31Updated last year
- personal chatgpt☆372Updated 5 months ago