wenjtop / transformer
Transformer是谷歌在17年发表的Attention Is All You Need 中使用的模型,经过这些年的大量的工业使用和论文验证,在深度学习领域已经占据重要地位。Bert就是从Transformer中衍生出来的语言模型。我会以中文翻译英文为例,来解释Transformer输入到输出整个流程。
☆243Updated 11 months ago
Alternatives and similar repositories for transformer:
Users that are interested in transformer are comparing it to the libraries listed below
- Natural Language Processing Tutorial for Deep Learning Researchers☆1,118Updated 3 years ago
- 关于Transformer模型的最简洁pytorch实现,包含详细注释☆185Updated last year
- ☆165Updated 3 years ago
- A Transformer Framework Based Translation Task☆147Updated last month
- pytorch distribute tutorials☆117Updated last month
- LLM大模型(重点)以及搜广推等 AI 算法中手写的面试题,(非 LeetCode),比如 Self-Attention, AUC等,一般比 LeetCode 更考察一个人的综合能力,又更贴近业务和基础知识一点☆213Updated 3 months ago
- ☆69Updated last month
- 《跟我一起深度学习》@月来客栈 出品☆208Updated 8 months ago
- ☆124Updated last year
- personal chatgpt☆358Updated 3 months ago
- 博客配套视频链接: https://space.bilibili.com/383551518?spm_id_from=333.1007.0.0 b 站直接看 配套 github 链接:https://github.com/nickchen121/Pre-trainin…☆412Updated 2 years ago
- ☆298Updated last month
- How to use wandb?☆628Updated last year
- Huggingface transformers的中 文文档☆223Updated last year
- Demos for deep learning☆558Updated 3 months ago
- 自然语言处理学习笔记:机器学习及深度学习原理和示例,基于 Tensorflow 和 PyTorch 框架,Transformer、BERT、ALBERT等最新预训练模型及源代码详解,及基于预训练模型进行各种自然语言处理任务。模型部署☆395Updated 4 years ago
- ☆81Updated last year
- 整理 pytorch 单机多 GPU 训练方法与原理☆806Updated 3 years ago
- 算法岗笔试面试大全,励志做算法届的《五年高考,三年模拟》!☆423Updated last week
- 包含程序员面试大厂面试题和面试经验☆123Updated 3 months ago
- Transformer的完整实现。详细构建Encoder、Decoder、Self-attention。以实际例子进行展示,有完整的输入、训练、预测过程。可用于学习理解self-attention和Transformer☆71Updated last year
- 大模型基础学习和面试八股文☆101Updated last year
- 深度学习系统笔记,包含深度学习数学基础知识、神经网络基础部件详解、深度学习炼丹策略、模型压缩算法详解。☆452Updated 3 weeks ago
- ChineseNMT: Translate English to Chinese with PyTorch Implementation of Transformer☆473Updated 2 years ago
- modern AI for beginners☆118Updated 2 weeks ago
- llm相关内容,包括:基础知识、八股文、面经、经典论文☆95Updated 9 months ago
- 学习深度学习不如边写代码边学习,实际操作一遍才能理解数据的变换过程,参数的训练过程,这里整合了B站的jupter代码,可以结合着B站的视频边看边练,希望能对大家有帮助。☆127Updated 2 years ago
- Inference code for LLaMA models☆118Updated last year
- 和李沐一起读论文☆178Updated 2 months ago
- an implementation of transformer, bert, gpt, and diffusion models for learning purposes☆152Updated 5 months ago