EthanLiu6 / LLM_knowledgeLinks
- 【LLM面经】大模型实习面试指南。手撕代码、面经经验、思考题等。初学者学习ing......欢迎指正错误
☆25Updated 2 months ago
Alternatives and similar repositories for LLM_knowledge
Users that are interested in LLM_knowledge are comparing it to the libraries listed below
Sorting:
- 最少使用 3090 即可训练自己的比特大脑(miniLLM)🧠(进行中). Train your own BitBrain(A mini LLM) with just an RTX 3090 minimum.☆38Updated 7 months ago
- Fast instruction tuning with Llama2☆11Updated last year
- KDD2024-WhoIsWho-Top3☆16Updated last year
- 小模型LLM的搭建,学习LLM的建模、训练过程 基于DeepSeek-MOE架构的小模型,用于个人学习,从0开始,解释每一条语句☆14Updated 10 months ago
- Project is used for thesis. It is back-end of learning path recommendation system. Using Django and Neo4j Graph Database to build back-en…☆10Updated 3 years ago
- KDD 2024 AQA competition 2nd place solution☆12Updated last year
- 大模型智能体Agent中文教程,博客代码仓库☆58Updated 3 months ago
- 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第三场 —— 零基础入门NLP之新闻文本分类挑战赛。赛题以自然语言处理为背景,要求选手根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触N…☆18Updated 5 years ago
- 一套代码指令微调大模型☆39Updated 2 years ago
- 从零开始学大模型Transformer、GPT2、BERT pre-training and fine-tuning from scratch☆37Updated last year
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文本匹配篇】☆13Updated 3 years ago
- 大型语言模型实战指南:应用实践与场景落地☆87Updated last year
- 中文预训练ModernBert☆98Updated 9 months ago
- 一些 LLM 方面的从零复现笔记☆243Updated 9 months ago
- ☆175Updated last year
- 《大规模语言模型:从理论到实践》第六章强化学习部分内容讲解☆32Updated 8 months ago
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆65Updated last year
- 本项目是一个围绕 DeepLearning.AI 出品的 Post-Training for LLMs 系列课程,为国内学习者量身打造的中文翻译与知识整理教程。项目提供课程内容翻译、知识点梳理和示例代码等内容,旨在降低语言门槛,让更多学生、研究人员和开发者系统掌握大语言模型…☆144Updated last month
- ☆23Updated 9 months ago
- 天池算法比赛《BetterMixture - 大模型数据混合挑战赛》的第一名top1解决方案☆34Updated last year
- GRAIN: Gradient-based Intra-attention Pruning on Pre-trained Language Models☆19Updated 2 years ago
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆64Updated last year
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆74Updated last year
- 阿里通义千问(Qwen-7B-Chat/Qwen-7B), 微调/LORA/推理☆136Updated last year
- 大语言模型训练和服务调研☆37Updated 2 years ago
- ☆120Updated last year
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回 (粗排), 然后构建句子的相似度,并利用Lig…☆12Updated 4 years ago
- 一个开源的多模态 AI 搜索项目,结合 大语言模型(LLM)+ 多源搜索引擎 + 多 Agent 架构,打造新一代的智能问答式搜索体验☆13Updated 10 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆107Updated 2 years ago
- ☆15Updated 5 years ago