EthanLiu6 / LLM_knowledgeLinks
- 【LLM面经】大模型实习面试指南。手撕代码、面经经验、思考题等。初学者学习ing......欢迎指正错误
☆20Updated 2 weeks ago
Alternatives and similar repositories for LLM_knowledge
Users that are interested in LLM_knowledge are comparing it to the libraries listed below
Sorting:
- KDD2024-WhoIsWho-Top3☆16Updated last year
- 小模型LLM的搭建,学习LLM的建模、训练过程 基于DeepSeek-MOE架构的小模型,用于个人学习,从0开始,解释每一条语句☆11Updated 8 months ago
- 大型语言模型实战指南:应用实践与场景落地☆83Updated last year
- 最少使用 3090 即可训练自己的比特大脑(miniLLM)🧠(进行中). Train your own BitBrain(A mini LLM) with just an RTX 3090 minimum.☆38Updated 5 months ago
- 《Pattern Recognition and Machine Learning》阅读讨论班☆35Updated 6 years ago
- Fast instruction tuning with Llama2☆11Updated last year
- 大语言模型训练和服务调研☆36Updated 2 years ago
- chatglm3-6b, 微调/LORA/推理/单机多卡/deepspeed/支持多轮对话☆17Updated 2 years ago
- 大模型智能体Agent中文教程,博客代码仓库☆50Updated 3 weeks ago
- 基于自动生成知识库的智能问答系统☆19Updated 6 years ago
- LLM手撕代码合集☆17Updated 8 months ago
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆64Updated last year
- GRAIN: Gradient-based Intra-attention Pruning on Pre-trained Language Models☆19Updated 2 years ago
- CAIL 2023☆41Updated 2 years ago
- 从零开始学大模型Transformer、GPT2、BERT pre-training and fine-tuning from scratch☆36Updated last year
- unify-easy-llm(ULM)旨在打造一个简易的一键式大模型训练工具,支持Nvidia GPU、Ascend NPU等不同硬件以及常用的大模型。☆59Updated last year
- ☆23Updated 2 years ago
- 天池算法比赛《BetterMixture - 大模型数据混合挑战赛》的第一名top1解决方案☆32Updated last year
- KDD 2024 AQA competition 2nd place solution☆12Updated last year
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆12Updated 4 years ago
- CLUE Emotion Analysis Dataset 细粒度情感分析数据集☆10Updated 5 years ago
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆69Updated last year
- Gemma-SFT, gemma-2b/gemma-7b微调(finetune,transformers)/LORA(peft)/推理(inference)☆33Updated last year
- A repo for update and debug Mixtral-7x8B、MOE、ChatGLM3、LLaMa2、 BaChuan、Qwen an other LLM models include new models mixtral, mixtral 8x7b, …☆47Updated last month
- 本课程面对具有一定机器学习基础,但尚未入门的NLPer或经验尚浅的NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计思想,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。☆90Updated last year
- 一套代码指令微调大模型☆38Updated 2 years ago
- 中文预训练ModernBert☆93Updated 7 months ago
- learn some Machine Learning algorithm with python☆13Updated 6 years ago
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文本匹配篇】☆13Updated 3 years ago
- Spark projects. Learning book "Machine Learning with Spark"☆10Updated 8 years ago