EthanLiu6 / LLM_knowledgeLinks
- 【LLM面经】大模型实习面试指南。手撕代码、面经经验、思考题等。初学者学习ing......欢迎指正错误
☆24Updated 2 months ago
Alternatives and similar repositories for LLM_knowledge
Users that are interested in LLM_knowledge are comparing it to the libraries listed below
Sorting:
- 大型语言模型实战指南:应用实践与场景落地☆85Updated last year
- 小模型LLM的搭建,学习LLM的建模、训练过程 基于DeepSeek-MOE架构的小模型,用于个人学习,从0开始,解释每一条语句☆12Updated 9 months ago
- KDD2024-WhoIsWho-Top3☆16Updated last year
- 大语言模型训练和服务调研☆37Updated 2 years ago
- 最少使用 3090 即可训练自己的比特大脑(miniLLM)🧠(进行中). Train your own BitBrain(A mini LLM) with just an RTX 3090 minimum.☆38Updated 6 months ago
- GRAIN: Gradient-based Intra-attention Pruning on Pre-trained Language Models☆19Updated 2 years ago
- Fast instruction tuning with Llama2☆11Updated last year
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文本匹配篇】☆13Updated 3 years ago
- KDD 2024 AQA competition 2nd place solution☆12Updated last year
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆65Updated last year
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆74Updated 11 months ago
- LLM手撕代码合集☆17Updated 9 months ago
- 中文预训练ModernBert☆96Updated 9 months ago
- Gemma-SFT, gemma-2b/gemma-7b微调(finetune,transformers)/LORA(peft)/推理(inference)☆33Updated last year
- ☆174Updated last year
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆69Updated last year
- A repo for update and debug Mixtral-7x8B、MOE、ChatGLM3、LLaMa2、 BaChuan、Qwen an other LLM models include new models mixtral, mixtral 8x7b, …☆47Updated 3 months ago
- 本课程面对具有一定机器学习基础,但尚未入门的NLPer或经验尚浅的NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计思想,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。☆89Updated 2 years ago
- breast Cancer乳腺癌数据挖掘,python sklearn☆11Updated 6 years ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆106Updated 2 years ago
- 基于中文TaCL-BERT的中文命名实体识别及中文分词☆32Updated 4 years ago
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆62Updated last year
- 千问14B和7B的逐行解释☆63Updated 2 years ago
- 天池算法比赛《BetterMixture - 大模型数据混合挑战赛》的第一名top1解决方案☆33Updated last year
- OpenLLMDE: An open source data engineering framework for LLMs☆18Updated 2 years ago
- 为centos服务器配置clash服务☆13Updated last year
- ☆24Updated 8 months ago
- ☆55Updated last year
- Datawhale论文分享,阅读前沿论文,分享技术创新☆51Updated 2 weeks ago
- 微调阿里开源的文字检测模型,利用合合识别返回的OCR结果作为初始训练数据,对模型进行优化训练,使其更加适应1万张图片的具体场景,提高文字识别的精度。☆10Updated last year