EthanLiu6 / LLM_knowledgeLinks
- 【LLM面经】大模型实习面试指南。手撕代码、面经经验、思考题等。初学者学习ing......欢迎指正错误
☆24Updated 2 months ago
Alternatives and similar repositories for LLM_knowledge
Users that are interested in LLM_knowledge are comparing it to the libraries listed below
Sorting:
- KDD2024-WhoIsWho-Top3☆16Updated last year
- 最少使用 3090 即可训练自己的比特大脑(miniLLM)🧠(进行中). Train your own BitBrain(A mini LLM) with just an RTX 3090 minimum.☆38Updated 7 months ago
- 小模型LLM的搭建,学习LLM的建模、训练过程 基于DeepSeek-MOE架构的小模型,用于个人学习,从0开始,解释每一条语句☆14Updated 10 months ago
- LLM手撕代码合集☆19Updated 10 months ago
- 为centos服务器配置clash服务☆15Updated last year
- Fast instruction tuning with Llama2☆11Updated last year
- 大型语言模型实战指南:应用实践与场景落地☆87Updated last year
- 一些 LLM 方面的从零复现笔记☆243Updated 9 months ago
- Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理☆71Updated last year
- ☆39Updated last year
- 大语言模型训练和服务调研☆37Updated 2 years ago
- Datawhale论文分享,阅读前沿论文,分享技术创新☆51Updated last month
- 天池算法比赛《BetterMixture - 大模型数据混合挑战赛》的第一名top1解决方案☆34Updated last year
- 本项目是一个围绕 DeepLearning.AI 出品的 Post-Training for LLMs 系列课程,为国内学习者量身打造的中文翻译与知识整理教程。项目提供课程内容翻译、知识点梳理和示例代码等内容,旨在降低语言门槛,让更多学生、研究人员和开发者系统掌握大语言模型…☆144Updated last month
- 大模型智能体Agent中文教程,博客代码仓库☆57Updated 3 months ago
- 中文预训练ModernBert☆97Updated 9 months ago
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆74Updated 11 months ago
- Gemma-SFT, gemma-2b/gemma-7b微调(finetune,transformers)/LORA(peft)/推理(inference)☆33Updated last year
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆64Updated last year
- ☆120Updated last year
- Project is used for thesis. It is back-end of learning path recommendation system. Using Django and Neo4j Graph Database to build back-en…☆10Updated 3 years ago
- 一套代码指令微调大模型☆38Updated 2 years ago
- 一个开源的多模态 AI 搜索项目,结合 大语言模型(LLM)+ 多源搜索引擎 + 多 Agent 架构,打造新一代的智能问答式搜索体验☆14Updated 10 months ago
- ☆175Updated last year
- ☆22Updated last year
- 本课程面对具有一定机器学习基础,但尚未入门的NLPer或经验尚浅的NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计思想,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。☆89Updated 2 years ago
- 《Pattern Recognition and Machine Learning》阅读讨论班☆35Updated 6 years ago
- 《大规模语言模型:从理论到实践》第六章强化学习部分内容讲解☆31Updated 8 months ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆12Updated 4 years ago
- KDD 2024 AQA competition 2nd place solution☆12Updated last year