pengwei-iie / llama_bugsLinks
Inference code for LLaMA models
☆33Updated 2 years ago
Alternatives and similar repositories for llama_bugs
Users that are interested in llama_bugs are comparing it to the libraries listed below
Sorting:
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆210Updated last year
- 包含程序员面试大厂面试题和面试经验☆182Updated 4 months ago
- 《跟我一起深度学习》@月来客栈 出品☆227Updated 2 months ago
- 自然语言处理学习笔记:机器学习及深度学习原理和示例,基于 Tensorflow 和 PyTorch 框架,Transformer、BERT、ALBERT等最新预训练模型及源代码详解,及基于预训练模型进行各种自然语言处理任务。模型部署☆435Updated 5 years ago
- PromptCBLUE: a large-scale instruction-tuning dataset for multi-task and few-shot learning in the medical domain in Chinese☆379Updated last year
- 大模型基础学习和面试八股文☆162Updated last year
- personal chatgpt☆385Updated 9 months ago
- Some survey and tools of ChatGPT or ChatGPT-Style Model☆93Updated 2 years ago
- 🛰️ 基于真实医疗对话数据在ChatGLM上进行LoRA、P-Tuning V2、Freeze、RLHF等微调,我们的眼光不止于医疗问答☆332Updated 2 years ago
- Huggingface transformers的中文文档☆271Updated last year
- 数据科学教程、大模型实践案例☆145Updated 3 months ago
- llm-medical-data:用于大模型微调训练的医疗数据集☆127Updated 2 years ago
- 该仓库主要记录 LLMs 算法工程师相关的顶会论文研读笔记(多模态、PEFT、小样本QA问答、RAG、LMMs可解释性、Agents、CoT)☆356Updated last year
- a collection of NLP projects&tools. 自然语言处理方向项目和工具集合。☆223Updated last year
- 《ChatGPT原理与实战:大型语言模型的算法、技术和私有化》☆365Updated last year
- 一些 LLM 方面的从零复现笔记☆221Updated 5 months ago
- 大模型技术栈一览☆113Updated last year
- 对llama3进行全参微调、lora微调以及qlora微调。☆210Updated last year
- ☆76Updated 4 months ago
- The Largest-scale Chinese Medical QA Dataset: with 26,000,000 question answer pairs.☆292Updated last year
- 快速入门RAG与 私有化部署☆208Updated last year
- Deepspeed、LLM、Medical_Dialogue、医疗大模型、预训练、微调☆283Updated last year
- A Transformer Framework Based Translation Task☆155Updated 4 months ago
- MindSpore online courses: Step into LLM☆476Updated last month
- 使用LoRA对ChatGLM进行微调。☆49Updated 2 years ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆521Updated 4 months ago
- Learning LLM Implementaion and Theory for Practical Landing☆184Updated 9 months ago
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆212Updated last year
- an implementation of transformer, bert, gpt, and diffusion models for learning purposes☆158Updated 11 months ago
- DeepSpeed Tutorial☆102Updated last year