ssbuild / aigc_serving
aigc_serving lightweight and efficient Language service model reasoning
☆24Updated 8 months ago
Alternatives and similar repositories for aigc_serving:
Users that are interested in aigc_serving are comparing it to the libraries listed below
- A high-throughput and memory-efficient inference and serving engine for LLMs☆128Updated 2 months ago
- ☆59Updated 3 months ago
- ☆37Updated 9 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆110Updated 5 months ago
- 从langchain-ChatGLM基础上修改的一个可以加载TigerBot模型的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。☆105Updated last year
- deep learning☆150Updated 7 months ago
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆105Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆100Updated last year
- 首个llama2 13b 中文版模型 (Base + 中文对话SFT,实现流畅多轮人机自然语言交互)☆89Updated last year
- Q&A based on elasticsearch+langchain+chatglm2 | 基于elasticsearch,langchain,chatglm2的自有知识库问答☆235Updated last year
- chatglm-6B for tools application using langchain☆75Updated last year
- self-host ChatGLM-6B API made with fastapi☆77Updated last year
- 骆驼QA,中文大语言阅读理解模型。☆74Updated last year
- llama inference for tencentpretrain☆97Updated last year
- chatglm-6b微调/LORA/PPO/推理, 样本为自动生成的整数/小数加减乘除运算, 可gpu/cpu☆164Updated last year
- 多显卡部署版 | ChatGLM-6B:开源双语对话语言模型 | An Open Bilingual Dialogue Language Model☆62Updated last year
- chatglm2 6b finetuning and alpaca finetuning☆145Updated 9 months ago
- 部署你自己的OpenAI api🤩, 基于flask, transformers (使用 Baichuan2-13B-Chat-4bits 模型, 可以运行在单张Tesla T4显卡) ,实现了OpenAI中Chat, Models和Completions接口,包含流式响…☆89Updated last year
- 使用qlora对中文大语言模型进行微调,包含ChatGLM、Chinese-LLaMA-Alpaca、BELLE☆85Updated last year
- chatglm3base模型的有监督微调SFT☆74Updated last year
- SMP 2023 ChatGLM金融大模型挑战赛 60 分baseline思路介绍☆184Updated last year
- 基于sentence transformers和chatglm实现的文档搜索工具☆154Updated last year
- Imitate OpenAI with Local Models☆85Updated 5 months ago
- ChatGLM-6B fine-tuning.☆135Updated last year
- 国内首个全参数训练的法律大模型 HanFei-1.0 (韩非)☆113Updated last year
- 基于chatglm快速搭建文档问答机器人☆88Updated last year
- (1)弹性区间标准化的旋转位置词嵌入编码器+peft LORA量化训练,提高万级tokens性能支持。(2)证据理论解释学习,提升模型的复杂逻辑推理能力(3)兼容alpaca数据格式。☆45Updated last year
- gpt_server是一个用于生产级部署LLMs或Embedding的开源框架。☆151Updated this week
- ✏️0成本LLM微调上手项目,⚡️一步一步使用colab训练法律LLM,基于microsoft/phi-1_5、chatglm3,包含lora微 调,全参微调☆61Updated last year
- 演示 vllm 对中文大语言模型的神奇效果☆31Updated last year