FunnySaltyFish / Better-RuozhibaLinks
【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集
☆221Updated 4 months ago
Alternatives and similar repositories for Better-Ruozhiba
Users that are interested in Better-Ruozhiba are comparing it to the libraries listed below
Sorting:
- 从小说中提取对话数据集☆239Updated last year
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆476Updated 7 months ago
- Alpaca Chinese Dataset -- 中文指令微调数据集☆213Updated 10 months ago
- A lightweight multilingual LLM☆983Updated 3 weeks ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆567Updated last year
- 中文Mixtral混合专家大模型(Chinese Mixtral MoE LLMs)☆608Updated last year
- ☆65Updated last year
- ☆716Updated 2 years ago
- ☆84Updated last year
- ☆453Updated 2 years ago
- ☆156Updated last year
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆727Updated 3 months ago
- GAOKAO-Bench is an evaluation framework that utilizes GAOKAO questions as a dataset to evaluate large language models.☆678Updated 7 months ago
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆68Updated last year
- 从0开始,将chatgpt的技术路线跑一遍。☆252Updated 11 months ago
- Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。☆295Updated last year
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,592Updated last year
- 用于汇总目前的开源中文对话数据集☆176Updated 2 years ago
- ☆112Updated 8 months ago
- Retriever-0.1B☆92Updated last year
- 👋 欢迎来到 ChatGLM 创意世界!你可以使用修订和续写的功能来生成创意内容!☆247Updated last year
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆209Updated last year
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆127Updated 2 years ago
- The plan which extend ChatHaruhi into Zero-shot Roleplaying model☆108Updated last year
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆103Updated last year
- gpt_server是一个用于生产级部署LLMs、Embedding、Reranker、ASR和TTS的开源框架。☆206Updated last week
- This is a repository used by individuals to experiment and reproduce the pre-training process of LLM.☆469Updated 4 months ago
- 多模态中文LLaMA&Alpaca大语言模型(VisualCLA)☆451Updated 2 years ago
- 活字通用大模型☆393Updated 11 months ago
- Firefly中文LLaMA-2大模型,支持增量预训练Baichuan2、Llama2、Llama、Falcon、Qwen、Baichuan、InternLM、Bloom等大模型☆413Updated last year