KMnO4-zx / extract-dialogue
从小说中提取对话数据集
☆178Updated 9 months ago
Alternatives and similar repositories for extract-dialogue:
Users that are interested in extract-dialogue are comparing it to the libraries listed below
- ☆60Updated last year
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆98Updated last year
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆153Updated 3 months ago
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆63Updated 7 months ago
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆648Updated 7 months ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆361Updated 2 months ago
- Alpaca Chinese Dataset -- 中文指令微调数据集☆194Updated 6 months ago
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆458Updated 3 months ago
- 🚀WebUI integrated platform for latest LLMs | 各大语言模型的全流程工具 WebUI 整合包。支持主流大模型API接口和开源模型。支持知识库,数据库,角色扮演,mj文生图,LoRA和全参数微调,数据集制作,live2d等全流程应用…☆532Updated 4 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆123Updated 7 months ago
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆191Updated 10 months ago
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆180Updated 2 months ago
- A Chinese medical ChatGPT based on LLaMa, training from large-scale pretrain corpus and multi-turn dialogue dataset.☆352Updated last year
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆83Updated last year
- TinyRAG☆284Updated 5 months ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆548Updated 9 months ago
- 文本语料转训练集工具,txt转dataset☆91Updated 11 months ago
- 用于汇总目前的开源中文对话数据集☆146Updated 2 years ago
- 在本项目中模拟健康档案私有知识库构建和检索全流程,通过一份代码实现了同时支持多种大模型(如OpenAI、阿里通义千问等)的RAG(检索增强生成)功能:(1)离线步骤:文档加载->文档切分->向量化->灌入向量数据库;在线步骤:获取用户问题->用户问题向量化->检索向量数据库…☆119Updated 7 months ago
- The plan which extend ChatHaruhi into Zero-shot Roleplaying model☆103Updated last year
- 一个适合学习、使用、自主扩展的RAG【检索增强生成】系统!可联网做AI搜索☆475Updated 7 months ago
- 通义千问VLLM推理部署DEMO☆562Updated last year
- llm-medical-data:用于大模型微调训练的医疗数据集☆104Updated last year
- FinQwen: 致力于构建一个开放、稳定、高质量的金融大模型项目,基于大模型搭建金融场景智能问答系统,利用开源开放来促进「AI+金融」。☆364Updated 10 months ago
- 基于大语言模型的检索增强生成RAG示例☆140Updated 4 months ago
- 雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆299Updated 8 months ago
- 从0到1构建一个MiniLLM (pretrain+sft+dpo实践中)☆415Updated 3 weeks ago
- RAGOnMedicalKG,将大模型RAG与KG结合,完成demo级问答,旨在给出基础的思路。☆282Updated last year
- ☆85Updated last month
- Baichuan2代码的逐行解析版本,适合小白☆213Updated last year