KMnO4-zx / extract-dialogue
从小说中提取对话数据集
☆133Updated 7 months ago
Alternatives and similar repositories for extract-dialogue:
Users that are interested in extract-dialogue are comparing it to the libraries listed below
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆90Updated 9 months ago
- Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o持续更新】☆193Updated 3 months ago
- ☆55Updated 10 months ago
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆57Updated 4 months ago
- 从0开始,将chatgpt的技术路线跑一遍。☆184Updated 4 months ago
- ☆81Updated 5 months ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆280Updated last month
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆104Updated 4 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆75Updated last year
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆78Updated 3 weeks ago
- ☆58Updated 2 months ago
- Generate dialog data from documents using LLM like ChatGLM2 or ChatGPT;利用ChatGLM2,ChatGPT等大模型根据文档生成对话数据集☆146Updated last year
- This is a repository used by individuals to experiment and reproduce the pre-training process of LLM.☆382Updated 8 months ago
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆183Updated 8 months ago
- 一些大语言模型和多模态模型的应用,主要包括Rag,小模型,Agent,跨模态搜索,OCR等等☆144Updated 2 months ago
- ☆194Updated 9 months ago
- llm-medical-data:用于大模型微调训练的医疗数据集☆84Updated last year
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆516Updated 6 months ago
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆556Updated 4 months ago
- TinyRAG☆252Updated 2 months ago
- 通义千问VLLM推理部署DEMO☆496Updated 9 months ago
- 基于大语言模型的检索增强生成RAG示例☆113Updated last month
- 学习ChatGLM3模型和LangChain框架的架构与核心功能,并基于LangChain+ChatGLM3实现本地知识库问答。☆40Updated 11 months ago
- 大模型检索增强生成技术最佳实践。☆53Updated 4 months ago
- The plan which extend ChatHaruhi into Zero-shot Roleplaying model☆100Updated 9 months ago
- 阿里通义千问(Qwen-7B-Chat/Qwen-7B), 微调/LORA/推理☆76Updated 8 months ago
- ☆97Updated 6 months ago
- chatglm-6B for tools application using langchain☆76Updated last year
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆174Updated last year
- A Chinese medical ChatGPT based on LLaMa, training from large-scale pretrain corpus and multi-turn dialogue dataset.☆328Updated last year