FunnySaltyFish / bilibili_comments_crawlLinks
基于 B 站评论区数据构建大语言模型训练用对话数据集
☆48Updated 6 months ago
Alternatives and similar repositories for bilibili_comments_crawl
Users that are interested in bilibili_comments_crawl are comparing it to the libraries listed below
Sorting:
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆208Updated 2 months ago
- 从小说中提取对话数据集☆205Updated last year
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆101Updated last year
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆90Updated last year
- 用于汇总目前的开源中文对话数据集☆161Updated 2 years ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆433Updated last month
- 💼法律AI助手,法律RAG,通过全部200+本法律手册📖、网页搜索内容💻结合LLM回答你的问题,并且给出相应的法规和网站,基于⚡️ langchain,Gradio,openai,chroma,duckduckgo-search☆156Updated last year
- LLaMA-Factory使用经验记录☆34Updated 10 months ago
- qwen ai agent☆134Updated last year
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆686Updated last month
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆200Updated 6 months ago
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆464Updated 5 months ago
- FinQwen: 致力于构建一个开放、稳定、高质量的金融大模型项目,基于大模型搭建金融场景智能问答系统,利用开源开放来促进「AI+金融」。☆390Updated last year
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆552Updated 11 months ago
- 手把手带你从0到1实现大模型agent☆116Updated last year
- llm-medical-data:用于大模型微调训练的医疗数据集☆116Updated 2 years ago
- 基于大语言模型API(本地或商用API)的外挂知识库问答系统(附neo4j实现知识图谱)☆40Updated 2 weeks ago
- Retriever-0.1B☆92Updated last year
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆144Updated 2 years ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆130Updated 10 months ago
- chatglm3base模型的有监督微调SFT☆76Updated last year
- RAGOnMedicalKG,将大模型RAG与KG结合,完成demo级问答,旨在给出基础的思路。☆301Updated last year
- 对llama3进行全参微调、lora微调以及qlora微调。☆199Updated 8 months ago
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆204Updated last year
- GraphRAG的应用实例,项目特点在于提供了替换OpenAI模型的方法,并通过修改原有提示和切分文档的方法,提高了GraphRAG处理中文内容的能力。☆165Updated 7 months ago
- The official repository of the paper: COLD: A Benchmark for Chinese Offensive Language Detection☆274Updated 2 years ago
- 中文聊天小模型,用t5 base在大量数据上有监督。☆100Updated last year
- Alpaca Chinese Dataset -- 中文指令微调数据集☆208Updated 8 months ago
- 活字通用大模型☆390Updated 9 months ago
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆203Updated last year