FunnySaltyFish / bilibili_comments_crawl
基于 B 站评论区数据构建大语言模型训练用对话数据集
☆43Updated 3 months ago
Alternatives and similar repositories for bilibili_comments_crawl:
Users that are interested in bilibili_comments_crawl are comparing it to the libraries listed below
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆176Updated 2 months ago
- 从小说中提取对话数据集☆176Updated 9 months ago
- ☆30Updated 6 months ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆354Updated 2 months ago
- 学习ChatGLM3模型和LangChain框架的架构与核心功能,并基于LangChain+ChatGLM3实现本地知识库问答。☆39Updated last year
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆82Updated last year
- Train an LLM LoRA using a specific dataset to enable the LLM to continue stories in a specific style based on the plot and background.通过特…☆40Updated 5 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆122Updated 7 months ago
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆63Updated 7 months ago
- 😊书生·浦语 (InternLM) 开源大语言模型第一期课程笔记😊 + 🍏Horowag Model Development🍎☆41Updated last year
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆193Updated last year
- 从零到一实现一个 miniLLM~(动手学习LLM)☆64Updated 11 months ago
- 专为新手设计!Chatbot Trainer 是一个基于开源语言模型(GLM4)的聊天机器人训练项目。你可以轻松训练出一个拥有你自己语气性格的聊天机器人,或训练任何你感兴趣的人物,包括名人、历史人物、动漫角色或电影小说中的虚拟人物。 通过项目内置的数据集问答对制作指导,你…☆36Updated 3 months ago
- Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。☆294Updated 11 months ago
- 这是一个一键让小参数大模型进行角色扮演的项目,从数据构成和训练都包含在这项目中☆22Updated last year
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆640Updated 7 months ago
- 全方位大模型评测知识库 | 提示词工程(Prompt Engineer)、各渠道大模型榜单(LeaderBoard)、标杆数据集、安全检测、对抗攻击、智能体、优质数据、文本分类、关系抽取、语音识别、语音合成、多模态、文本生成图片、文本生成视频、点云、智能对话、摘要总结、问答…☆55Updated 4 months ago
- FinQwen: 致力于构建一个开放、稳定、高质量的金融大模型项目,基于大模型搭建金融场景智能问答系统,利用开源开放来促进「AI+金融」。☆362Updated 9 months ago
- MCM(Multimodal Chinese Medical LLM)多模态中医问诊大模型☆104Updated 9 months ago
- 中文聊天小模型,用t5 base在大量数据上有监督。☆99Updated last year
- Retriever-0.1B☆87Updated 9 months ago
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆458Updated 2 months ago
- ☆85Updated 3 weeks ago
- 中文 小说 多轮对话语料库 ,可以用来训练中文聊天模型,更新中,有想加的语料可以提issue☆21Updated 11 months ago
- The plan which extend ChatHaruhi into Zero-shot Roleplaying model☆103Updated 11 months ago
- dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识…☆331Updated 11 months ago
- 基于论文摘要的文本分类与关键词抽取挑战赛—Task 1☆25Updated last year
- 一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测,低参数量及全参数模型训练(预训练、SFT、RM、PPO、DPO)和融合、量化。☆215Updated last year
- HeartLink 是一个心理共情大模型,通过 `Large Language Model` 在构建的大型共情问答数据集指令微调而来,能在对话过程中感知用户的情绪与此时用户的经历,通过丰富的心理学知识,给予共情回复,达到理解安慰、共情支持用户的目的。在回复中附有 emoji…☆26Updated 4 months ago
- 使用Pytorch框架对NLP方向上的文本分类、实体识别、三元组抽取做代码实战☆174Updated 11 months ago