FunnySaltyFish / bilibili_comments_crawl
基于 B 站评论区数据构建大语言模型训练用对话数据集
☆35Updated 2 months ago
Alternatives and similar repositories for bilibili_comments_crawl:
Users that are interested in bilibili_comments_crawl are comparing it to the libraries listed below
- 从小说中提取对话数据集☆150Updated 8 months ago
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆141Updated 2 weeks ago
- Retriever-0.1B☆82Updated 8 months ago
- ☆37Updated 9 months ago
- Train an LLM LoRA using a specific dataset to enable the LLM to continue stories in a specific style based on the plot and background.通过特…☆35Updated 4 months ago
- 手把手带你从0到1实现大模型agent☆100Updated 7 months ago
- 基于大语言模型的检索增强生成RAG示例☆119Updated 2 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆78Updated last year
- ☆28Updated 4 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆110Updated 5 months ago
- 从0开始,将chatgpt的技术路线跑一遍。☆204Updated 5 months ago
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆55Updated last week
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆594Updated 5 months ago
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模 语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆104Updated last month
- 在本项目中模拟健康档案私有知识库构建和检索全流程,通过一份代码实现了同时支持多种大模型(如OpenAI、阿里通义千问等)的RAG(检索增强生成)功能:(1)离线步骤:文档加载->文档切分->向量化->灌入向量数据库;在线步骤:获取用户问题->用户问题向量化->检索向量数据库…☆85Updated 5 months ago
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆447Updated last month
- RAG兴趣小组,全手写的一个RAG应用。Langchain的大部分库会很方便,但是你不一定理解其中原理,所以代码尽可能展现基本算法,主打理解RAG的原理☆175Updated 4 months ago
- qwen ai agent☆123Updated last year
- 本项目旨在分享人工智能相关应用技术以及实战经验,包括大模型、语音合成、数字人、图像生成等。☆170Updated 4 months ago
- 学习ChatGLM3模型和LangChain框架的架构与核心功能,并基于LangChain+ChatGLM3实现本地知识库问答。☆41Updated last year
- FinQwen: 致力于构建一个开放、稳定、高质量的金融大模型项目,基于大模型搭建金融场景智能问答系统,利用开源开放来促进「AI+金融」。☆343Updated 8 months ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆529Updated 7 months ago
- 😊书生·浦语 (InternLM) 开源大语言模型第一期课程笔记😊 + 🍏Horowag Model Development🍎☆40Updated 11 months ago
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆94Updated 10 months ago
- 数据科学教程案例☆135Updated last month
- Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o持续更新】☆192Updated 4 months ago
- 大模型检索增强生成技术最佳实践。☆60Updated 5 months ago
- ☆102Updated 7 months ago
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆61Updated 5 months ago
- 欢迎star⭐。使用微信聊天记录微调大语言模型,并绑定到微信机器人,实现自己的数字克隆。 数字克隆/数字分身/LLM/大语言模型/微信聊天机器人/LoRA☆160Updated this week