FunnySaltyFish / bilibili_comments_crawlLinks
基于 B 站评论区数据构建大语言模型训练用对话数据集
☆58Updated last year
Alternatives and similar repositories for bilibili_comments_crawl
Users that are interested in bilibili_comments_crawl are comparing it to the libraries listed below
Sorting:
- 从小说中提取对话数据集☆298Updated 3 months ago
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆239Updated 8 months ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆587Updated 7 months ago
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆779Updated 7 months ago
- FinQwen: 致力于构建一个开放、稳定、高质量的金融大模型项目,基于大模型搭建金融场景智能问答系统,利用开源开放来促进「AI+金融」。☆426Updated last year
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆105Updated 2 years ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆581Updated last year
- 手把手带你从0到1实现大模型agent☆121Updated last year
- Retriever-0.1B☆96Updated last year
- RAG兴趣小组,全手写的一个RAG应用。Langchain的大部分库会很方便,但是你不一定理解其中原理,所以代码尽可能展现基本算法,主打理解RAG的原理☆244Updated last year
- TinyAISearch 是一个轻量但强大的 AI 搜索项目,为你完整揭示从智能搜索规划、网页爬取、内容召回到流式问答的 RAG 全链路。 项目独创网页级召回 (V2) 模式,旨在为大语言模型提供更完整、连贯的上下文,超越传统 RAG 的碎片化知识。同时,项目内置多种可配置…☆76Updated 4 months ago
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆257Updated last year
- 对llama3进行全参微调、lora微调以及qlora微调。☆212Updated last year
- NLP_Study_Demo☆169Updated last year
- 尝试自己从头写一个LLM,参考llama和nanogpt☆68Updated last year
- ☆29Updated last year
- 通义千问VLLM推理部署DEMO☆637Updated last year
- This is a repository used by individuals to experiment and reproduce the pre-training process of LLM.☆486Updated 8 months ago
- 阿里通义千问(Qwen-7B-Chat/Qwen-7B), 微调/LORA/推理☆132Updated last year
- 从0到1构建一个MiniLLM (pretrain+sft+dpo实践中)☆512Updated 9 months ago
- chatglm3base模型的有监督微调SFT☆78Updated 2 years ago
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer 训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,658Updated last year
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆138Updated last year
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆487Updated 3 months ago
- Qwen3 Fine-tuning: Medical R1 Style Chat☆258Updated 7 months ago
- 从0开始,将chatgpt的技术路线跑一遍。☆270Updated last year
- Huggingface transformers的中文文档☆285Updated 2 years ago
- qwen ai agent☆146Updated last year
- 数据科学教程、大模型实践案例☆147Updated 6 months ago
- 学习ChatGLM3模型和LangChain框架的架构与核心功能,并基于LangChain+ChatGLM3实现本地知识库问答。☆39Updated last year