FunnySaltyFish / bilibili_comments_crawlLinks
基于 B 站评论区数据构建大语言模型训练用对话数据集
☆47Updated 5 months ago
Alternatives and similar repositories for bilibili_comments_crawl
Users that are interested in bilibili_comments_crawl are comparing it to the libraries listed below
Sorting:
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆201Updated last month
- 从小说中提取对话数据集☆193Updated 11 months ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆88Updated last year
- ☆29Updated 8 months ago
- 用于汇总目前的开源中文对话数据集☆159Updated 2 years ago
- Train an LLM LoRA using a specific dataset to enable the LLM to continue stories in a specific style based on the plot and background.通过特…☆41Updated 8 months ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆412Updated last week
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆130Updated 9 months ago
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆203Updated last year
- Retriever-0.1B☆90Updated last year
- 😊书生·浦语 (InternLM) 开源大语言模型第一期课程笔记😊 + 🍏Horowag Model Development🍎☆41Updated last year
- Alpaca Chinese Dataset -- 中文指令微调数据集☆205Updated 8 months ago
- LLaMA-Factory使用经验记录☆34Updated 9 months ago
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆675Updated 2 weeks ago
- 中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微…☆202Updated last year
- A Chinese medical ChatGPT based on LLaMa, training from large-scale pretrain corpus and multi-turn dialogue dataset.☆359Updated last year
- Deepspeed、LLM、Medical_Dialogue、医疗大模型、预训练、微调☆270Updated last year
- 对llama3进行全参微调、lora微调以及qlora微调。☆197Updated 8 months ago
- MCM(Multimodal Chinese Medical LLM)多模态中医问诊大模型☆111Updated 11 months ago
- 从0到1构建一个MiniLLM (pretrain+sft+dpo实践中)☆439Updated 2 months ago
- 基于自回归模型与现有的开源大模型,训练小说大模型☆35Updated last year
- llm-medical-data:用于大模型微调训练的医疗数据集☆111Updated 2 years ago
- 💼法律AI助手,法律RAG,通过全部200+本法律手册📖、网页搜索内容💻结合LLM回答你的问题,并且给出相应的法规和网站,基于⚡️ langchain,Gradio,openai,chroma,duckduckgo-search☆152Updated last year
- 基于大语言模型(LLM)和多智能体(Multi-Agent),探究AI写小说能力的边界☆279Updated 9 months ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆552Updated 10 months ago
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆462Updated 5 months ago
- 大语言模型应用:RAG、NL2SQL、聊天机器人、预训练、MOE混合专家模型、微调训练、强化学习、天池数据竞赛☆62Updated 3 months ago
- ☆92Updated 3 months ago
- 学习ChatGLM3模型和LangChain框架的架构与核心功能,并基于LangChain+ChatGLM3实现本地知识库问答。☆38Updated last year
- 想要从零开始训练一个中文的mini大语言模型,可以进行基本的对话,模型大小根据手头的机器决定☆59Updated 9 months ago