CanvaChen / llm-dataset-chinese-poetry
目标:整理一份高质量的大模型古诗词数据集,涵盖先秦到现代
☆99Updated last year
Alternatives and similar repositories for llm-dataset-chinese-poetry
Users that are interested in llm-dataset-chinese-poetry are comparing it to the libraries listed below
Sorting:
- 文本去重☆71Updated 11 months ago
- GTS Engine: A powerful NLU Training System。GTS引擎(GTS-Engine)是一款开箱即用且性能强大的自然语言理解引擎,聚焦于小样本任务,能够仅用小样本就能自动化生产NLP模型。☆91Updated 2 years ago
- 国内首个全参数训练的法律大模型 HanFei-1.0 (韩非)☆116Updated last year
- CamelBell(驼铃) is be a Chinese Language Tuning project based on LoRA. CamelBell is belongs to Project Luotuo(骆驼), an open sourced Chinese-…☆174Updated last year
- ChatGLM-6B fine-tuning.☆135Updated 2 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated last year
- chatglm-6b微调/LORA/PPO/推理, 样本为自动生成的整数/小数加减乘除运算, 可gpu/cpu☆164Updated last year
- 渊 - A project for Classical Chinese☆104Updated 3 years ago
- pCLUE: 1000000+多任务提示学习数据集☆493Updated 2 years ago
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated last year
- Llama2开源模型中文版-全方位测评,基于SuperCLUE的OPEN基准 | Llama2 Chinese evaluation with SuperCLUE☆126Updated last year
- Baichuan-13B 指令微调☆90Updated last year
- "桃李“: 国际中文教育大模型☆178Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- Baichuan2代码的逐行解析版本,适合小白☆213Updated last year
- llama inference for tencentpretrain☆98Updated last year
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆107Updated last year
- SuperCLUE琅琊榜:中文通用大模型匿名对战评价基准☆145Updated 10 months ago
- Firefly中文LLaMA-2大模型,支持增量预训练Baichuan2、Llama2、Llama、Falcon、Qwen、Baichuan、InternLM、Bloom等大模型☆411Updated last year
- Alpaca Chinese Dataset -- 中文指令微调数据集☆200Updated 7 months ago
- 用于大模型 RLHF 进行人工数据标注排序的工具。A tool for manual response data annotation sorting in RLHF stage.☆250Updated last year
- Kanchil(鼷鹿)是世界上最小的偶蹄目动物,这个开源项目意在探索小模型(6B以下)是否也能具备和人类偏好对齐的能力。☆113Updated 2 years ago
- 中文聊天小模型,用t5 base在大量数据上有监督。☆101Updated last year
- deep learning☆149Updated last week
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆121Updated last year
- SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding☆223Updated last year
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆57Updated last year
- ☆308Updated 2 years ago
- 在中文开源大模型的基础上进行定制化的微调,拥有自己专属的语言模型。☆47Updated last year
- A Python Package to Access World-Class Generative Models☆127Updated 11 months ago