Miraclemarvel55 / ChatGLM-RLHFLinks
对ChatGLM直接使用RLHF提升或降低目标输出概率|Modify ChatGLM output with only RLHF
☆195Updated 2 years ago
Alternatives and similar repositories for ChatGLM-RLHF
Users that are interested in ChatGLM-RLHF are comparing it to the libraries listed below
Sorting:
- Implementation of Chinese ChatGPT☆287Updated last year
- alpaca中文指令微调数据集☆395Updated 2 years ago
- chatglm-6b微调/LORA/PPO/推理, 样本为自动生成的整数/小数加减乘除运算, 可gpu/cpu☆164Updated 2 years ago
- ChatGLM2-6B 全参数微调,支持多轮对话的高效微调。☆400Updated 2 years ago
- 用于大模型 RLHF 进行人工数据标注排序的工具。A tool for manual response data annotation sorting in RLHF stage.☆254Updated 2 years ago
- 一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测,低参数量及全参数模型训练(预训练、SFT、RM、PPO、DPO)和融合、量化。