Airmomo / tpo-llm-webui

TPO 是一个优化 LLM 输出文本的框架,通过迭代反馈和优化提示的方式来“微调模型”,而非直接调整模型的参数,使模型在推理过程中与人类偏好对齐以生成更好的结果。本项目提供了一个友好的 WebUI 来加载模型,实时优化基础模型并展示最佳结果。
10Updated last month

Alternatives and similar repositories for tpo-llm-webui:

Users that are interested in tpo-llm-webui are comparing it to the libraries listed below