v3ucn / GPT-SoVITS-V2Links
GPT-SoVITS-V2模型,合并了官方的一些PR,包含但不限于:参考音频自动填充,字幕同步,SillyTavern酒馆接入等功能
☆180Updated 10 months ago
Alternatives and similar repositories for GPT-SoVITS-V2
Users that are interested in GPT-SoVITS-V2 are comparing it to the libraries listed below
Sorting:
- Subtitle dubbing with multiple TTS Engines☆215Updated last month
- Inference Specialization☆492Updated last year
- 基于GPT-SoVITS 的视频剪辑快捷配音工具☆171Updated last year
- GAG is a GUI for GPT-SoVITS inference. Just add it to the official integration package and run for a smoother experience.☆213Updated 5 months ago
- 集成主流开源大模型,实现不同类型大模型以及同类型大模型之间的协调合作。☆84Updated 8 months ago
- 本项目意图在于让使用各类语音合成引擎的方式变得统一,支持多种语音合成引擎适配器,允许直接作为模组使用或启动后端服务☆760Updated last year
- 一种基于Emotion2Vec的批量音频情感自动标注脚本☆473Updated 9 months ago
- 低成本的简单基于live2d TTS文字转语音和大模型聊天的直播解决方案☆270Updated last year
- A cli tool for split vocal timbre.☆263Updated 9 months ago
- 带有 WebUI 的 NovelAI 量产工具, 实现了批量文生图; 批量图生图; 视频转绘; 分块重绘; 批量 Vibe; 批量局部重绘; 批量超分降噪; 批量自动打码; 批量添加水印; 批量上传 Pixiv; 图片筛选; 批量抹除, 还原或导出生成信息; 法术解析; 多…☆369Updated last month
- 【脱离复杂的环境配置和整合包,极简配置推理服务】从GPT-SoVITS项目里面提取出来的,纯粹的推理服务方案。☆310Updated last year
- 一个开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。☆269Updated last week
- 一个超低延迟的基于GPT-SoVITS语音合成的语音交互系统☆177Updated this week
- 基于Faster-whisper和modelscope一键生成双语字幕,双语字幕生成器,基于离线大模型,Generate bilingual subtitles with one click based on Faster-whisper and modelscope. O…☆407Updated last year
- 适用于 GPT-SoVITS 的api调用接口☆322Updated last year
- vits2 backbone with bert☆338Updated last year
- GPT-SoVITS 参考音频推理效果批量试听☆52Updated last year
- CosyVoice在Windows环境下使用的版本☆746Updated last year
- Causallm14b大模型量化版本,基于DPO算法改进,无内容审查,无思想钢印,百无禁忌Webui☆204Updated last year
- AI桌宠2.2(网页端toklen白嫖国产大模型服务器(glm4,kimi,deepseekv2),语音识别,屏幕识别自动发送,live2d 2.0和3.0模型,gpt-sovits语音,coysvoice语音,edge-tts语音(支持多语言音色),本地ollama模型无…☆178Updated last year
- PyQt6 1st try☆291Updated 11 months ago
- 收集有关so-vits-svc、TTS、SD、LLMs的各种模型、应用以及文字、声音、图片、视频有关的model。☆197Updated 6 months ago
- BertVITS2前端界面☆302Updated last year
- 简单的聊天网页,适配思维链模型☆186Updated 8 months ago
- 一个高自由度的端到端的可定制AI-VTuber。支持对接哔哩哔哩直播间,以智谱API作为语言基座模型,拥有意图识别、长短期记忆(直接记忆和联想记忆),支持搭建认知库、歌曲作品库,接入了当前热门的一些语音转换、语音合成、图像生成、数字人驱动项目,并提供了一个便于操作的客户端 。☆435Updated last year
- 一个用于解析小说并通过TTS转换为语音的JavaFX软件(A novel parser and converter use TTS)☆140Updated 3 weeks ago
- SubFix: Efficient Web-Based Audio Subtitle Editing and Multilingual Automatic Annotation Tool.☆209Updated last year
- Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型☆184Updated last year
- 不会聊天的字幕提取器不是一个好 B 站下载器~☆86Updated last month
- 一个语音识别项目☆49Updated 6 months ago