Anionex / MiniCPM-o-2.6-int4_Windows_x64_cudaLinks
(整合包Integrated package)一键使用面壁智能最新的MiniCPM-o 2.6多模态模型,用于视频对话、语音对话和文字对话。|Use Modelbest's  latest MiniCPM-o 2.6 multi-modal model with one click for video conversations, voice conversations and text conversations within 8g vram.
☆13Updated 3 months ago
Alternatives and similar repositories for MiniCPM-o-2.6-int4_Windows_x64_cuda
Users that are interested in MiniCPM-o-2.6-int4_Windows_x64_cuda are comparing it to the libraries listed below
Sorting:
- FastAPI Server Implementation for Bilibili Index TTS☆25Updated 6 months ago
 - 实时STT,连接OpenAI接口/智谱AI(流式LLM)和GPT-SOVITS/Edge-TTS,通过网页的方式,进行跨网络的服务调用,实现实时对话的效果☆421Updated 10 months ago
 - An common framework for voice and text interactions with LLMs☆97Updated 11 months ago
 - ☆58Updated 10 months ago
 - 低成本的简单基于live2d TTS文字转语音和大模型聊天的直播解决方案☆268Updated last year
 - 一个用于CosyVoice的api接口项目☆317Updated 2 months ago
 - AI导演课☆124Updated 5 months ago
 - 一个语音识别项目☆49Updated 5 months ago
 - 适用于 GPT-SoVITS 的api调用接口☆313Updated last year
 - 这是一个 ChatTTS 音频仓库,包含用不同 seed 生成的不同音色,你可以方便地挑选你喜欢的 seed。☆52Updated last year
 - 鬼畜视频配音字幕同步项目,基于字幕文件srt同步接入TTS,支持GPT-Sovits ChatTTS BertVits2☆46Updated last year
 - GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆182Updated 2 weeks ago
 - 10000 chatTTS voices !chatTTS 音色库,再也不为音色抽卡烦恼啦。这是我第一个项目,熬夜龟速生产10000条音色并上传Github,给点鼓励呗哈!主域名:https://www.TTSlist.com 备用:http://ttslist.aiqb…☆198Updated last year
 - 文本语料转训练集工具,txt转dataset☆94Updated last year
 - 在DH_live项目基础上修改,添加webui界面☆71Updated 6 months ago
 - PyQt6 1st try☆286Updated 9 months ago
 - A Bob plugin that calls self-deployed Cosyvoice service to achieve TTS.☆39Updated last year
 - 基于 faster-whisper 的伪实时语音转写服务☆230Updated 6 months ago
 - 一个用于F5-TTS的api和webui项目☆64Updated 10 months ago
 - The fastest digital human algorithm, now on your desktop.☆555Updated last month
 - 使用 FastAPI、Streamlit本地部署ChatTTS文本转语音模型,并通过 Docker Compose 进行容器化部署。☆27Updated last year
 - CosyVoice2 功能扩充(预训练音色推理/3s极速复刻/自然语言控制/自动识别/音色模型保存/API)☆171Updated 7 months ago
 - GraphRAG-Ollama-UI + GraphRAG4OpenWebUI 融合版(有gradio webui配置生成RAG索引,有fastapi提供RAG API服务)☆104Updated last year
 - Sample GLM4V + ChatTTS AI assistant☆85Updated last year
 - ☆145Updated last year
 - 这个工具利用Ollama的多个视觉模型,高效地对图片进行打标,并通过AI进行润色优化。如果你觉得对大量图片进行打标是一件繁琐的事情,那么这个工具就是为你量身打造的。 主要特点: 多模型打标:利用各种开源模型,同时对图片进行打标。 AI润色:自动优化和润色已打标的图片。 成…☆67Updated last year
 - 基于中文文本情绪分析自动切换参考音频的 GPT-SoVITS 推理 Demo☆106Updated last year
 - MaskGCT-Windows For Windows Users☆66Updated 5 months ago
 - LLM voice chat project by Connect ChatTTS with Local Ollama, 连接本地部署的 Ollama 和 ChatTTS,实现和LLM的语音对话☆64Updated last year
 - CosyVoice在Windows环境下使用的版本☆740Updated 11 months ago