zmeet-ai / asr_demo
语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译
☆55Updated last year
Related projects: ⓘ
- 基于中文文本情绪分析自动切换参考音频的 GPT-SoVITS 推理 Demo☆70Updated 6 months ago
- 支持各种感情的男女声音,支持实时和离线文本合成tts语音;支持单模特声音变声,语音速率调整,语音音量大小调整;支持自定义语音模型。☆52Updated 5 months ago
- ☆94Updated this week
- Bert-vits2-V2.3 训练和推理☆43Updated 6 months ago
- 【脱离复杂的环境配置和整合包,极简配置推理服务】从GPT-SoVITS项目里面提取出来的,纯粹的推理服务方案。☆178Updated 5 months ago
- ChatBilibili .基于Fastapi 和ChatGPT Embedding ,实时生成视频概要,检索上下文视频 提问/聊天☆29Updated last year
- ChatTTS HTTP API☆48Updated 3 months ago
- 一个用于CosyVoice的api接口项目☆53Updated 2 weeks ago
- ☆35Updated 9 months ago
- 10000 chatTTS voices !chatTTS 音色库,再也不为音色抽卡烦恼啦。这是我第一个项目,熬夜龟速生产10000条音色并上传Github,给点鼓励呗哈!主域名:https://www.TTSlist.com 备用:http://ttslist.aiqb…☆126Updated 2 months ago
- 阿里SenseVoice的fastpi封装,采用onnx发布,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆38Updated 2 weeks ago
- Sample Repository for the AlibabaCloud Bailian Speech SDK☆26Updated 2 weeks ago
- 张艺谋(国师)一键声音克隆和恶搞文本生成项目☆14Updated last year
- 实时STT,连接OpenAI接口/智谱AI(流式LLM)和GPT-SOVITS/Edge-TTS,通过网页的方式,进行跨网络的服务调用,实现实时对话的效果☆201Updated 2 months ago
- Bert-VITS2 onnx推理版本☆37Updated 4 months ago
- 中文标点符号模型,可以给文本添加标点符号。☆128Updated 6 months ago
- 适用于 GPT-SoVITS 的api调用接口☆174Updated 6 months ago
- WebUI build on SambertHifigan-TTS☆12Updated 8 months ago
- Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型☆136Updated 2 months ago
- 用 OCR 提取视频硬字幕☆56Updated last year
- 语音数据集制作标记工具☆131Updated last year
- 基于ChatGLM-6b+langchain实现本地化知识库检索与智能答案生成☆22Updated 11 months ago
- 通过此代码可以免训练模型并通过轻量级服务器定制数字人形象☆93Updated 5 months ago
- 使用 FastAPI、Streamlit本地部署ChatTTS文本转语音模型,并通过 Docker Compose 进行容器化部署。☆18Updated 2 months ago
- 一个使用 PaddleSpeech 和 Streamlit 开发的中文语音识别与转写工具,可以将 MP3 格式的录音文件转换为带标点的文字。☆12Updated last year
- 带HTTP API的数字人视频播放器,使用gradio api对接Easy-Wav2Lip、Sadtalker、GeneFacePlusPlus、MuseTalk,也可以用于播放本地视频☆119Updated last week
- Documentation for Bert-VITS2☆22Updated 9 months ago
- API and websocket server for sensevoice. It has inherited some enhanced features, such as VAD detection, real-time streaming recognition,…☆129Updated 2 weeks ago
- 本次开源为DL-B,是一个基于ChatGLM、Wav2Lip、So-VITS组建的数字形象方案。可以在此基础之上增加其他组件达到数字生命的效果。This open source is DL-B, which is a digital image scheme based o…☆105Updated last year
- 基于 faster-whisper 的伪实时语音转写服务☆161Updated last week