wxxhub / Offline_speech_synthesis
离线语音合成
☆34Updated last year
Alternatives and similar repositories for Offline_speech_synthesis:
Users that are interested in Offline_speech_synthesis are comparing it to the libraries listed below
- 一个简单的语音助手框架实现,唤醒词为:“嘿 小二”。(rasa以及自训练的部分遗失了,在框架上适配了对开放平台接口的调用,可根据本地训练的模型对robot中对应功能进行扩展、替换)☆23Updated 5 years ago
- 超快的中文普通话TTS☆117Updated 3 years ago
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆159Updated 10 months ago
- Parallel TTS web demo based on Flask + Vue (Vuetify). 基于 Flask + Vue 的语音合成单网页演示项目。☆46Updated 3 years ago
- A demo of zh/Chinese Text to Speech system run on CPU in real time. 中文实时语音合成系统Demo☆176Updated 2 years ago
- 基于傅里叶变换的降噪与基于深度学习的语音识别的多功能系统☆11Updated last year
- 语音合成工具箱,Text To Speech Toolkit,多种音色可供选择的语音合成工具。☆22Updated 3 years ago
- 声纹识别(Voiceprint Recognition, VPR),也称为说话人识别(Speaker Recognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)☆55Updated 4 years ago
- 利用OpenCV,Face_recognition实现证件照自动人脸扶正、裁剪尺寸、背景更换☆34Updated 6 years ago
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆46Updated last year
- 基于双门限识别的语音端点检测系统☆24Updated 7 years ago
- 端到端中文语音识别☆87Updated 6 months ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- 使用python进行语音识别☆145Updated 3 years ago
- TTS(Text to speech) GUI using Baidu TTS api, currently only support Chinese; 将文字转换为语音mp3文件,自动拆分较长文本文件,适合用于生成有声小说☆46Updated 6 years ago
- 视频工厂设计图制作框架:10行代码实现对图片/视频等素材的特效、转场、剪辑、合成等形式的加工,生产出炫酷影集和广告视频☆36Updated 4 years ago
- 基于uvr5的歌唱人声分离☆25Updated 2 years ago
- 一个简单的音频降噪工具,提高web UI界面和api接口☆19Updated 3 months ago
- 基于Kersa实现的声纹识别模型☆137Updated 5 months ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆67Updated last month
- 支持各种感情的男女声音,支持实时和离线文本合成tts语音;支持单模特声音变声,语音速率调整,语音音量大小调整;支持自定义语音模型。☆58Updated 10 months ago
- 桌面字幕——实时语音识别。☆92Updated 6 years ago
- “直书”—基于华为HMS Core ML Kit的人工智能趣学汉字小程序。 搭载拍照识别、语音识别、AI翻译、语音生成等人工智能黑科技,外国人也可轻松上手,即查即用, 一站式掌握汉字音、形、写、义。☆112Updated last year
- 【中文语音识别 】【验证码识别】☆119Updated last year
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆253Updated this week
- 人脸识别、图像文字识别☆45Updated 5 years ago
- A cross platform implementation of Text-to-Speech based on ONNXRuntime.☆32Updated last year
- 这个工程的目的是从视频中获取语音识别的训练数据,用于训练字幕自动生成☆53Updated 6 years ago
- A fast Text-to-Speech (TTS) model. Work well for English, Mandarin/Chinese, Japanese, Korean, Russian and Tibetan (so far). 快速语音合成模型,适用…☆256Updated last year
- 本项目是基于Pytorch的语音合成项目,使用的是VITS,VITS是一种语音合成方法,这种时端到端的模型使用起来非常简单,不需要文本对齐等太复杂的流程,直接一键训练和生成,大大降低了学习门槛。☆45Updated 5 months ago