Renovamen / Speech-and-Text
Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)
☆318Updated 5 years ago
Alternatives and similar repositories for Speech-and-Text:
Users that are interested in Speech-and-Text are comparing it to the libraries listed below
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆491Updated 4 months ago
- 中文语音识别☆823Updated 6 years ago
- Python使用科大讯飞语音识别、语音合成☆134Updated 8 years ago
- google 语音转文字☆255Updated 5 years ago
- 基于Real-Time-Voice-Cloning语音克隆中文普通话实现☆216Updated 5 years ago
- Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集,3200个说话人,900小时语音,1300万字。☆628Updated 4 years ago
- python+百度语音识别API, 读取视频文件,将视频中的语音转换成文字输出☆26Updated 4 years ago
- 基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。☆724Updated 3 months ago
- Chinese Text-to-Speech web service☆309Updated 3 years ago
- 基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型☆850Updated 2 weeks ago
- Python调用ffmpeg开源视频处理库,来实现视频批量的处理:水印、背景音乐、剪辑、合并、帧率、速率、分辨率等操作☆113Updated 4 years ago
- To process/edit video and audio with Python+FFmpeg. [简单实用] 基于Python+FFmpeg的视频和音频的处理/剪辑。☆229Updated 5 years ago
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆655Updated 2 weeks ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆71Updated 3 months ago
- 语音技术:文字转语音☆43Updated 2 years ago
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆151Updated 4 years ago
- Chinese Mandarin tts text-to-speech 中文 (普通话) 语音 合成 , by fastspeech 2 , implemented in pytorch, using waveglow as vocoder, with biaobei …☆472Updated 2 years ago
- 中文语音识别; Mandarin Automatic Speech Recognition;☆1,920Updated 8 months ago
- ASRT语音识别系统的Python版SDK☆51Updated 2 years ago
- 端到端中文语音识别☆87Updated 8 months ago
- 专门面向中文用户的机器学习相关的学习资料大集合☆149Updated 4 years ago
- 功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕☆125Updated 3 years ago
- Jarvis:An intelligent assistant based voice control on Mac OS.中文版贾维斯Jarvis语音助手(电脑版Siri)☆72Updated 3 years ago
- moviepy 中文手册☆173Updated 5 years ago
- 这里是多媒体作业,通过关键帧以及ocr技术实现视频关键信息的提取☆9Updated 4 years ago
- 语音数据集制作标记工具☆133Updated 2 years ago
- 【中文语音识别 】【验证码识别】☆119Updated last year
- TTS(Text to speech) GUI using Baidu TTS api, currently only support Chinese; 将文字转换为语音mp3文件,自动拆分较长文本文件,适合用于生成有声小说☆47Updated 6 years ago
- transformer的 encoder-decoder结构基于tensorflow实现的中文语音识别项目☆33Updated 4 years ago
- 【仅作为交流学习使用】机器智能--相关书目及经典论文包括AutoML、情感分类、语音识别、声纹识别、语音合成实验代码等☆89Updated 5 years ago