Renovamen / Speech-and-Text
Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)
☆312Updated 5 years ago
Alternatives and similar repositories for Speech-and-Text:
Users that are interested in Speech-and-Text are comparing it to the libraries listed below
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆482Updated last month
- Python使用科大讯飞语音识别、语音合成☆132Updated 7 years ago
- google 语音转文字☆252Updated 5 years ago
- 中文语音识别☆815Updated 6 years ago
- 基于Real-Time-Voice-Cloning语音克隆中文普通话实现☆214Updated 4 years ago
- 语音技术:文字转语音☆42Updated last year
- 基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。☆702Updated last month
- 功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕☆119Updated 2 years ago
- tacotronV2 + wavernn 实现中文语音合成(Tensorflow + pytorch)☆533Updated last year
- To process/edit video and audio with Python+FFmpeg. [简单实用] 基于Python+FFmpeg的视频和音频的处理/剪辑。☆227Updated 4 years ago
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆633Updated 3 weeks ago
- python+百度语音识别API, 读取视频文件,将视频中的语音转换成文字输出☆25Updated 4 years ago
- 语音识别理论、论文和PPT☆589Updated 5 months ago
- 中文语音识别; Mandarin Automatic Speech Recognition;☆1,906Updated 6 months ago
- Chinese Speech To Text Using Wavenet☆161Updated last year
- 端到端中文语音识别☆87Updated 6 months ago
- ☆21Updated 5 years ago
- Jarvis:An intelligent assistant based voice control on Mac OS.中文版贾维斯Jarvis语音助手(电脑版Siri)☆70Updated 3 years ago
- An Automatic Speech Recognition Frame ,一个中文语音识别的完整框架, 提供了多个模型☆246Updated 4 years ago
- Python开发的图片批量处理工具,可以为图片添加文字水印、图片水印,也可以对图片批量重命名☆30Updated 6 years ago
- Python调用ffmpeg开源视频处理库,来实现视频批量的处理:水印、背景音乐、剪辑、合并、帧率、速率、分辨率等操作☆112Updated 4 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆270Updated 6 years ago
- 一个基于最新版本TensorFlow的Char RNN实现。可以实现生成英文、写诗、歌词、小说、生成代码、生成日文等功能。☆172Updated 6 years ago
- 非官方的科大讯飞语音合成(用于朗读,配音场景)python API (基于官方demo增加了:超过2000字上限自动分割再合并音频的功能)☆15Updated 10 months ago
- 一个执着于让CPU\端侧-Model逼近GPU-Model性能的项目,CPU上的实时率(RTF) 小于0.1☆469Updated 4 months ago
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆150Updated 3 years ago
- 中文聊天机器人,基于10万组对白训练而成,采用注意力机制,对一般问题都会生成一个有意义的答复。已上传模型,可直接运行。☆326Updated last year
- transformer的 encoder-decoder结构基于tensorflow实现的中文语音识别项目☆34Updated 3 years ago
- Chinese Text-to-Speech web service☆309Updated 3 years ago
- Python3智能语音助手☆25Updated 4 years ago