Renovamen / Speech-and-TextLinks
Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)
☆328Updated 6 years ago
Alternatives and similar repositories for Speech-and-Text
Users that are interested in Speech-and-Text are comparing it to the libraries listed below
Sorting:
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆496Updated 7 months ago
- ASRT语音识别系统的Python版SDK☆52Updated 3 years ago
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆682Updated 3 weeks ago
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆169Updated last year
- Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集,3200个说话人,900小时语音,1300万字。☆661Updated 5 years ago
- 基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。☆735Updated 6 months ago
- Python使用科大讯飞语音识别、语音合成☆133Updated 8 years ago
- 使用python进行语音识别☆159Updated 3 years ago
- 中文语音识别☆843Updated 7 years ago
- An Automatic Speech Recognition Frame ,一个中文语音识别的完整框架, 提供了多个模型☆247Updated 4 years ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆270Updated 3 weeks ago
- google 语音转文字☆266Updated 6 years ago
- 基于Real-Time-Voice-Cloning语音克隆中文普通话实现☆219Updated 5 years ago
- 功能: 使用阿里云智能语音 服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕☆129Updated 3 years ago
- python+百度语音识别API, 读取视频文件,将视频中的语音转换成文字输出☆25Updated 4 years ago
- 中文语音识别; Mandarin Automatic Speech Recognition;☆1,949Updated 11 months ago
- A demo of zh/Chinese Text to Speech system run on CPU in real time. 中文实时语音合成系统Demo☆179Updated 3 years ago
- 基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型☆860Updated 3 weeks ago
- 语音识别理论、论文和PPT☆610Updated 10 months ago
- 使用Tensorflow实现声纹识别☆314Updated last year
- To process/edit video and audio with Python+FFmpeg. [简单实用] 基于Python+FFmpeg的视频和音频的处理/剪辑。☆230Updated 5 years ago
- 端到端中文语音识别☆90Updated 11 months ago
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆153Updated 4 years ago
- 桌面字幕——实时语音识别。☆97Updated 6 years ago
- 专门面向中文用户的机器学习相关的学习资料大集合☆150Updated 4 years ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆79Updated 6 months ago
- Python调用ffmpeg开源视频处理库,来实现视频批量的处理:水印、背景音乐、剪辑、合并、帧率、速率、分辨率等操作☆114Updated 5 years ago
- 语音数据集制作标记工具☆134Updated 2 years ago
- tacotronV2 + wavernn 实现中文语音合成(Tensorflow + pytorch)☆535Updated 2 years ago
- “alibabacloud-nls-python-sdk提供使用阿里云智能语音服务的能力,包括语音识别、语音合成、文件转写等。”☆60Updated last month