Renovamen / Speech-and-TextLinks
Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)
☆328Updated 6 years ago
Alternatives and similar repositories for Speech-and-Text
Users that are interested in Speech-and-Text are comparing it to the libraries listed below
Sorting:
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆496Updated 6 months ago
- Python使用科大讯飞语音识别、语音合成☆132Updated 8 years ago
- 语音技术:文字转语音☆45Updated 2 years ago
- google 语音转文字☆265Updated 6 years ago
- 基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。☆735Updated 6 months ago
- python+百度 语音识别API, 读取视频文件,将视频中的语音转换成文字输出☆25Updated 4 years ago
- (存档) 使用Python、OpenCV、FFmpeg,自动识别电影剪辑、分析剪辑主题颜色☆122Updated 7 years ago
- 基于Real-Time-Voice-Cloning语音克隆中文普通话实现☆219Updated 5 years ago
- Python调用ffmpeg开源视频处理库,来实现视频批量的处理:水印、背景音乐、剪辑、合并、帧率、速率、分辨率等操作☆114Updated 5 years ago
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆683Updated 2 weeks ago
- To process/edit video and audio with Python+FFmpeg. [简单实用] 基于Python+FFmpeg的视频和音频的处理/剪辑。☆230Updated 5 years ago
- 视频转帧、帧转图片、图片转文字,文字语义分析,辅助视频打标签☆36Updated 6 years ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆79Updated 5 months ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆267Updated 2 weeks ago
- 💠 单词智能复习项目 - 艾宾浩斯遗忘曲线 + 混淆词☆71Updated 6 years ago
- 文本生成,可用于作诗、写小说☆129Updated 6 years ago
- 【仅作为交流学习使用】机器智能--相关书目及经典论文包括AutoML、情感分类、语音识别、声纹识别、语音合成实验代码等☆91Updated 5 years ago
- wukong-robot项目是由github网友wzpan等开发并维护的一个开源中文语音对话机器人项目,能够让感兴趣的开发者快速打造个性化的智能音箱。 模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件 - 中文…☆55Updated 4 years ago
- 功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕☆128Updated 3 years ago
- 基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型☆861Updated 2 weeks ago
- 中文语音识别☆842Updated 7 years ago
- Chinese Text-to-Speech web service☆309Updated 4 years ago
- Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集,3200个说话人,900小时语音,1300万字。☆660Updated 5 years ago
- tacotronV2 + wavernn 实现中文语音合成(Tensorflow + pytorch)☆535Updated 2 years ago
- 视频转文字☆80Updated 2 years ago
- 此python模块为ffmpeg命令行工具的一个包装。经过此模块处理的视频将采用h.264和aac(aac_he_v2)编码。此模块可以对视频进行: 视频添加水印、视频去除水印、视频截图、视频长度裁剪、视频生成gif、视频添加字幕和视频HLS切片等操作☆49Updated 4 years ago
- A demo of zh/Chinese Text to Speech system run on CPU in real time. 中文实时语音合成系统Demo☆179Updated 3 years ago
- 基于循环神经网 络(RNN)的智能聊天机器人系统☆45Updated 4 years ago
- transformer的 encoder-decoder结构基于tensorflow实现的中文语音识别项目☆33Updated 4 years ago
- Chinese Mandarin tts text-to-speech 中文 (普通话) 语音 合成 , by fastspeech 2 , implemented in pytorch, using waveglow as vocoder, with biaobei …☆477Updated 3 years ago