opensourceteams / google-sdk-speech-to-text
google 语音转文字
☆250Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for google-sdk-speech-to-text
- Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)☆310Updated 5 years ago
- 桌面字幕——实时语音识别。☆92Updated 5 years ago
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆472Updated 8 months ago
- 功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕☆119Updated 2 years ago
- 中文语音识别☆803Updated 6 years ago
- 使用 spleeter 将视频中 的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆145Updated 3 years ago
- 跨平台基于云平台(阿里云、讯飞等)语音合成 API 的文字转语音助手。支持单文本快速合成和批量合成。支持windows、macOS、Linux。☆285Updated last week
- InterviewSecretary, transforming speech audio into text. 语音转录软件,用于音频文件转成文本文字.☆22Updated 7 years ago
- 语音api示例☆690Updated 3 months ago
- 💻桌面字幕——实时语音翻译📢 实时语音识别的效果不错,可以用于在线小语种教学视频。☆47Updated last year
- XMind 以及 Processon 思维导图转Markdown文本☆36Updated 3 years ago
- Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集,3200个说话人,900小时语音,1300万字。☆601Updated 4 years ago
- 微软 tts 文本转语音 音频下载☆866Updated 4 months ago
- Python批量转换 视频 为 音频MP3(即提取音频文件)☆57Updated 6 years ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆62Updated last year
- 语音技术:文字转语音☆43Updated last year
- 以 node 为主要工具,通过百度翻译 API,批量翻译外文 pdf 文件,并提取摘要、关键词、结论等关键信息,助力科研工作。☆31Updated 3 years ago
- 语音数据集制作标记工具☆131Updated 2 years ago
- 一个使用 PaddleSpeech 和 Streamlit 开发的中文语音识别与转写工 具,可以将 MP3 格式的录音文件转换为带标点的文字。☆14Updated last year
- 半佛风格视频生成器☆183Updated 3 years ago
- 实时语音识别API WebSocket☆110Updated 4 months ago
- 可以将word(doc、docx)、excel、pdf、ppt、csv、txt文件的文本内容提取出来,同时能够提取出word、pdf文件的目录☆68Updated 2 years ago
- 字幕朗读,由字幕或文本生成语音 | Subtitle reading, generate audio from subtitles or text☆84Updated 2 years ago
- tacotronV2 + wavernn 实现中文语音合成(Tensorflow + pytorch)☆525Updated last year
- 证件照背景颜色替换;输入一张证件照,指定背景颜色,运行程序,自动替换证件照底色。☆45Updated 3 years ago
- java sdk for Edge Read Aloud☆44Updated last week
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆622Updated this week
- wukong-robot项目是由github网友wzpan等开发并维护的一个开源中文语音对话机器人项目,能够让感兴趣的开发者快速打造个性化的智能音箱。 模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件 - 中文…☆51Updated 3 years ago
- ivideo 是一款轻量、强大、好用的视频处理软件。可以满足普通人一般的视频处理需求:压缩视频、转码视频、倒放视频、合并片段、根据字幕裁切片段、自动配字幕、自动剪辑……☆106Updated 2 years ago
- 人声背景声分离☆13Updated 4 years ago