opensourceteams / google-sdk-speech-to-textLinks
google 语音转文字
☆272Updated 6 years ago
Alternatives and similar repositories for google-sdk-speech-to-text
Users that are interested in google-sdk-speech-to-text are comparing it to the libraries listed below
Sorting:
- Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)☆338Updated 6 years ago
- 桌面字幕——实时语音识别。☆106Updated 6 years ago
- 语音api示例☆709Updated last year
- 功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频、音频文件转写出 srt 字幕☆131Updated 3 years ago
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆156Updated 4 years ago
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆517Updated last month
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆80Updated 11 months ago
- Python批量转换 视频 为 音频MP3(即提取音频文件)☆64Updated 7 years ago
- 一个基于Java的粤语发音TTS,文字转语音.☆61Updated 5 years ago
- 证件照更换底色☆62Updated 2 years ago
- short video generate☆127Updated 3 years ago
- InterviewSecretary, transforming speech audio into text. 语音转录软件,用于音频文件转成文本文字.☆24Updated 8 years ago
- 跨平台基于云平台(阿里云、讯飞等)语音合成 API 的文字转语音助手。支持单文本快速合成和批量合成。支持windows、macOS、Linux。☆314Updated 3 weeks ago
- 证件照背景颜色替换;输入一张证件照,指定背景颜色,运行程序,自动替换证件照底色。☆50Updated 5 years ago
- pdf转word☆536Updated 3 years ago
- 半佛风格视频生成器☆193Updated 4 years ago
- “直书”—基于华为HMS Core ML Kit的人工智能趣学汉字小程序。 搭载拍照识别、语音识别、AI翻译、语音生成等人工智能黑科技,外国人也可轻松上手,即查即用,一站式掌握汉字音、形、写、义。☆114Updated 2 years ago
- Python调用ffmpeg开源视频处理库,来实现视频批量的处理:水印、背景音乐、剪辑、合并、帧率、速率、分辨率等操作☆117Updated 5 years ago
- 抖音短视频无水印下载工具,解析抖音视频,无水印下载App 最新方案 20241220 可用uc视频(无水印),西瓜视频下载☆219Updated 11 months ago
- 字幕朗读,由字幕或文本生成语音 | Subtitle reading, generate audio from subtitles or text☆91Updated 3 years ago
- 这是一个可以识别视频语音自动生成字幕SRT文件的开源命令行工具。☆402Updated 3 years ago
- 抖音,快手,小红书 ,91porn短视频爬虫 短视频剪辑去重工 具☆77Updated 3 years ago
- 爬虫脚本,目前支持抓取懂车帝车品牌、车型,汽车图片等; 简书30热搜、简书刷评论;拉勾教育专栏文章;mm131图片;影视资源站视频抓取。☆72Updated 2 years ago
- ☆93Updated last year
- 用 moviepy 把图片生成视频☆128Updated 4 years ago
- 整理开发中常用的各类API接口,当前有4大类:微信相关、数据及分析、开发专用、生活服务,如:天气预报、文档生成、身份证识别、代理IP等; 整理各种数据包,如:中华古诗词数据、词库、敏感词表、医学词表、四六级英汉词典数据等☆65Updated 6 years ago
- 微软 tts 文本转语音 音频下载☆923Updated 8 months ago
- Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集,3200个说话人,900小时语音,1300万字。☆709Updated 5 years ago
- To process/edit video and audio with Python+FFmpeg. [简单实用] 基于Python+FFmpeg的视频和音频的处理/剪辑。☆229Updated 5 years ago
- 最新动态在这里【我的程序员日志】☆214Updated 4 years ago