mtz1992 / spleeterLinks
人声背景声分离
☆13Updated 5 years ago
Alternatives and similar repositories for spleeter
Users that are interested in spleeter are comparing it to the libraries listed below
Sorting:
- Spleeter C++动态库可执行文件实现音乐人声伴奏分离☆25Updated 2 years ago
- 100行代码实现简单音乐卡点☆27Updated 5 years ago
- 语音技术:文字转语音☆46Updated 2 years ago
- 语音数据集制作标记工具☆136Updated 2 years ago
- 基于TensorFlow实现RNN-LSTM 自动生成mid编曲☆12Updated 6 years ago
- 一个简单的小网页,录入人声哼唱,转化成钢琴音及钢琴谱输出。灵感稍纵即逝,本项目的目标是能够记录下一段小调,以音频形式输入,读取识别其曲调,并制成谱子,最终以钢琴弹奏的形式输出,依此将一些日常生活中的小灵感保存起来,以便日后回忆甚至再创作。☆85Updated 4 years ago
- 对音频文件的处理:音频信息,读取内容,获取时长,切割音频,pcm与wav互转☆38Updated 6 years ago
- 基于Real-Time-Voice-Cloning语音克隆中文普通话实现☆219Updated 5 years ago
- ☆11Updated last year
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆170Updated last year
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆155Updated 4 years ago
- 基于uvr5的歌唱人声分离☆27Updated 2 years ago
- 支持各种感情的男女声音,支持实时和离线文本合成tts语音;支持单模特声音变声,语音速率调整,语音音量大小调整;支持自定义语音模型。☆67Updated last year
- google 语音转文字☆271Updated 6 years ago
- python+百度语音识别API, 读取视频文件,将视频中的语音转换成文字输出☆25Updated 5 years ago
- A demo of zh/Chinese Text to Speech system run on CPU in real time. 中文实时语音合成系统Demo☆180Updated 3 years ago
- AI 音乐 - compound-word-transformer,用 Tensorflow 实现☆143Updated 2 years ago
- Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)☆335Updated 6 years ago
- vits chinese, tts chinese, tts mandarin 史上训练最简单,音质最好的语音合成系统☆218Updated 4 months ago
- 桌面字幕——实时语音识别。☆104Updated 6 years ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆289Updated 4 months ago
- A fast Text-to-Speech (TTS) model. Work well for English, Mandarin/Chinese, Japanese, Korean, Russian and Tibetan (so far). 快速语音合成模型,适用…☆275Updated 2 years ago
- 一个快速制作语音数据集的可视化工具☆195Updated last year
- 适配windows的requirements.txt,加了个长文本分段推理和手机听书的api,非本专业,屎山代码☆37Updated last year
- (存档) 使用Python、OpenCV、FFmpeg,自动识别电影剪辑、分析剪辑主题颜色☆125Updated 7 years ago
- 视频工厂设计图制作框架:10行代码实现对图片/视频等素材的特效、转场、剪辑、合成等形式的加工,生产出炫酷影集和广告视频☆36Updated 5 years ago
- 功能: 使用阿里云智能语音服务中的录音文件识别 API,实现将视频 、音频文件转写出 srt 字幕☆131Updated 3 years ago
- 放一些博客需要用到的文件☆26Updated 4 years ago
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆504Updated 10 months ago
- Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集,3200个说话人,900小时语音,1300万字。☆696Updated 5 years ago