xdcesc / my_ch_speech_recognition
使用python进行语音识别
☆153Updated 3 years ago
Alternatives and similar repositories for my_ch_speech_recognition:
Users that are interested in my_ch_speech_recognition are comparing it to the libraries listed below
- 利用Python+TensorFlow实现语音识别☆48Updated 6 years ago
- 端到端中文语音识别☆88Updated 9 months ago
- 基于Pytorch实现的语音情感识别☆191Updated last month
- ASR中文语音识别☆33Updated 5 years ago
- 说话人识别(声纹识别)算法的Python实现。包括GMM(已完成)、GMM-UBM、ivector、基于深度学习的声纹识别(self-attention已完成)。☆95Updated 2 years ago
- 语音识别理论、论文和PPT☆604Updated 8 months ago
- 基于卷积神经网络的语音识别声学模型的研究☆173Updated 5 years ago
- 基于深度学习的普通话语音识别☆18Updated 6 years ago
- 语音感情识别☆35Updated last month
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆666Updated last week
- 用CASIA database数据集做的,做的语音情感识别和语音识人的练习☆66Updated 2 years ago
- Acoustic feature extraction using Librosa library and openSMILE toolkit.使用Librosa音频处理库和openSMILE工具包,进行简单的声 学特征提取☆198Updated 4 years ago
- transformer的 encoder-decoder结构基于tensorflow实现的中文语音识别项目☆33Updated 4 years ago
- 语音识别 MFCCs特征处理 cnn神经网络☆99Updated 6 years ago
- 中文语音识别☆830Updated 6 years ago
- ☆16Updated 6 years ago
- 这个项目将 RAVDESS 数据集切割成 1s 短语 音,利用 openSMILE+CNN 进行训练,目标是将短语音分类到四种情感中,分别是:开心(happy)、悲伤(sad)、生气(angry)和中性(neutral)。最后准确率达到 76% 左右。☆57Updated 3 years ago
- An Automatic Speech Recognition Frame ,一个中文语音识别的完整框架, 提供了多个模型☆246Updated 4 years ago
- Audio Split 基于双门限法的语音端点检测及语音分割☆132Updated 4 years ago
- 基于Tensorflow实现声音分类,博客地址:☆101Updated 4 years ago
- 基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。☆728Updated 4 months ago
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆162Updated last year
- 使用Tensorflow实现声纹识别☆309Updated 10 months ago
- Listen, attend and spell Model and a Chinese Mandarin Pretrained model (中文-普通话 ASR模型)☆123Updated last year
- 1. ctc的DCNN声学模型+语言模型和 transformer的端到端模型☆8Updated 2 years ago
- 基于深度学习的语音增强、去混响☆91Updated last year
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆266Updated last week
- 基于PaddlePaddle实现的音频分类,支持EcapaTdnn、PANNS、TDNN、Res2Net、ResNetSE等各种模型,还有多种预处理方法☆94Updated last month
- 基于Kersa实现的声纹识别模型☆140Updated 7 months ago
- 一个执着于让CPU\端侧-Model逼近GPU-Model性能的项目,CPU上的实时率(RTF)小于0.1☆473Updated last month