IS2AI / MultilingualASRLinks

☆13

Alternatives and similar repositories for MultilingualASR

Users that are interested in MultilingualASR are comparing it to the libraries listed below

Sorting:

IS2AI / Uzbek_ASR
☆11Updated 3 years ago
IS2AI / Kazakh_ASR
☆13Updated 2 years ago
Bartelds / ctc-dro
Code associated with the paper: CTC-DRO: Robust Optimization for Reducing Language Disparities in Speech Recognition.
☆15Updated last month
just-ai / speechflow
☆26Updated 3 weeks ago
JacobLinCool / MPSENet
Python package of MP-SENet from Explicit Estimation of Magnitude and Phase Spectra in Parallel for High-Quality Speech Enhancement.
☆13Updated 7 months ago
shigabeev / russian_tts_normalization
Normalize Text in Russian
☆27Updated last year
egorsmkv / asr-corpus-creator
This app is intended to automatically create a corpus for ASR systems using pseudo-labeling.
☆27Updated last year
alxmamaev / ultimate_tts
☆13Updated 3 years ago
saarus72 / text_normalization
T5-based (russian) text normalization
☆21Updated last year
leohuang2013 / pyannote-audio_overlapped-speech-detection_cpp
C++ version of pyannote audio overlapped speech detection pipeline
☆13Updated last year
suralmasha / RuTranscript
Russian phonetical transcription
☆10Updated last year
BUTSpeechFIT / OOV-recovery-in-hybrid-ASR-system
☆9Updated 5 years ago
IS2AI / ISSAI_SAIDA_Kazakh_ASR
the first industrial-scale open-source Kazakh speech corpus. KSC2 corpus subsumes the previously introduced two corpora: KSC and KazakhTT…
☆50Updated 3 years ago
Lesha17 / Punctuation
Training BERT for punctuation task
☆10Updated 4 years ago
ArenAcikgoz / Whisper-Alignment
Forced alignment decoder for Whisper.
☆14Updated last year
ashi-ta / speechGLUE
SpeechGLUE is a speech version of the GLUE benchmark, driven by text-to-speech.
☆13Updated 2 years ago
sushant-t / tts-trainer
Generate audio datasets for training Text-To-Speech models, through smart audio splitting with silence detection, and transcription using…
☆28Updated 2 years ago
frankyoujian / Edge-Punct-Casing
☆28Updated 4 months ago
ahmedshah1494 / speech_robust_bench
☆15Updated 2 months ago
robflynnyh / long-context-asr
Code for the paper: How Much Context Does My Attention-Based ASR System Need?
☆10Updated last month
ictnlp / MonoAttn-Transducer
Code for ICML25 Paper "Overcoming Non-monotonicity in Transducer-based Streaming Generation"
☆11Updated last month
kotikkonstantin / ru-autopunctuation
Punctuation and casing restoration for the Russian Language (BERT-based)
☆22Updated 3 years ago
AkshathRaghav / tinyspeech
Code release for "TinySpeech: Attention Condensers for Deep Speech Recognition Neural Networks on Edge Devices"
☆19Updated 2 weeks ago
chaufanglin / Normal2Whisper
Implementation of "Improving Whispered Speech Recognition Performance using Pseudo-whispered based Data Augmentation"
☆10Updated 7 months ago
cuhealthybrains / MT-LLM
The implementation for "Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions"
☆42Updated 2 months ago
titu1994 / warprnnt_numba
WarpRNNT loss ported in Numba CPU/CUDA for Pytorch
☆17Updated 3 years ago
besacier / ASR2022
☆56Updated 2 years ago
bshall / dusted
DUSTED: Spoken-Term Discovery using Discrete Speech Units
☆17Updated 8 months ago
D-Keqi / LS-Transducer-SST
☆11Updated last year
JSALT2022CodeSwitchingASR / generating-code-switched-audio
☆12Updated 4 months ago