SonyCSLParis / music2latentLinks

Encode and decode audio samples to/from compressed latent representations!

☆219

Alternatives and similar repositories for music2latent

Users that are interested in music2latent are comparing it to the libraries listed below

Sorting:

SonyCSLParis / pesto
Self-supervised learning for fast pitch estimation
☆244Updated 5 months ago
jhtonyKoo / music_mixing_style_transfer
☆172Updated last year
microsoft / fadtk
A simple library for Fréchet Audio Distance (FAD) calculation
☆226Updated 2 months ago
minzwon / musicfm
☆212Updated last year
aik2mlj / polyffusion
Polyffusion: A Diffusion Model for Polyphonic Score Generation with Internal and External Controls
☆82Updated last year
CPJKU / beat_this
Accurate and general beat tracker
☆171Updated last month
Harmonai-org / oobleck
open soundstream-ish VAE codecs for downstream neural audio synthesis
☆119Updated 2 years ago
gladia-research-group / multi-source-diffusion-models
☆163Updated last year
EmilianPostolache / stable-audio-controlnet
Fine-tune Stable Audio Open with DiT ControlNet.
☆238Updated 2 months ago
yukara-ikemiya / minimal-musicgen-for-developers
[PyTorch] Minimal codebase for MusicGen models
☆61Updated 6 months ago
archinetai / audio-diffusion-pytorch-trainer
Trainer for audio-diffusion-pytorch
☆129Updated 2 years ago
archinetai / audio-data-pytorch
A collection of useful audio datasets and transforms for PyTorch.
☆141Updated 2 years ago
crlandsc / tiny-audio-diffusion
A repository for generating and training short audio samples with unconditional waveform diffusion on accessible consumer hardware (<2GB …
☆174Updated last year
yukara-ikemiya / friendly-stable-audio-tools
Refactored / updated version of `stable-audio-tools` which is an open-source code for audio/music generative models originally by Stabili…
☆198Updated last year
PandoraMedia / music-audio-representations
Results and Models for Learning Audio Representations of Music Content
☆100Updated 7 months ago
gudgud96 / frechet-audio-distance
A lightweight library for Frechet Audio Distance calculation.
☆286Updated 10 months ago
affige / DeepMIR
Teaching material for the course "Deep Learning for Music Analysis and Generation" I taught at National Taiwan University (2023 Fall)
☆220Updated 7 months ago
iamycy / golf
A DDSP-based neural voice synthesiser.
☆120Updated 8 months ago
zhaojw1998 / Beat-Transformer
Codes for ISMIR 2022 paper: Beat Transformer: Demixed Beat and Downbeat Tracking with Dilated Self-Attention
☆110Updated last year
salu133445 / mmt
Official Implementation of "Multitrack Music Transformer" (ICASSP 2023)
☆147Updated last year
zelaki / DreamSound
[ICASSP'24] Investigating Personalization Methods in Text to Music Generation
☆39Updated last year
mulab-mir / song-describer-dataset
The Song Describer dataset is an evaluation dataset made of ~1.1k captions for 706 permissively licensed music recordings.
☆156Updated last year
seungheondoh / music-text-representation
Toward Universal Text-to-Music-Retrieval (TTMR) [ICASSP23]
☆113Updated last year
NilsDem / control-transfer-diffusion
Repository for the paper "Combining audio control and style transfer using latent diffusion", accepted at ISMIR 2024
☆50Updated 5 months ago
NeuralNotW0rk / LoRAW
Flexible LoRA Implementation to use with stable-audio-tools
☆73Updated 10 months ago
gladia-research-group / cocola
☆34Updated 3 months ago
RetroCirce / MusicLDM
The latent diffusion model for text-to-music generation.
☆174Updated last year
Stability-AI / stable-audio-metrics
Metrics for evaluating music and audio generative models – with a focus on long-form, full-band, and stereo generations.
☆232Updated last month
seungheondoh / music_caps_dl
Unofficial download repository for MusicCaps
☆47Updated 2 years ago
interactiveaudiolab / penn
Pitch Estimating Neural Networks (PENN)
☆262Updated 4 months ago