phlippe / liger_kernelsLinks

JAX Implementation of Liger Kernels

☆9

Alternatives and similar repositories for liger_kernels

Users that are interested in liger_kernels are comparing it to the libraries listed below

Sorting:

yixiaoer / mistral-v0.2-jax
JAX implementation of the Mistral 7b v0.2 model
☆35Updated last year
srush / mamba-primer
☆37Updated last year
vvvm23 / mamba-jax
Unofficial but Efficient Implementation of "Mamba: Linear-Time Sequence Modeling with Selective State Spaces" in JAX
☆85Updated last year
AndPotap / einsum-search
☆32Updated 10 months ago
yixiaoer / tpu-training-example
☆14Updated last year
amirzandieh / HyperAttention
Triton Implementation of HyperAttention Algorithm
☆48Updated last year
young-geng / mintext
Minimal but scalable implementation of large language models in JAX
☆35Updated 2 weeks ago
dtunai / Griffin-Jax
Jax implementation of "Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models"
☆14Updated last year
berlino / seq_icl
☆53Updated last year
yixiaoer / einshard
Einsum-like high-level array sharding API for JAX
☆35Updated last year
martin-marek / batch-size
📄Small Batch Size Training for Language Models
☆36Updated last week
phlippe / jax_trainer
Lightning-like training API for JAX with Flax
☆42Updated 7 months ago
apple / ml-ademamix
☆65Updated 8 months ago
epfml / schedules-and-scaling
Code for NeurIPS 2024 Spotlight: "Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations"
☆81Updated 9 months ago
cloneofsimo / min-fsdp
☆83Updated last year
radarFudan / mamba-minimal-jax
☆31Updated 8 months ago
shikaiqiu / compute-better-spent
☆53Updated 10 months ago
shreyansh26 / Attention-Mask-Patterns
Using FlexAttention to compute attention with different masking patterns
☆44Updated 10 months ago
srush / triton-autodiff
Experiment of using Tangent to autodiff triton
☆80Updated last year
young-geng / mlxu
Machine Learning eXperiment Utilities
☆46Updated last week
sustcsonglin / mamba-triton
☆49Updated last year
google-deepmind / spectral_ssm
☆33Updated last year
dayal-kalra / low-memory-adam
☆11Updated 5 months ago
nikhilvyas / SOAP
☆206Updated 8 months ago
EleutherAI / nanoGPT-mup
The simplest, fastest repository for training/finetuning medium-sized GPTs.
☆149Updated last month
alexzhang13 / Triton-Puzzles-Solutions
Personal solutions to the Triton Puzzles
☆19Updated last year
insuhan / hyper-attn
☆81Updated last year
LIONS-EPFL / scion
☆33Updated 3 weeks ago
jax-ml / jax-llm-examples
☆141Updated last week
test-time-training / ttt-tk
☆39Updated 4 months ago