leimao / ONNX-Python-ExamplesLinks

ONNX Python Examples

☆16

Alternatives and similar repositories for ONNX-Python-Examples

Users that are interested in ONNX-Python-Examples are comparing it to the libraries listed below

Sorting:

tsingmicro-toolchain / OnnxSlim
A Toolkit to Help Optimize Large Onnx Model
☆157Updated last year
dingyuqing05 / trt2022_wenet
☆71Updated 2 years ago
NVIDIA / sampleQAT
Inference of quantization aware trained networks using TensorRT
☆83Updated 2 years ago
BBuf / onnx_learn
☆99Updated 3 years ago
luchangli03 / onnxsim_large_model
simplify >2GB large onnx model
☆60Updated 7 months ago
leimao / PyTorch-Quantization-Aware-Training
PyTorch Quantization Aware Training Example
☆137Updated last year
weishengying / tiny-flash-attention
使用 cutlass 实现 flash-attention 精简版，具有教学意义
☆43Updated 11 months ago
FeiGeChuanShu / trt2023
NVIDIA TensorRT Hackathon 2023复赛选题：通义千问Qwen-7B用TensorRT-LLM模型搭建及优化
☆42Updated last year
Tlntin / trt2023
☆26Updated last year
inisis / OnnxLLM
Large Language Model Onnx Inference Framework
☆36Updated 6 months ago
TRT2022 / MST-plus-plus-TensorRT
TensorRT 2022复赛方案：首个基于Transformer的图像重建模型MST++的TensorRT模型推断优化
☆139Updated 3 years ago
torchpipe / torchpipe
Serving Inside Pytorch
☆163Updated this week
triton-inference-server / tensorrt_backend
The Triton backend for TensorRT.
☆77Updated this week
gmalivenko / onnx-opcounter
Count number of parameters / MACs / FLOPS for ONNX models.
☆93Updated 8 months ago
ModelTC / Dipoorlet
Offline Quantization Tools for Deploy.
☆129Updated last year
xiatwhu / trt2023
☆26Updated last year
Oldpan / DeployIsAllYouNeed
☆121Updated 2 years ago
wangzhaode / onnx-llm
llm deploy project based onnx.
☆42Updated 9 months ago
fumihwh / onnx-pytorch
A code generator from ONNX to PyTorch code
☆138Updated 2 years ago
OpenPPL / ppl.pmx
☆59Updated 7 months ago
inisis / OnnxSlim
A Toolkit to Help Optimize Onnx Model
☆178Updated this week
TRT2022 / trtllm-llama
☢️ TensorRT 2023复赛——基于TensorRT-LLM的Llama模型推断加速优化
☆49Updated last year
MegEngine / mgeconvert
MegEngine到其他框架的转换器
☆70Updated 2 years ago
OpenPPL / ppl.nn.llm
☆139Updated last year
ThanatosShinji / onnx-tool
A parser, editor and profiler tool for ONNX models.
☆445Updated last month
weishengying / cute_gemm
☆14Updated 11 months ago
aadhithya / onnx-typecast
Script to typecast ONNX model parameters from INT64 to INT32.
☆107Updated last year
BBuf / onnx2X
ONNX2Pytorch
☆162Updated 4 years ago
triple-Mu / TensorRT2ONNX
A tool convert TensorRT engine/plan to a fake onnx
☆40Updated 2 years ago
Oneflow-Inc / OneFlow-Pruning
[CVPR-2023] Towards Any Structural Pruning
☆17Updated 2 years ago