Tencent / TPATLinks

TensorRT Plugin Autogen Tool

☆367

Alternatives and similar repositories for TPAT

Users that are interested in TPAT are comparing it to the libraries listed below

Sorting:

OpenPPL / ppl.cv
ppl.cv is a high-performance image processing library of openPPL supporting various platforms.
☆513Updated last year
NVIDIA-AI-IOT / tensorrt_plugin_generator
A simple tool that can generate TensorRT plugin code quickly.
☆238Updated 2 years ago
zerollzeng / tiny-tensorrt
Deploy your model with TensorRT quickly.
☆764Updated 2 years ago
Tencent / Forward
A library for high performance deep learning inference on NVIDIA GPUs.
☆556Updated 3 years ago
ThanatosShinji / onnx-tool
A parser, editor and profiler tool for ONNX models.
☆468Updated last month
TRT2022 / MST-plus-plus-TensorRT
TensorRT 2022复赛方案：首个基于Transformer的图像重建模型MST++的TensorRT模型推断优化
☆143Updated 3 years ago
ModelTC / Dipoorlet
Offline Quantization Tools for Deploy.
☆141Updated last year
MegEngine / MegCC
MegCC是一个运行时超轻量，高效，移植简单的深度学习模型编译器
☆488Updated last year
OpenPPL / ppl.nn
A primitive library for neural network
☆1,369Updated last year
grimoire / amirstan_plugin
Useful tensorrt plugin. For pytorch and mmdetection model conversion.
☆165Updated last year
rmccorm4 / tensorrt-utils
⚡ Useful scripts when using TensorRT
☆237Updated 5 years ago
PaddlePaddle / CINN
Compiler Infrastructure for Neural Networks
☆147Updated 2 years ago
AI-performance / embedded-ai.bench
benchmark for embededded-ai deep learning inference engines, such as NCNN / TNN / MNN / TensorFlow Lite etc.
☆204Updated 4 years ago
NVIDIA / sampleQAT
Inference of quantization aware trained networks using TensorRT
☆83Updated 2 years ago
alibaba / BladeDISC
BladeDISC is an end-to-end DynamIc Shape Compiler project for machine learning workloads.
☆910Updated 11 months ago
grimoire / torch2trt_dynamic
A pytorch to tensorrt convert with dynamic shape support
☆267Updated last year
xiatwhu / trt2023
☆27Updated 2 years ago
torchpipe / torchpipe
Serving Inside Pytorch
☆167Updated 2 weeks ago
LitLeo / TensorRT_Tutorial
☆1,044Updated last year
HeKun-NVIDIA / AI-Blog
Collection of blogs on AI development
☆21Updated last year
HeKun-NVIDIA / TensorRT-Developer_Guide_in_Chinese
☆309Updated 3 years ago
bytedance / ByteTransformer
optimized BERT transformer inference on NVIDIA GPU. https://arxiv.org/abs/2210.03052
☆476Updated last year
tpoisonooo / how-to-optimize-gemm
row-major matmul optimization
☆692Updated 4 months ago
deepglint / EasyQuant
EasyQuant(EQ) is an efficient and simple post-training quantization method via effectively optimizing the scales of weights and activatio…
☆405Updated 3 years ago
ModelTC / MQBench
Model Quantization Benchmark
☆856Updated 8 months ago
OpenPPL / ppl.kernel.cuda
☆38Updated last year
onnx / optimizer
ONNX Optimizer
☆780Updated last month
OpenPPL / ppl.nn.llm
☆141Updated last year
BBuf / onnx2X
ONNX2Pytorch
☆165Updated 4 years ago
OpenPPL / ppl.pmx
☆60Updated last year