zhuhong1996 / AI-GuardianLinks

This repository contains code implementation of the paper "AI-Guardian: Defeating Adversarial Attacks using Backdoors, at IEEE Security and Privacy 2023.

☆13

Alternatives and similar repositories for AI-Guardian

Users that are interested in AI-Guardian are comparing it to the libraries listed below

Sorting:

XuandongZhao / DRW
[EMNLP 2022] Distillation-Resistant Watermarking (DRW) for Model Protection in NLP
☆13Updated last year
AI-secure / Robustness-Against-Backdoor-Attacks
RAB: Provable Robustness Against Backdoor Attacks
☆39Updated last year
IBM / model-sanitization
Codes for reproducing the results of the paper "Bridging Mode Connectivity in Loss Landscapes and Adversarial Robustness" published at IC…
☆27Updated 5 years ago
AI-secure / Meta-Nerual-Trojan-Detection
☆66Updated 4 years ago
yunyuntsai / DNN-Model-Stealing
Code for "CloudLeak: Large-Scale Deep Learning Models Stealing Through Adversarial Examples" (NDSS 2020)
☆20Updated 4 years ago
hammlab / PoisoningCertifiedDefenses
How Robust are Randomized Smoothing based Defenses to Data Poisoning? (CVPR 2021)
☆13Updated 4 years ago
THUYimingLi / Untargeted_Backdoor_Watermark
This is the official implementation of our paper 'Untargeted Backdoor Watermark: Towards Harmless and Stealthy Dataset Copyright Protecti…
☆57Updated last year
jinyuan-jia / BadEncoder
☆82Updated 4 years ago
tianshuocong / TePA
[S&P'24] Test-Time Poisoning Attacks Against Test-Time Adaptation Models
☆18Updated 5 months ago
hsouri / Sleeper-Agent
☆65Updated last year
weichen-yu / LM-Extraction
☆44Updated 2 years ago
ZQ-Struggle / AdvDoor
AdvDoor: Adversarial Backdoor Attack of Deep Learning System
☆32Updated 9 months ago
DennisLiu2022 / Membership-Inference-Attacks-by-Exploiting-Loss-Trajectory
☆24Updated 2 years ago
wronnyhuang / metapoison
Craft poisoned data using MetaPoison
☆52Updated 4 years ago
TDteach / Demon-in-the-Variant
☆13Updated 3 years ago
YiZeng623 / I-BAU
Official Implementation of ICLR 2022 paper, ``Adversarial Unlearning of Backdoors via Implicit Hypergradient''
☆53Updated 2 years ago
Jayfeather1024 / Backdoor-Enhanced-Alignment
☆22Updated 8 months ago
kenny-co / sgd-uap-torch
Universal Adversarial Perturbations (UAPs) for PyTorch
☆48Updated 3 years ago
google-research / preprocessor-aware-black-box-attack
☆20Updated 2 years ago
Vaidehi99 / InfoDeletionAttacks
☆44Updated 6 months ago
reds-lab / ASSET
This repository is the official implementation of the paper "ASSET: Robust Backdoor Data Detection Across a Multiplicity of Deep Learning…
☆19Updated 2 years ago
ShawnXYang / AccumulativeAttack
☆19Updated 4 years ago
weizeming / momentum-attack-llm
☆21Updated 6 months ago
PurduePAML / PICCOLO
☆25Updated 2 years ago
UMBCvision / SSL-Backdoor
Official implementation of the CVPR 2022 paper "Backdoor Attacks on Self-Supervised Learning".
☆74Updated last year
UsmannK / TABOR
Implementation of TABOR: A Highly Accurate Approach to Inspecting and Restoring Trojan Backdoors in AI Systems (https://arxiv.org/pdf/190…
☆18Updated 2 years ago
BrachioLab / adversarial_prompting
☆53Updated 2 years ago
uchicago-sandlab / naturalbackdoors
Code for identifying natural backdoors in existing image datasets.
☆15Updated 2 years ago
MadryLab / backdoor_data_poisoning
☆25Updated 6 years ago
xlhex / cater_neurips
☆6Updated 2 years ago