UCF-ML-Research / TrojText

☆8

Alternatives and similar repositories for TrojText:

Users that are interested in TrojText are comparing it to the libraries listed below

PurduePAML / Exray
☆11Updated 2 years ago
jianshuod / TBA
Official code for the ICCV2023 paper ``One-bit Flip is All You Need: When Bit-flip Attack Meets Model Training''
☆15Updated last year
GuanhaoGan / robust-model-watermarking
official implementation of Towards Robust Model Watermark via Reducing Parametric Vulnerability
☆13Updated 8 months ago
renjie3 / MemAttn
☆11Updated 8 months ago
Jayfeather1024 / Backdoor-Enhanced-Alignment
☆17Updated 2 months ago
sail-sg / MMCBench
☆27Updated last year
VITA-Group / Random-Shuffling-BackdoorDetect
[NeurIPS 2022] "Randomized Channel Shuffling: Minimal-Overhead Backdoor Attack Detection without Clean Datasets" by Ruisi Cai*, Zhenyu Zh…
☆19Updated 2 years ago
ethz-spylab / realistic-adv-examples
Code for the paper "Evading Black-box Classifiers Without Breaking Eggs" [SaTML 2024]
☆20Updated 10 months ago
thu-coai / SafeUnlearning
Safe Unlearning: A Surprisingly Effective and Generalizable Solution to Defend Against Jailbreak Attacks
☆23Updated 7 months ago
VITA-Group / Trap-and-Replace-Backdoor-Defense
[NeurIPS'22] Trap and Replace: Defending Backdoor Attacks by Trapping Them into an Easy-to-Replace Subnetwork. Haotao Wang, Junyuan Hong,…
☆14Updated last year
RU-System-Software-and-Security / NONE
☆11Updated 2 years ago
google-research / preprocessor-aware-black-box-attack
☆20Updated last year
VITA-Group / Robust_Weight_Signatures
[ICML 2023] "Robust Weight Signatures: Gaining Robustness as Easy as Patching Weights?" by Ruisi Cai, Zhenyu Zhang, Zhangyang Wang
☆15Updated last year
RU-System-Software-and-Security / UNICORN
☆14Updated last year
kyleliang919 / Uncovering-the-Connections-BetweenAdversarial-Transferability-and-Knowledge-Transferability
code for ICML 2021 paper in which we explore the relationship between adversarial transferability and knowledge transferability.
☆17Updated 2 years ago
IBM / model-sanitization
Codes for reproducing the results of the paper "Bridging Mode Connectivity in Loss Landscapes and Adversarial Robustness" published at IC…
☆27Updated 4 years ago
jinghuichen / AWM
Github repo for One-shot Neural Backdoor Erasing via Adversarial Weight Masking (NeurIPS 2022)
☆14Updated 2 years ago
XuandongZhao / DRW
[EMNLP 2022] Distillation-Resistant Watermarking (DRW) for Model Protection in NLP
☆12Updated last year
mireshghallah / neighborhood-curvature-mia
☆21Updated last year
fra31 / rlhf-trojan-competition-submission
☆16Updated 11 months ago
MadryLab / smoothed-vit
Certified Patch Robustness via Smoothed Vision Transformers
☆42Updated 3 years ago
BrachioLab / adversarial_prompting
☆53Updated last year
yfchen1994 / poisoning_membership
☆18Updated 9 months ago
facebookresearch / three_bricks
Official Implementation of the paper "Three Bricks to Consolidate Watermarks for LLMs"
☆45Updated last year
umd-huang-lab / VLM-Poisoning
Code for Neurips 2024 paper "Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language Models"
☆41Updated last month
grasses / RemovalNet
Code for paper: "RemovalNet: DNN model fingerprinting removal attack", IEEE TDSC 2023.
☆9Updated last year
jiawangbai / TA-LBF
The implementatin of our ICLR 2021 work: Targeted Attack against Deep Neural Networks via Flipping Limited Weight Bits
☆18Updated 3 years ago
weichen-yu / LM-Extraction
☆40Updated last year
RJ-T / NIPS2022_EP_BNP
Official Implementation of NIPS 2022 paper Pre-activation Distributions Expose Backdoor Neurons
☆14Updated 2 years ago
ys-zong / VLGuard
[ICML 2024] Safety Fine-Tuning at (Almost) No Cost: A Baseline for Vision Large Language Models.
☆55Updated last month