jiangnanboy / llm_security
利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测,尽早识别风险内容。The input and output contents of generative large model are checked by classification method and sensitive word detection method to identify content risk as early as possible.
☆16Updated 7 months ago
Alternatives and similar repositories for llm_security:
Users that are interested in llm_security are comparing it to the libraries listed below
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆22Updated 2 months ago
- Filter4J是一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核)库。☆85Updated last year
- Filter4J的技术细节☆13Updated last year
- ☆59Updated last year
- SC-Safety: 中文大模型多轮对抗安全基准☆133Updated last year
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆33Updated 4 years ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 机器学习(Machine learing)、网络安全(CyberSecurity)、大模型、数据集、AI竞赛☆48Updated 2 weeks ago
- 基于多模态特征融合的即时社交软件违规图 片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆56Updated last year
- AutoAudit—— the LLM for Cyber Security 网络安全大语言模型☆327Updated last month
- 针对数据库的敏感数据检测脚本:扫描库、schema级别的表或视图的数据,发现其中的敏感字段。敏感类型包括姓名、电话、身份证号、电子邮箱、地址、银行账号。☆37Updated 7 years ago
- 基于机器学习的web攻击检测系统☆77Updated 11 months ago
- 通过机器学习进行敏感词的识别☆28Updated 7 years ago
- ATT&CK 中文版☆53Updated 2 months ago
- 自然语言处理_CCF大数据与计算智能大赛_面向数据安全治理的数据内容智能发现与分级分类☆11Updated 2 years ago
- 收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。☆57Updated 2 years ago
- automatic regex generation tool☆78Updated last year
- Ai与Web安全相关资料的总结库,包括认为写的比较好的一些博客、项目、数据等☆81Updated 2 years ago
- 【风控知识库】互联网反欺诈风控实践,收录内容包含两部分:一是业务风控经验,如加固、反外挂、设备指纹、账号安全、内容安全、业务安全、支付交易安全等等;二是技术实践,如服务架构,算法实践,数据分析,大数据 等等。☆64Updated 11 months ago
- 本列表收录互联网上常见的恶意网站网址。This list contains URLs of malicious websites commonly found on the Internet.☆39Updated 7 years ago
- 使用python实现,基于DFA算法的敏感词屏蔽☆33Updated 5 years ago
- 基于深度学习的钓鱼页面检测系统 前后端架构☆14Updated last year
- 基于Tensorflow的文本内容安全审核☆14Updated 8 months ago
- 国家标准全文公开系统下载工具☆17Updated last month
- JailBench:大型语言模型越狱攻击风险评测中文数据集 [PAKDD 2025]☆81Updated last month
- 本科毕设:URL恶意性检测,基于字符串本身进行特征提取,基于sklearn库的机器学习模型进行分类(附实验数据于data文件夹)☆58Updated 4 years ago
- 一个网络安全相关法律法规、安全政策、国家标准、行业标准知识库。A knowledge base of cybersecurity policies, laws, guidelines, and technical standards.☆196Updated last week
- 机器学习NB算法实现基于文本的WebShell检测工具☆35Updated 3 years ago
- 基于神经网络的 PHP webshell检测器,目前有Attention与LSTM两种网络结构,以OPCODE作特征基础☆11Updated 5 years ago
- Datacon2023 邮件安全赛道 赛题1 新型钓鱼邮件的检测 示例数据集☆24Updated last year