jiangnanboy / llm_securityLinks
利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测,尽早识别风险内容。The input and output contents of generative large model are checked by classification method and sensitive word detection method to identify content risk as early as possible.
☆21Updated last year
Alternatives and similar repositories for llm_security
Users that are interested in llm_security are comparing it to the libraries listed below
Sorting:
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆434Updated 8 years ago
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆29Updated 8 months ago
- Filter4J是一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核、屏蔽词)库。☆96Updated last year
- Filter4J的技术细节☆15Updated last year
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆67Updated 5 years ago
- SC-Safety: 中文大模型多轮对抗安全基准☆144Updated last year
- automatic regex generation tool☆80Updated 2 years ago
- 【风控知识库】互联网反欺诈风控实践,收录内容包含两部分:一是业务风控经验,如加固、反外挂、设备指纹、账号安全、内容安全、业务安全、支付交易安全等等;二是技术实践,如服务架构,算法实践,数据分析,大数据 等等。☆70Updated last year
- AutoAudit—— the LLM for Cyber Security 网络安全大语言模型☆350Updated 7 months ago
- "他山之石、可以攻玉":复旦白泽智能发布面向国内开源和国外商用大模型的Demo数据集JADE-DB☆459Updated 3 months ago
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆35Updated 4 years ago
- 收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。☆63Updated 2 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆65Updated last year
- 基于深度学习的webshell检测☆14Updated 4 years ago
- 本科毕设:URL恶意性检测,基于字符串本身进行特征提取,基于sklearn库的机器学习模型进行分类(附实验数据于data文件夹)☆60Updated 5 years ago
- 破解 Java 混淆工具 Allatori☆290Updated 3 years ago
- 思通舆情 是一款开源免费的舆情系统,支持本地化部署。支持对海量的舆情数据进行多维交叉 分析和深度挖掘,为用户户提供全面的舆情数据,专业的舆情分析。☆580Updated 2 years ago
- 基于机器学习的web攻击检测系统☆81Updated last year
- JailBench:大型语言模型越狱攻击风险评测中文数据集 [PAKDD 2025]☆131Updated 7 months ago
- 本列表收录互联网上常见的恶意网站网址。This list contains URLs of malicious websites commonly found on the Internet.☆43Updated 7 years ago
- 通过机器学习进行敏感词的识别☆29Updated 7 years ago
- The homework of DNS Security Course☆26Updated 6 years ago
- ☆70Updated 2 years ago
- 轻量超严格敏感词库☆144Updated 2 years ago
- 一个网络安全相关法律法规、安全政策、国家标准、行业标准知识库。A knowledge base of cybersecurity policies, laws, guidelines, and technical standards.☆217Updated 6 months ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆129Updated 2 years ago
- Datacon2023 邮件安全赛道 赛题1 新型钓鱼邮件的检测 示例数据集☆26Updated last year
- 一个违规敏感图片检测模型☆14Updated last year
- 超轻量的中文敏感字、敏感词库,字典词典,超低误识别率,另提供API调用☆91Updated 6 years ago
- CCAC2024——大模型安全的双重防线:少样本文本内容安全挑战赛仓库☆28Updated last year