jiangnanboy / llm_securityLinks
利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测,尽早识别风险内容。The input and output contents of generative large model are checked by classification method and sensitive word detection method to identify content risk as early as possible.
☆18Updated 10 months ago
Alternatives and similar repositories for llm_security
Users that are interested in llm_security are comparing it to the libraries listed below
Sorting:
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆27Updated 5 months ago
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆420Updated 7 years ago
- Filter4J是一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核)库。☆90Updated last year
- automatic regex generation tool☆80Updated 2 years ago
- "他山之石、可以攻玉":复旦白泽智能发布面向国内开源和国外商用大模型的Demo数据集JADE-DB☆428Updated 3 weeks ago
- 基于Tensorflow的文本内容安全审核☆17Updated 11 months ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 基于机器学习的web攻击检测系统☆78Updated last year
- 机器学习+大数据+数据安全:数据安全ai智能风险监测,风控,反欺诈,,api安全,web安全的学习资源,致力于打造智能数据安全领域领先的学习资料库,收集不易,欢迎star。 Machine learning + big data + data security: d…☆147Updated 2 years ago
- AutoAudit—— the LLM for Cyber Security 网络安全大语言模型☆340Updated 4 months ago
- 一个持续更新的中文敏感词库,帮助开发者和内容审核者快速识别并过滤不当文本。☆557Updated 2 months ago
- Filter4J的技术细节☆13Updated last year
- 【风控知识库】互联网反欺诈风控实践,收录内容包含两部分:一是业务风控经验,如加固、反外挂、设备指纹、账号安全、内容安全、业务安全、支付交易安全等等;二是技术实践,如服务架构,算法实践,数据分析,大数据 等等。☆68Updated last year
- SC-Safety: 中文大模型多轮对抗安全基准☆142Updated last year
- Ai与Web安全相关资料的总结库,包括认为写的比较好的一些博客、项目、数据等☆82Updated 2 years ago
- 本科毕设:URL恶意性检测,基于字符串本身进行特征提取,基于sklearn库的机器学习模型进行分类(附实验数据于data文件夹)☆59Updated 5 years ago
- DFA 实现中文敏感词检测☆101Updated 3 years ago
- 中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽…☆23Updated 2 years ago
- ☆144Updated 9 months ago
- The homework of DNS Security Course☆25Updated 6 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆61Updated last year
- 建立识别钓鱼网站(邮件)的机器学习模型☆30Updated 6 years ago
- 国家标准全文公开系统下载工具☆32Updated 4 months ago
- ☆67Updated 2 years ago
- JailBench:大型语言模型越狱攻击风险评测中文数据集 [PAKDD 2025]☆106Updated 4 months ago
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆34Updated 4 years ago
- 机器学习NB算法实现基于文本的WebShell检测工具☆35Updated 3 years ago
- 基于深度学习的webshell检测☆14Updated 4 years ago
- struts2系列漏洞,jboss,weblogic,webshell(爆破的方式),thinkphp5_rce....☆158Updated 6 years ago
- 思通舆情 是一款开源免费的舆情系统,支持本地化部署。支持对海量的舆情数据进行多维交叉分析和深度挖掘,为用户户提供全面的舆情 数据,专业的舆情分析。☆558Updated 2 years ago