jiangnanboy / llm_securityLinks
利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测,尽早识别风险内容。The input and output contents of generative large model are checked by classification method and sensitive word detection method to identify content risk as early as possible.
☆28Updated last year
Alternatives and similar repositories for llm_security
Users that are interested in llm_security are comparing it to the libraries listed below
Sorting:
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆446Updated 8 years ago
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆35Updated 11 months ago
- Filter4J是一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核、屏蔽词)库。☆100Updated last year
- 基于Tensorflow的文本内容安全审核☆20Updated last year
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆71Updated 5 years ago
- 【风控知识库】互联网反欺诈风控实 践,收录内容包含两部分:一是业务风控经验,如加固、反外挂、设备指纹、账号安全、内容安全、业务安全、支付交易安全等等;二是技术实践,如服务架构,算法实践,数据分析,大数据 等等。☆79Updated last year
- 收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。☆68Updated 3 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆137Updated 2 years ago
- Filter4J的技术细节☆16Updated last year
- automatic regex generation tool☆81Updated 2 years ago
- SC-Safety: 中文大模型多轮对抗安全基准☆150Updated last year
- AutoAudit—— the LLM for Cyber Security 网络安全大语言模型☆355Updated 11 months ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆70Updated 2 years ago
- 基于深度学习的webshell检测☆15Updated 4 years ago
- "他山之石、可以攻玉":复旦白泽智能发布面向国内开源和国外商用大模型的Demo数据集JADE-DB☆494Updated 2 months ago
- DFA 实现中文敏感词检测☆104Updated 3 years ago
- 本列表收录互联网上常见的恶意网站网址。This list contains URLs of malicious websites commonly found on the Internet.