jiangnanboy / llm_securityLinks
利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测,尽早识别风险内容。The input and output contents of generative large model are checked by classification method and sensitive word detection method to identify content risk as early as possible.
☆16Updated 8 months ago
Alternatives and similar repositories for llm_security
Users that are interested in llm_security are comparing it to the libraries listed below
Sorting:
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆23Updated 3 months ago
- SC-Safety: 中文大模型多轮对抗安全基准☆135Updated last year
- Filter4J是一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核)库。☆89Updated last year
- JailBench:大型语言模型越狱攻击风险评测中文数据集 [PAKDD 2025]☆94Updated 3 months ago
- 国家标准全文公开系统下载工具☆24Updated 3 months ago
- ATT&CK 中文版☆55Updated 4 months ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 基于Tensorflow的文本内容安全审核☆17Updated 9 months ago
- Ai与Web安全相关资料的总结库,包括认为写的比较好的一些博客、项目、数据等☆82Updated 2 years ago
- Filter4J的技术细节☆13Updated last year
- 当人工智能遇上安全系列博客及开源代码分享,希望您喜欢~☆17Updated last year
- 基于机器学习的web攻击检测系统☆77Updated last year
- 机器学习、信息安全、《Web安全之机器学习入门》实现代码、深度学习算法实现☆28Updated 3 years ago
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆413Updated 7 years ago
- ☆96Updated last year
- AutoMSS 是基于AI Agent实现的针对安全事件自动化分析研判的系统,由cloud Totem团队开发,希望有兴趣的朋友可以一起参与进来更新和完善。邮箱联系:automss@cloud-totem.com☆46Updated last year
- 【风控知识库】互联网反欺诈风控实践,收录内容包含两部分:一是业务风控经验,如加固、反外挂、设备指纹、账号安全、内容安全、业务安全、支付交易安全等等;二是技术实践,如服务架构,算法实践,数据分析,大数据 等等。☆68Updated last year
- AutoAudit—— the LLM for Cyber Security 网络安全大语言模型☆332Updated 3 months ago
- 建立识别钓鱼网站(邮件)的机器学习模型☆28Updated 6 years ago
- 复旦白泽大模型安全基准测试集(2024年夏季版)☆38Updated 10 months ago
- 针对数据库的敏感数据检测脚本:扫描库、schema级别的表或视图的数据,发现其中的敏感字段。敏感类型包括姓名、电话、身份证号、电子邮箱、地址、银行账号。☆38Updated 7 years ago
- ☆60Updated 2 years ago
- LLM 安全资料收集与学习☆22Updated 11 months ago
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆33Updated 4 years ago
- 一个网络安全相关法律法规、安全政策、国家标准、行业标准知识库。A knowledge base of cybersecurity policies, laws, guidelines, and technical standards.☆201Updated last month
- 本列表收录互联网上常见的恶意网站网址。This list contains URLs of malicious websites commonly found on the Internet.☆40Updated 7 years ago
- ☆133Updated 7 months ago
- Python 识别黄色、色情图片 NSFW☆17Updated 5 years ago
- 毕方智能云沙箱(Bold-Falcon)是一个开源的自动化恶意软件分析系统;☆143Updated 2 years ago
- 机器学习(Machine learing)、网络安全(CyberSecurity)、大模型、数据集、AI竞赛☆50Updated 2 weeks ago