wanghaitao93 / text_filterLinks
文本敏感词过滤(附1w+的词敏感词库)
☆24Updated 5 years ago
Alternatives and similar repositories for text_filter
Users that are interested in text_filter are comparing it to the libraries listed below
Sorting:
- 基于分词原理修改写的一个过滤敏感词库,可以改成动态,支持返回敏感词,高亮敏感词,替换敏感词等操作,本敏感词收集了5W多个违法词、敏感词、违禁词,已去重,最新追加了将近1W个最新词,几十个矫正词、变异词。☆193Updated 4 years ago
- 停用词和敏感词库☆17Updated 4 years ago
- 综合的敏感词库,可用于违禁词检测☆33Updated 2 years ago
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆413Updated 7 years ago
- 敏感词库整理☆176Updated 9 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆61Updated last year
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆124Updated last year
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆164Updated 3 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated last year
- 轻量超严格敏感词库☆133Updated 2 years ago
- 智能营销文案生成☆35Updated last month
- DFA 实现中文敏感词检测☆101Updated 3 years ago
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆23Updated 3 months ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 7 months ago
- 超轻量的中文敏感字、敏感词库,字典词典,超低误识别率,另提供API调用☆88Updated 6 years ago
- 基于 NSFW Model 色情图片识别鉴黄 后面更新视频检测☆30Updated 2 years ago
- 暴恐违禁 文本色情 政治敏感 恶意推广 低俗辱骂☆98Updated 3 years ago
- 使用python实现,基于DFA算法的敏感词屏蔽☆35Updated 5 years ago
- 中文 小说 多轮对话语料库 ,可以用来训练中文聊天模型,更新中,有想加的语料可以提issue☆21Updated last year
- 敏感词过滤系统☆60Updated 9 years ago
- 情感词典、停用词典、同义词典、程度词典、否定词典、敏感词典☆147Updated 3 years ago
- 定制化chatgpt:多种超低成本定制化的chatgpt平替方案,带模型和数据且完整训练预测流程,可在线使用(仅限用于学术测试)[已有ChatGLM的LoRA与pt2方案]☆34Updated 2 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆78Updated 5 years ago
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆88Updated last year
- ✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等☆11Updated 3 years ago
- QBQTC: 大规模搜索匹配数据集☆82Updated 3 years ago
- 百度汉语字典爬虫,拼音数据,35万海量百度词典数据。☆26Updated 2 years ago
- 通过机器学习进行敏感词的识别☆28Updated 7 years ago
- 收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。☆59Updated 2 years ago