wanghaitao93 / text_filterLinks
文本敏感词过滤(附1w+的词敏感词库)
☆24Updated 5 years ago
Alternatives and similar repositories for text_filter
Users that are interested in text_filter are comparing it to the libraries listed below
Sorting:
- 基于分词原理修改写的一个过滤敏感词库,可以改成动态,支持返回敏感词,高亮敏感词,替换敏感词等操作,本敏感词收集了5W多个违法词、敏感词、违禁词,已去重,最新追加了将近1W个最新词,几十个矫正词、变异词。☆196Updated 4 years ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆420Updated 7 years ago
- 敏感词库整理☆177Updated 9 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆52Updated 4 months ago
- 通过机器学习进行敏感词的识别☆28Updated 7 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 8 months ago
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆27Updated 5 months ago
- 停用词和敏感词库☆17Updated 4 years ago
- DFA 实现中文敏感词检测☆101Updated 3 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆126Updated 2 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆78Updated 5 years ago
- dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识…☆334Updated last year
- 基于 NSFW Model 色情图片识别鉴黄 后面更新视频检测☆30Updated 3 years ago
- 情感词典、停用词典、同义词典、程度词典、否定词典、敏感词典☆148Updated 3 years ago
- 基于 Simhash 的论文查重系统☆81Updated 3 years ago
- 综合的敏感词库,可用于违禁词检测☆33Updated 2 years ago
- 中文文本相似度计算器☆153Updated 9 months ago
- 暴恐违禁 文本色情 政治敏感 恶意推广 低俗辱骂☆99Updated 3 years ago
- 手把手教你搭建人工智能AI写诗平台,从模型搭建到前后端开发到SEO优化推广☆247Updated 3 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆61Updated last year
- 收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。☆60Updated 2 years ago
- 77,370条敏感文本和22,823个敏感词的高质量数据集,并进行分类☆10Updated 3 months ago
- 一个短视频app文本审核模块的实现思 路及demo☆120Updated 6 years ago
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- 整理开发中常用的各类API接口,当前有4大类:微信相关、数据及分析、开发专用、生活服务,如:天气预报、文档生成、身份证识别、代理IP等; 整理各种数据包,如:中华古诗词数据、词库、敏感词表、医学词表、四六级英汉词典数据等☆65Updated 5 years ago
- Easy-to-use CPM for Chinese text generation(基于CPM的中文文本生成)☆533Updated 2 years ago
- 对话机器人,包含了看图说话,单轮对话和多轮对话,tensorflow 2.0 pytorch 1.3.1 GPT-2☆44Updated 4 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆233Updated 2 years ago