互联网常用敏感词、停止词词库
☆1,514Jun 4, 2024Updated last year
Alternatives and similar repositories for sensitive-stop-words
Users that are interested in sensitive-stop-words are comparing it to the libraries listed below
Sorting:
- 腾讯的离线敏感词库☆1,386Feb 23, 2026Updated last week
- 敏感词过滤的几种实现+某1w词敏感词库☆2,112Aug 20, 2021Updated 4 years ago
- 敏感词库整理☆178Feb 29, 2016Updated 10 years ago
- 基于分词原理修改写的一个过滤敏感词库,可以改成动态,支持返回敏感词,高亮敏感词,替换敏感词等操作,本敏感词收集了5W多个违法词、敏感词、违禁词,已去重,最新追加了将近1W个最新词,几十个矫正词、变异词。☆200Sep 10, 2020Updated 5 years ago
- 互联网常用敏感词库☆366Dec 4, 2018Updated 7 years ago
- 敏感词查找,验证,过滤和替换 🤓 FindAll, Validate, Filter and Replace words.☆691Jul 1, 2022Updated 3 years ago
- 敏感词过滤、广告词过滤、包含敏感词库,停顿词库。☆182Sep 1, 2016Updated 9 years ago
- 中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽…☆79,098May 10, 2024Updated last year
- 👮♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。内置支持单词标签分类分级。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测…☆5,704Dec 24, 2025Updated 2 months ago
- 超轻量的中文敏感字、敏感词库,字典词典,超低误识别率,另提供API调用☆95Apr 26, 2019Updated 6 years ago
- 简易敏感词处理器,支持返回敏感词,高亮敏感词,替换敏感词等操作☆265Nov 30, 2017Updated 8 years ago
- DFA 实现中文敏感词检测☆106May 23, 2022Updated 3 years ago
- 文本敏感词过滤(附1w+的词敏感词库)☆25Feb 4, 2020Updated 6 years ago
- 中文公开聊天语料库☆4,176Apr 23, 2024Updated last year
- 中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。☆4,268Nov 9, 2025Updated 3 months ago
- 中文近义词:聊天机器人,智能问答工具包☆5,104Feb 1, 2026Updated last month
- 中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理☆36,167Nov 15, 2025Updated 3 months ago
- 敏感词检测,违禁词过滤,敏感词过滤,敏感词库,一键启动,本地运行,私有化部署,1分钟接入完成,开箱即用,支持docker,支持在线api☆594Jan 27, 2025Updated last year
- The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。☆50,996Apr 2, 2025Updated 11 months ago
- 自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等☆1,728Jul 18, 2022Updated 3 years ago
- 从中文文本中自动提取关键词和摘要☆3,388May 7, 2025Updated 9 months ago
- mirror of dongxiexidian/Chinese☆305Dec 18, 2018Updated 7 years ago
- 中文常用停用词表(哈工大停用词表、百度停用词表等)☆5,477Jan 25, 2024Updated 2 years ago
- 中华新华字典数据库。包括歇后语,成语,词语,汉字。☆11,490Dec 26, 2023Updated 2 years ago
- 公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。☆1,289Mar 27, 2024Updated last year
- LLM API 管理 & 分发系统,支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek、字节豆包、ChatGLM、文心一言、讯飞星火、通义千问、360 智脑、腾讯混元等主流模型,统一 API 适配,可用于 key …☆29,842Jan 9, 2026Updated last month
- 结巴中文分词☆34,768Aug 21, 2024Updated last year
- Ip2region is an offline IP address manager framework and locator with both IPv4 and IPv6 supported, supporting billions of data segments,…☆18,745Feb 26, 2026Updated last week
- 一个持续更新的中文敏感词库,帮助开发者和内容审核者快速识别并过滤不当文本,即将迎来重大更新。☆3,163Dec 18, 2025Updated 2 months ago
- 中文敏感词库☆54Jun 1, 2012Updated 13 years ago
- 同义词表,反义词表,否定词表☆542Oct 17, 2024Updated last year
- 大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP☆9,862Feb 6, 2026Updated 3 weeks ago
- Golang基于DFA算法实现的敏感词过滤☆356Sep 23, 2019Updated 6 years ago
- 收集的几万条敏感词库,经过筛选,最后通过百度文本审核过滤出来的词库☆22Sep 10, 2024Updated last year
- 中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。☆4,575Nov 21, 2023Updated 2 years ago
- Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类☆3,422May 7, 2022Updated 3 years ago
- xmnlp:提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首,句子表征及文本相似度计算等功能☆1,297Nov 12, 2022Updated 3 years ago
- 速度更快、效果更好的中文新词发现☆513Mar 15, 2024Updated last year
- 综合了同义词词林扩展版与知网(Hownet)的词语相似度计算方法,词汇覆盖更多、结果更准确。☆744Feb 16, 2022Updated 4 years ago