morenjiujiu / sensitive_content_filter
DFA 实现中文敏感词检测
☆98Updated 2 years ago
Alternatives and similar repositories for sensitive_content_filter:
Users that are interested in sensitive_content_filter are comparing it to the libraries listed below
- 一个短视频app文本审核模块的实现思路及demo☆116Updated 6 years ago
- mirror of dongxiexidian/Chinese☆294Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆159Updated 3 years ago
- 通过机器学习进行敏感词的识别☆29Updated 7 years ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 暴恐违禁 文本色情 政治敏感 恶意推广 低俗辱骂☆98Updated 2 years ago
- 敏感词库整理☆171Updated 9 years ago
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆295Updated 7 years ago
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时 间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated 8 months ago
- python | 高效使用统计语言模型kenlm:新词发现、分词、智能纠错等☆163Updated 5 years ago
- 基于bert进行中文文本纠错☆232Updated last year
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆67Updated 5 years ago
- 中文文本纠错模型,keras实现☆73Updated 3 years ago
- 短文本相似度☆103Updated 3 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆134Updated 4 years ago
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆96Updated 3 years ago
- 速度更快、效果更好的中文新词发现☆512Updated last year
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated last year
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- Pytorch-NLU,一个中文文本分类、序列标注工具包,支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Ptorch NLU, a Chinese text classification and sequ…☆341Updated 8 months ago
- 文本相似度计算/文本匹配☆303Updated 5 years ago
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆194Updated 4 years ago
- 智能客服☆105Updated 5 years ago
- 中文单词自动纠错☆121Updated 3 years ago
- NLP 短文本 评论 垃圾 过滤☆40Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- Unilm for Chinese Chitchat Robot.基于Unilm模型的夸夸式闲聊机器人项目。☆157Updated 4 years ago
- 房新数据中文地址分词☆62Updated 5 years ago
- SiameseSentenceSimilarity,个人实现的基于Siamese bilstm模型的相似句子判定模型,提供训练数据集和测试数据集.☆267Updated 5 years ago
- Modify Chinese text, modified on LaserTagger Model. 文本复述,基于lasertagger做中文文本数据增强。☆318Updated last year