lychee-2724540853 / DFA-SensitiveDetectionLinks
中文敏感词检测加强版,针对OOV问题,能够检测出敏感词的同音词
☆15Updated 2 years ago
Alternatives and similar repositories for DFA-SensitiveDetection
Users that are interested in DFA-SensitiveDetection are comparing it to the libraries listed below
Sorting:
- 🇨🇳🇬🇧Chinese and English word spelling corrector.(中文易错别字检测,中文拼写检测纠正。英文单词拼写校验工具)☆264Updated 8 months ago
- jcorrector 中文文本纠错工具, Text Error Correction Tool,Spelling Check☆74Updated 6 months ago
- 中文拼写检查工具,用于对中文文本中的错误用语进行检测并给出纠正建议☆36Updated 7 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆169Updated 3 years ago
- The hanzi similar tool.(汉字相似度计算工具,中文形近字算法。可用于手写汉字识别纠正,文本混淆等。)☆272Updated last year
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated 2 years ago
- 💊 智能客服、聊天机器人的应用算法☆293Updated 4 years ago
- 啊哈自然语言处理包,提供包括分词、依存句法分析、语义角色标注、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。☆309Updated last year
- The missing SVM-based text classification module implementing HanLP's interface☆47Updated 7 years ago
- 基于规则的文本纠错系统。☆122Updated 4 years ago
- model2onnx,将roberta和macbert模型转为onnx格式,并进行推理。☆19Updated 3 years ago
- near-synonym, 基于大模型LLM的中文反义词/近义词(antonyms/synonyms)工具包. 也可计算词语相似度/句子相似度/文本相似度等。☆28Updated 4 months ago
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- A convenient Chinese word segmentation tool 简便中文分词器☆48Updated 3 months ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆27Updated 3 weeks ago
- 任务型对话系统(Task-based Dialogue System)☆66Updated 3 years ago
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆200Updated 5 years ago
- PyTorch impelementations of BERT-based Spelling Error Correction Models. 基于BERT的文本纠错模型,使用PyTorch实现。☆273Updated 6 months ago
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated last year
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆74Updated 9 months ago
- 中文近义词表 Chinese Synonyms☆262Updated 7 years ago
- 一个基于预训练的句向量生成工具☆138Updated 2 years ago
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆51Updated 4 years ago
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆60Updated last year
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆82Updated last year
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- “英特尔创新大师杯”深度学习挑战赛 赛道2:CCKS2021中文NLP地址要素解析☆147Updated 3 years ago
- 3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的预训练模型☆303Updated 2 years ago
- 中文日期/时间/数字量提取工具☆69Updated 5 years ago
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆208Updated last year