lychee-2724540853 / DFA-SensitiveDetectionLinks
中文敏感词检测加强版,针对OOV问题,能够检测出敏感词的同音词
☆15Updated last year
Alternatives and similar repositories for DFA-SensitiveDetection
Users that are interested in DFA-SensitiveDetection are comparing it to the libraries listed below
Sorting:
- jcorrector 中文文本纠错工具, Text Error Correction Tool,Spelling Check☆69Updated 3 months ago
- 中文拼写检查工具,用于对中文文本中的错误用语进行检测并给出纠正建议☆36Updated 7 years ago
- MacBERT for Chinese Spelling Correction, macbert中文拼写纠错☆15Updated 3 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated last year
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆51Updated 3 years ago
- 中文地址解析系统,解析出省市区县名称及ID☆14Updated 2 years ago
- 基于意图识别和命名实体识别的多轮对话场景设计☆39Updated 6 years ago
- HanLP: Han Language Processing , Java version☆26Updated 4 years ago
- model2onnx,将roberta和macbert模型转为onnx格式,并进行推理。☆18Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆33Updated 4 years ago
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆57Updated last year
- near-synonym, 基于大模型LLM的中文反义词/近义词(antonyms/synonyms)工具包. 也可计算词语相似度/句子相似度/文本相似度等。☆25Updated last month
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆25Updated last year
- The hanzi similar tool.(汉字相似度计算工具,中文形近字算法。可用于手写汉字识别纠正,文本混淆等。)☆269Updated last year
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 4 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated 2 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- intent detection and slot filling 意图识别与槽填充联合模型☆39Updated 2 years ago
- t5-model-onnx,中文拼写纠错,Chinese spelling correction。☆14Updated 2 years ago
- textcnn for advertising detection,广告检测☆11Updated last year
- bert语言模型校验句子的通顺性☆15Updated 4 years ago
- 采用卷积神经网络(cnn)进行文本分类,依赖dl4j☆14Updated 6 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆82Updated 3 years ago
- 从jieba分词到BERT-wwm,一步步带你进入中文NLP的世界☆15Updated 2 years ago
- 专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类和文本分类. 为相关领域的研发人员提供完整的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSe…☆114Updated 2 years ago
- 基于规则的文本纠错系统。☆121Updated 3 years ago
- DFA 实现中文敏感词检测☆101Updated 3 years ago
- The missing SVM-based text classification module implementing HanLP's interface☆47Updated 7 years ago
- 中文文本纠错模型,keras实现☆74Updated 3 years ago