lychee-2724540853 / DFA-SensitiveDetectionLinks
中文敏感词检测加强版,针对OOV问题,能够检测出敏感词的同音词
☆15Updated 2 years ago
Alternatives and similar repositories for DFA-SensitiveDetection
Users that are interested in DFA-SensitiveDetection are comparing it to the libraries listed below
Sorting:
- 🇨🇳🇬🇧Chinese and English word spelling corrector.(中文易错别字检测,中文拼写检测纠正。英文单词拼写校验工具)☆264Updated last year
- 中文拼写检查工具,用于对中文文本中的错误用语进行检测并给出纠正建议☆37Updated 8 years ago
- jcorrector 中文文本纠错工具, Text Error Correction Tool,Spelling Check☆81Updated 10 months ago
- model2onnx,将roberta和macbert模型转为onnx格式,并进行推理。☆19Updated 3 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆171Updated 4 years ago
- HanLP: Han Language Processing , Java version☆28Updated 5 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated 2 years ago
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆62Updated 2 years ago
- The hanzi similar tool.(汉字相似度计算工具,中文形近字算法。可用于手写汉字识别纠正,文本混淆等。)☆284Updated last year
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆52Updated 4 years ago
- MuCGEC中文纠错数据集及文本纠错SOTA模型开源;Code & Data for our NAACL 2022 Paper "MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese Gr…☆561Updated 2 years ago
- 一个基于预训练的句向量生成工具☆138Updated 2 years ago
- near-synonym, 基于大模型LLM的中文反义词/近义词(antonyms/synonyms)工具包. 也可计算词语相似度/句子相似度/文本相似度等。☆31Updated 8 months ago
- text correction papers☆314Updated last year
- Code & Data for our Paper "NaSGEC: Multi-Domain Chinese Grammatical Error Correction for Native Speaker Texts" (ACL 2023 Findings)☆96Updated 10 months ago
- DFA 实现中文敏感词检测☆104Updated 3 years ago
- 3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的预训练模型☆312Updated 3 years ago
- 中文近义词表 Chinese Synonyms☆264Updated 7 years ago
- 基于bert进行中文文本纠错☆239Updated 2 years ago
- The missing SVM-based text classification module implementing HanLP's interface☆46Updated 8 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆109Updated 3 years ago
- 利用文本分析算法和Python脚本,自动纠正word中的英语单词拼写错误☆48Updated 7 years ago
- 中文自然语言推理与语义相似度数据集☆368Updated 4 years ago
- FAQ智能问答系统。实现FAQ的问题-模板匹配功能。部署轻量级的Web服务应用。☆66Updated last year
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆215Updated last year
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆75Updated last year
- PyTorch impelementations of BERT-based Spelling Error Correction Models. 基于BERT的文本纠错模型,使用PyTorch实现。☆278Updated 10 months ago
- CCL2022汉语学习者文本纠错评测任务赛道二——CGED-8第一名解决方案☆54Updated 2 years ago
- 机器学习训练简单模型判定一个句子是不是疑问句☆20Updated 3 years ago
- This repository is for the paper "A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check"☆294Updated 6 years ago