lychee-2724540853 / DFA-SensitiveDetectionLinks
中文敏感词检测加强版,针对OOV问题,能够检测出敏感词的同音词
☆15Updated last year
Alternatives and similar repositories for DFA-SensitiveDetection
Users that are interested in DFA-SensitiveDetection are comparing it to the libraries listed below
Sorting:
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆51Updated 3 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated last year
- 中文地址解析系统,解析出省市区县名称及ID☆14Updated 2 years ago
- 中文拼写检查工具,用于对中文文本中的错误用语进行检测并给出纠正建议☆36Updated 7 years ago
- MacBERT for Chinese Spelling Correction, macbert中文拼写纠错☆15Updated 3 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆25Updated last year
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆33Updated 4 years ago
- jcorrector 中文文本纠错工具, Text Error Correction Tool,Spelling Check☆69Updated 3 months ago
- 任务型对话系统(Task-based Dialogue System)☆65Updated 3 years ago
- 地址标准化☆120Updated last year
- model2onnx,将roberta和macbert模型转为onnx格式,并进行推理。☆18Updated 2 years ago
- 基于意图识别和命名实体识别的多轮对话场景设计☆39Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆164Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 6 months ago
- 文本特征提取算法,卡方校验(chi-square)和信息增益算法提取文本特征算法实现☆18Updated 8 years ago
- 一个基于预训练的句 向量生成工具☆136Updated 2 years ago
- 一站式自动化开源标注平台☆73Updated 2 years ago
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆57Updated last year
- 中文地址提取工具,支持中国三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。☆226Updated 7 months ago
- 中文地址解析☆16Updated 8 years ago
- 中文谐音词/字库(同音词/字)Chinese Homophones☆105Updated 5 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆53Updated 5 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- Bert分类,语义相似度,获取句向量。☆64Updated 2 months ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆32Updated 2 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆47Updated 3 years ago
- 京东/淘宝客服对话数据公开,seq2seq生成模型设计对话系统获第二名☆44Updated 2 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated last year
- SinglepassTextCluster, an TextCluster tools based on Singlepass cluster algorithm that use tfidf vector and doc2vec,which can be used for…☆63Updated 3 years ago
- Time-NLP的Python3版本 中文时间表达识别☆89Updated 5 years ago