daniellibin / CCF2020_data_content_classificationLinks
面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10
☆33Updated 4 years ago
Alternatives and similar repositories for CCF2020_data_content_classification
Users that are interested in CCF2020_data_content_classification are comparing it to the libraries listed below
Sorting:
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆51Updated 3 years ago
- 自然语言处理_CCF大数据与计算智能大赛_面向数据安全治理的数据内容智能发现与分级分类☆11Updated 2 years ago
- 非结构化商业文本信息中隐私信息识别-rank2☆24Updated 4 years ago
- 本方案在以下赛事中获得TOP3名次:1.2021百度paddlepaddle&国家电网AI创新大赛 语义解析赛道 三等奖 2.千言·语义解析 冠军 3.CCKS 2022 金融NL2SQL 亚军 4. WAIC 2022 Text2SQL 三等奖☆31Updated 3 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 5 years ago
- 根据地址提取省、市、区/县、街道,并进行标准化☆23Updated 3 years ago
- CCKS 2022 通用信息抽取☆12Updated 3 years ago
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 4 years ago
- SinglepassTextCluster, an TextCluster tools based on Singlepass cluster algorithm that use tfidf vector and doc2vec,which can be used for…☆63Updated 3 years ago
- 天池竞赛安全AI挑战者计划第三期 - 文本分类对抗攻击 线上排名12/1175 &“最佳奇思妙想奖”☆83Updated 5 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- Cascade bert+word vec and one layer FLAT, trained by adversarial FGM and Stochastic Weight Averaging☆23Updated 3 years ago
- NLP杂货铺,python实现各种算法/工具,辅助算法理解/应用☆154Updated 4 years ago
- A simple framework for building some basic NLP tasks☆59Updated 2 years ago
- NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译☆76Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated 2 years ago
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆102Updated 4 years ago
- 2020 CCF大数据与计算智能大赛-非结构化商业文本信息中隐私信息识别-第7名方案☆72Updated 4 years ago
- 本项目采用Keras和Keras-bert实现中文序列标注,对BERT进行微调,并在多个命名实体识别数据集上进行测试。☆48Updated 4 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 6 months ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated last year
- multi-label-classification-4-event-type☆136Updated 2 years ago
- 存放知乎,博客发表文章中的代码☆47Updated 3 years ago
- 天池阿里灵杰问天引擎电商搜索算法赛非官方 baseline,又名 NLP 从入门到 22/2771。☆90Updated 2 years ago
- 基于PaddleNLP开源的抽取式UIE进行医学命名实体 识别(torch实现)☆43Updated 2 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆47Updated 3 years ago
- 2020 “万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战 复盘☆31Updated 4 years ago
- 文本聚类☆36Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- 本仓主要实现并解决基于预训练bert,预训练字向量和词向量实现Bert_RCNN用于一个长文本对应对个标签的问题☆18Updated 3 years ago