daniellibin / CCF2020_data_content_classification
面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10
☆33Updated 3 years ago
Alternatives and similar repositories for CCF2020_data_content_classification:
Users that are interested in CCF2020_data_content_classification are comparing it to the libraries listed below
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆49Updated 3 years ago
- 自然语言处理_CCF大数据与计算智能大赛_面向数据安全治理的数据内容智能发现与分级分类☆11Updated 2 years ago
- 本方案在以下赛事中获得TOP3名次:1.2021百度paddlepaddle&国家电网AI创新大赛 语义解析赛道 三等奖 2.千言·语义解析 冠军 3.CCKS 2022 金融NL2SQL 亚军 4. WAIC 2022 Text2SQL 三等奖☆31Updated 3 years ago
- 基于pytorch_bert的中文多标签分类☆88Updated 3 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆35Updated last year
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 3 years ago
- 本仓主要实现并解决基于预训练bert,预训练字向量和词向量实现Bert_RCNN用于一个长文本对应对个标签的问题☆17Updated 3 years ago
- 基于 pytorch 的 bert 实现和下游任务微调☆48Updated 2 years ago
- 非结构化商业文本信息中隐私信息识别-rank2☆22Updated 3 years ago
- 地址标准化☆120Updated last year
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆140Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 2 months ago
- bert pytorch模型微调用于的多标签文本分类☆128Updated 5 years ago
- 医疗实体识别☆179Updated 4 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆201Updated 9 months ago
- 零基础入门NLP - 新闻文本分类 正式赛第一名方案☆229Updated 4 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆126Updated 3 years ago
- 基于 BERT 模型的中文文本分类工具☆63Updated 2 years ago
- NLP杂货铺,python实现各种算法/工具,辅助算法理解/应用☆153Updated 3 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆100Updated 3 years ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆58Updated 4 years ago
- multi-label-classification-4-event-type☆132Updated last year
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆95Updated 3 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated last year
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆47Updated 5 years ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆67Updated 2 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆46Updated 3 years ago
- 2020 CCF大数据与计算智能大赛-非结构化商业文本信息中隐私信息识别-第7名方案☆73Updated 3 years ago
- 天池竞赛安全AI挑战者计划第三期 - 文本分类对抗攻击 线上排名12/1175 &“最佳奇思妙想奖”☆84Updated 4 years ago