qingyujean / eda-for-text-classification
使用EDA技术对小型的不均衡的数据集做增强,验证其效果提升
☆9Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for eda-for-text-classification
- Bert预训练模型fine-tune计算文本相似度☆97Updated last year
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆45Updated 3 years ago
- 新闻标题摘要生成模型,基于T5-PEGASUS。News title summary generation model☆17Updated 2 years ago
- bert pytorch模型微调用于的多标签文本分类☆125Updated 5 years ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆78Updated 3 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆138Updated 4 years ago
- 基于torch的,支持logits、crf、span、global_pointer四种方法的命名实体识别任务框架☆17Updated 8 months ago
- 多标签文本分类☆28Updated 2 years ago
- 基于Pytorch的知识蒸馏(中文文本分类)☆16Updated last year
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆68Updated 6 months ago
- 2020 “万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战 复盘☆30Updated 3 years ago
- nlp codes for study☆15Updated last year
- albert + lstm + crf实体识别,pytorch实现。识别的主要实体是人名、地名、机构名和时间。albert + lstm + crf (named entity recognition)☆135Updated 2 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆24Updated 9 months ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆117Updated last year
- 基于意图识别和命名实体识别的多轮对话场景设计☆36Updated 5 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆72Updated 4 years ago
- 针对Cnews数据集进行分类,使用了torchtext进行文本预处理☆11Updated 2 years ago
- Conversational AI based on Rasa☆39Updated 2 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆140Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆117Updated 3 years ago
- 基于Pytorch的文本分类框架,支持TextCNN、Bert、Electra等。☆57Updated last year
- 本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。☆65Updated 3 years ago
- [Unofficial] Predict code for AAAI 2022 paper: Unified Named Entity Recognition as Word-Word Relation Classification☆50Updated 2 years ago
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆65Updated 4 years ago
- “英特尔创新大师杯”深度学习挑战赛 赛道2:CCKS2021中文NLP地址要素解析☆140Updated 2 years ago
- CCKS2019医渡云4k电子病历数据集命名实体识别☆44Updated last year
- 基于simcse的中文句向量生成☆15Updated 2 years ago
- 基于transformers的三元组抽取☆35Updated 3 years ago