zhoujx4 / NLP-Data-AugmentationLinks
NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译
☆77Updated 4 years ago
Alternatives and similar repositories for NLP-Data-Augmentation
Users that are interested in NLP-Data-Augmentation are comparing it to the libraries listed below
Sorting:
- 基于pytorch_bert的中文多标签分类☆91Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆62Updated 2 years ago
- bert pytorch模型微调用于的多标签文本分类☆137Updated 5 years ago
- NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE☆178Updated 3 years ago
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆48Updated 5 years ago
- SimCSE在中文上的复现,有监督+无监督☆279Updated 7 months ago
- experiments of some semantic matching models and comparison of experimental results.☆163Updated 2 years ago
- ☆279Updated 3 years ago
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆104Updated 4 years ago
- SimCSE中文语义相似度对比学习模型☆89Updated 3 years ago
- 基于词汇信息融合的中文NER模型☆170Updated 3 years ago
- 利用huggingface实现文本分类☆58Updated 3 years ago
- Bert预训练模型fine-tune计算文本相似度☆109Updated 2 years ago
- 基于prompt的中文文本分类。☆55Updated 2 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆350Updated last year
- 基于Pytorch的文本 分类框架,支持TextCNN、Bert、Electra等。☆64Updated 2 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆179Updated 3 years ago
- ☆136Updated 3 years ago
- CMeEE/CBLUE/NER实体识别☆132Updated 3 years ago
- ☆87Updated 3 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。