zhoujx4 / NLP-Data-AugmentationLinks
NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译
☆77Updated 4 years ago
Alternatives and similar repositories for NLP-Data-Augmentation
Users that are interested in NLP-Data-Augmentation are comparing it to the libraries listed below
Sorting:
- 基于pytorch_bert的中文多标签分类☆91Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- ☆279Updated 3 years ago
- NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE☆178Updated 3 years ago
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆104Updated 4 years ago
- 中文数据集下SimCSE+ESimCSE的实现☆193Updated 3 years ago
- SimCSE在中文上的复现,有监督+无监督☆278Updated 6 months ago
- experiments of some semantic matching models and comparison of experimental results.☆163Updated 2 years ago
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆48Updated 5 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆179Updated 3 years ago
- 基于prompt的中文文本分类。☆55Updated 2 years ago
- 基于词汇信息融合的中文NER模型☆169Updated 3 years ago
- 利用huggingface实现文本分类☆58Updated 3 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分 类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆349Updated last year
- pytorch中文语言模型预训练☆390Updated 5 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆62Updated 2 years ago
- bert pytorch模型微调用于的多标签 文本分类☆135Updated 5 years ago
- 疫情期间网民情绪识别比赛分享+top1~3解决方案☆51Updated 4 years ago
- SimCSE中文语义相似度对比学习模型☆88Updated 3 years ago
- ☆87Updated 3 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆108Updated 2 years ago
- 基于Pytorch的文本分 类框架,支持TextCNN、Bert、Electra等。☆63Updated 2 years ago
- 中文无监督SimCSE Pytorch实现☆135Updated 4 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆76Updated last year
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆398Updated last year
- SimCSE有监督与无监督实验复现☆149Updated last year
- 多模型中文cnews新闻文本分类☆59Updated 5 years ago
- Bert预训练模型fine-tune计算文本相似度☆107Updated 2 years ago
- 基于GOOGLE T5中文生成式模型的摘要生成/指代消解,支持batch批量生成,多进程☆227Updated last year
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆116Updated 4 years ago