zhoujx4 / NLP-Data-AugmentationLinks
NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译
☆78Updated 4 years ago
Alternatives and similar repositories for NLP-Data-Augmentation
Users that are interested in NLP-Data-Augmentation are comparing it to the libraries listed below
Sorting:
- 基于pytorch_bert的中文多标签分类☆92Updated 4 years ago
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆48Updated 5 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 4 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆62Updated 2 years ago
- 基于词汇信息融合的中文NER模型☆170Updated 3 years ago
- bert pytorch模型微调用于的多标签文本分类☆137Updated 6 years ago
- NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE☆179Updated 3 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆117Updated 5 years ago
- experiments of some semantic matching models and comparison of experimental results.☆163Updated last month
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆109Updated 2 years ago
- ☆279Updated 3 years ago
- 基于Pytorch的文本分类框架,支持TextCNN、Bert、Electra等。☆64Updated 2 years ago
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆104Updated 4 years ago
- SimCSE在中文上的复现,有监督+无监督☆281Updated 9 months ago
- 利用huggingface实现文本分类☆58Updated 3 years ago
- 基于prompt的中文文本分类。☆55Updated 2 years ago
- Bert预训练模型fine-tune计算文本相似度☆111Updated 2 years ago
- 中文数据集下SimCSE+ESimCSE的实现☆193Updated 3 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆79Updated 2 years ago
- CMeEE/CBLUE/NER实体识别☆132Updated 3 years ago
- 基于GlobalPointer的实体/关系/事件抽取☆150Updated 3 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆180Updated 3 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆351Updated last year
- ☆88Updated 4 years ago
- pytorch中文语言模型预训练☆387Updated 5 years ago
- NER任务SOTA模型BERT_MRC☆61Updated last year
- ☆52Updated 5 years ago
- 继续预训练中文bert☆31Updated 4 years ago
- Code for ACL 2021 paper. MECT: Multi-Metadata Embedding based Cross-Transformer for Chinese Named Entity Recognition.☆68Updated 4 years ago
- 基于GOOGLE T5中文生成式模型的摘要生成/指代消解,支持batch批量生成,多进程☆227Updated 2 years ago