ymcui / PERTLinks

PERT: Pre-training BERT with Permuted Language Model

☆367

Alternatives and similar repositories for PERT

Users that are interested in PERT are comparing it to the libraries listed below

Sorting:

ymcui / LERT
LERT: A Linguistically-motivated Pre-trained Language Model（语言学信息增强的预训练模型LERT）
☆221Updated 4 months ago
iflytek / HFL-Anthology
Collections of resources from Joint Laboratory of HIT and iFLYTEK Research (HFL)
☆376Updated 2 years ago
ymcui / MacBERT
Revisiting Pre-trained Models for Chinese Natural Language Processing (MacBERT)
☆694Updated 4 months ago
ZhuiyiTechnology / roformer-sim
SimBERT升级版（SimBERTv2）！
☆445Updated 3 years ago
ShannonAI / ChineseBert
Code for ACL 2021 paper "ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information"
☆564Updated 2 years ago
ZhuiyiTechnology / t5-pegasus
中文生成式预训练模型
☆569Updated 3 years ago
renmada / t5-pegasus-pytorch
☆420Updated last year
fastnlp / CPT
CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Language Understanding and Generation
☆493Updated 2 years ago
pluto-junzeng / CNSD
中文自然语言推理数据集（A large-scale Chinese Nature language inference and Semantic similarity calculation Dataset）
☆434Updated 5 years ago
iflytek / MiniRBT
MiniRBT (中文小型预训练模型系列)
☆296Updated 4 months ago
ydli-ai / CSL
[COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集
☆652Updated 2 years ago
Langboat / Mengzi
Mengzi Pretrained Models
☆539Updated 3 years ago
SunnyGJing / t5-pegasus-chinese
基于GOOGLE T5中文生成式模型的摘要生成/指代消解，支持batch批量生成，多进程
☆227Updated 2 years ago
yongzhuo / Pytorch-NLU
中文文本分类、序列标注工具包（pytorch），支持中文长文本、短文本的多类、多标签分类任务，支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…
☆351Updated last year
zejunwang1 / CSTS
中文自然语言推理与语义相似度数据集
☆365Updated 3 years ago
CLUEbenchmark / FewCLUE
FewCLUE 小样本学习测评基准，中文版
☆515Updated 3 years ago
HillZhang1999 / MuCGEC
MuCGEC中文纠错数据集及文本纠错SOTA模型开源；Code & Data for our NAACL 2022 Paper "MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese Gr…
☆562Updated 2 years ago
qingkongzhiqian / GPT2-Summary
基于GPT2的中文摘要生成模型
☆405Updated 2 years ago
ZhuiyiTechnology / WoBERT
以词为基本单位的中文BERT
☆472Updated 4 years ago
thu-coai / KdConv
KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation
☆494Updated 2 years ago
bojone / CoSENT
比Sentence-BERT更有效的句向量方案
☆376Updated 3 years ago
ZhuiyiTechnology / simbert
a bert for retrieval and generation
☆861Updated 4 years ago
THUDM / Chinese-Transformer-XL
☆220Updated 2 years ago
tongchangD / text_data_enhancement_with_LaserTagger
Modify Chinese text, modified on LaserTagger Model. 文本复述，基于lasertagger做中文文本数据增强。
☆323Updated last year
zhusleep / pytorch_chinese_lm_pretrain
pytorch中文语言模型预训练
☆387Updated 5 years ago
bojone / SPACES
端到端的长本文摘要模型（法研杯2020司法摘要赛道）
☆399Updated last year
thu-coai / CrossWOZ
A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset
☆707Updated last year
hemingkx / WordSeg
A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .
☆217Updated 3 years ago
nghuyong / Chinese-text-correction-papers
text correction papers
☆312Updated last year
ymcui / cmrc2018
A Span-Extraction Dataset for Chinese Machine Reading Comprehension (CMRC 2018)
☆443Updated 3 years ago