DengBoCong / text-similarityLinks
文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本
☆178Updated 3 years ago
Alternatives and similar repositories for text-similarity
Users that are interested in text-similarity are comparing it to the libraries listed below
Sorting:
- NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE☆176Updated 3 years ago
- SimCSE在中文上的复现,有监督+无监督☆277Updated 4 months ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- experiments of some semantic matching models and comparison of experimental results.☆162Updated 2 years ago
- bert pytorch模型微调用于的多标签文本分类☆134Updated 5 years ago
- 基于pytorch_bert的中文多标签分类☆90Updated 3 years ago
- ☆278Updated 3 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆346Updated 11 months ago
- Bert预训练模型fine-tune计算文本相似度☆105Updated 2 years ago
- 中文问题句子相似度计算比赛及方案汇总☆301Updated 4 years ago
- “英特尔创新大师杯”深度学习挑战赛 赛道2:CCKS2021中文NLP地址要素解析☆144Updated 3 years ago
- 基于词汇信息融合的中文NER模型☆169Updated 3 years ago
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆102Updated 4 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆106Updated last year
- 利用huggingface实现文本分类☆57Updated 3 years ago
- multi-label-classification-4-event-type☆136Updated 2 years ago
- “万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案☆135Updated 4 years ago
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆397Updated last year
- 中文无监督SimCSE Pytorch实现☆134Updated 4 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆115Updated 4 years ago
- 天池大赛疫情文本挑战赛线上第三名方案分享☆227Updated 4 years ago
- Keyphrase or Keyword Extraction 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained La…☆428Updated 5 years ago
- ☆136Updated 3 years ago
- CoSENT、STS、SentenceBERT☆168Updated 5 months ago
- bert_seq2seq的DDP版本,支持bert、roberta、nezha、t5、gpt2等模型,支持seq2seq、ner、关系抽取等任务,无需添加额外代码,轻松启动DDP多卡训练。☆52Updated 2 years ago
- NEZHA: Neural Contextualized Representation for Chinese Language Understanding☆261Updated 3 years ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆80Updated 4 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆105Updated 3 years ago
- NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译☆76Updated 4 years ago
- ☆87Updated 3 years ago