DengBoCong / text-similarityLinks
文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本
☆179Updated 3 years ago
Alternatives and similar repositories for text-similarity
Users that are interested in text-similarity are comparing it to the libraries listed below
Sorting:
- NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE☆178Updated 4 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆131Updated 4 years ago
- SimCSE在中文上的复现,有监督+无监督☆280Updated 10 months ago
- experiments of some semantic matching models and comparison of experimental results.☆163Updated 2 months ago
- 中文问题句子相似度计算比赛及方案汇总☆305Updated 5 years ago
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆104Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆111Updated 2 years ago
- 基于词汇信息融合的中文NER模型☆170Updated 3 years ago
- 中文NER的那些事儿☆320Updated 2 years ago
- bert pytorch模型微调用于的多标签文本分类☆137Updated 6 years ago
- ☆278Updated 3 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆354Updated last year
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆398Updated last year
- 基于pytorch_bert的中文多标签分类☆94Updated 4 years ago
- ☆135Updated 4 years ago
- 基于GlobalPointer的实体/关系/事件抽取☆151Updated 3 years ago
- Keyphrase or Keyword Extraction 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained La…☆433Updated 5 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆109Updated 2 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆117Updated 5 years ago
- SimCSE在中文任务上的简单实验☆605Updated 2 years ago
- 科大讯飞2020事件抽取挑战赛第一名解决方案&完整事件抽取系统☆537Updated 5 years ago
- multi-label-classification-4-event-type☆138Updated 2 years ago
- 以词为基本单位的中文BERT☆472Updated 4 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆127Updated 2 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆109Updated 3 years ago
- “万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案☆138Updated 5 years ago
- CoSENT、STS、SentenceBERT☆171Updated 11 months ago
- 北京航空航天大学大数据高精尖中心自然语言处理研究团队对信息抽取领域的调研。包括实体识别,关系抽取,属性抽取等子任务,每类子任务分别对学术界和工业界进行调研。☆469Updated 3 years ago
- 法研杯2021类案检索赛道三等奖方案☆49Updated 3 years ago
- 利用huggingface实现文本 分类☆58Updated 3 years ago