kiwirafe / xiangsi
中文文本相似度计算器
☆135Updated 5 months ago
Alternatives and similar repositories for xiangsi:
Users that are interested in xiangsi are comparing it to the libraries listed below
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆175Updated 2 years ago
- Minimal keyword extraction with BERT☆79Updated 3 years ago
- 短文本聚类预处理模块 Short text cluster☆274Updated 5 years ago
- Computing similarity of two sentences with google's BERT algorithm。利用Bert计算句子相似度。语义相似度计算。文本相似度计算。☆497Updated last year
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆200Updated 11 months ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 3 months ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆127Updated 3 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆114Updated last year
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆703Updated last year
- Pytorch-NLU,一个中文文本分类、序列标注工具包,支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Ptorch NLU, a Chinese text classification and sequ…☆340Updated 7 months ago
- An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com☆545Updated last year
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆203Updated 10 months ago
- experiments of some semantic matching models and comparison of experimental results.☆160Updated last year
- company name parser, extract company name brand. 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。☆86Updated 2 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆123Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆48Updated last week
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆91Updated 3 years ago
- mirror of dongxiexidian/Chinese☆292Updated 6 years ago
- 基于 BERT 模型的中文文本分类工具☆62Updated 2 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆49Updated 2 years ago
- Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。☆175Updated 3 months ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆159Updated 3 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆102Updated last year
- 大连理工大学情感词汇本体库及其他相关操作☆131Updated 7 years ago
- 中文自然语言推理与语义相似度数据集☆345Updated 3 years ago
- 基于pytorch_bert的中文多标签分类☆89Updated 3 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆118Updated 6 years ago
- 一个基于预训练的句向量生成工具☆136Updated last year
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆92Updated last year
- 中文关系抽取☆452Updated last year