xiaoshuwen1995 / Text-Similarity-Match
实现功能:新输入一段文本,与已有数据进行相似度进行比较,返回TOP10的文本。主要实现方法:jieba中文分词、gensim、TF-IDF词汇重要性、cosine余弦相似度。
☆11Updated 4 years ago
Alternatives and similar repositories for Text-Similarity-Match
Users that are interested in Text-Similarity-Match are comparing it to the libraries listed below
Sorting:
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 6 years ago
- 多标签文本分类☆54Updated 5 years ago
- 在bert模型的pre_training基础上进行text_cnn文本分类☆78Updated 5 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆128Updated 6 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 3 years ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆80Updated 3 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆34Updated last year
- 实体链接demo☆65Updated 6 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆75Updated 5 years ago
- 利用bert预训练模型生成句向量或词向量☆27Updated 4 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆195Updated 9 months ago
- bert文本多分类(情感分析)、bert-bilstm-crf序列标注任务(快递地址的序列标注任务)☆32Updated 3 years ago
- Use deep models including BiLSTM, ABCNN, ESIM, RE2, BERT, etc. and evaluate on 5 Chinese NLP datasets: LCQMC, BQ Corpus, ChineseSTS, OCN…☆76Updated 3 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆141Updated 4 years ago
- 将bert模型应用到问答系统中来,一者学习知识图谱的基本操作,二简单搭建问答系统的基本框架,三将词向量、bert模型实践应用☆59Updated 5 years ago
- 中文关系抽取☆94Updated 3 years ago
- 中文关系抽取☆136Updated 6 years ago
- bert4keras NER☆26Updated 5 years ago
- bert pytorch模型微调用于的多标签文本分类☆133Updated 5 years ago
- 利用Doc2Vec计算文本相似度☆138Updated 7 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated 2 years ago
- Bert分类,语义相似度,获取句向量。☆64Updated 2 months ago
- 阿里天池赛:CCKS2021 运营商知识图谱推理问答☆48Updated 3 years ago
- 基于Pytorch实现的一些经典自然语言处理模型中文短文本分类任务,包含TextCNN,TextRCNN,FastText,BERT,ROBERT以及ERNIE☆53Updated 4 years ago
- 利用Bert获取中文字、词向量☆10Updated 3 years ago
- 限定领域的三元组抽取的一次尝试,本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。☆134Updated 2 years ago
- 从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Informatio…☆90Updated 5 years ago
- 一个简单的中文事件抽取模型,触发词和实体联合标注识别,同时判定实体角色。☆73Updated 4 years ago