xiaoshuwen1995 / Text-Similarity-Match
实现功能:新输入一段文本,与已有数据进行相似度进行比较,返回TOP10的文本。主要实现方法:jieba中文分词、gensim、TF-IDF词汇重要性、cosine余弦相似度。
☆11Updated 4 years ago
Alternatives and similar repositories for Text-Similarity-Match:
Users that are interested in Text-Similarity-Match are comparing it to the libraries listed below
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- 多标签文本分类☆53Updated 5 years ago
- 在bert模型的pre_training基础上进行text_cnn文本分类☆78Updated 5 years ago
- 基于Pytorch实现的一些经典自然语言处理模型中文短文本分类任务,包含TextCNN,TextRCNN,FastText,BERT,ROBERT以及ERNIE☆53Updated 4 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆127Updated 6 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 6 years ago
- Reproducing the paper — Deep Short Text Classification with Knowledge Powered Attention☆102Updated 4 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 2 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆194Updated 7 months ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆80Updated 3 years ago
- Use deep models including BiLSTM, ABCNN, ESIM, RE2, BERT, etc. and evaluate on 5 Chinese NLP datasets: LCQMC, BQ Corpus, ChineseSTS, OCN…☆76Updated 2 years ago
- 参考NER,基于BERT的电商评论观点挖掘和情感分析☆41Updated 5 years ago
- bert文本多分类(情感分析)、bert-bilstm-crf序列标注任务(快递地址的序列标注任务)☆31Updated 3 years ago
- multi-label-classification-4-event-type☆133Updated 2 years ago
- 本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。☆66Updated 3 years ago
- 利用bert预训练模型生成句向量或词向量☆27Updated 4 years ago
- 支持百度竞赛数据的中文事件抽取,支持ace2005数据的英文事件抽取,本人将苏神的三元组抽取算法中的DGCNN改成了事件抽取任务,并将karas改成了本人习惯使用的pytorch,在数据加载处考虑了各种语言的扩展☆48Updated 4 years ago
- 将bert模型应用到问答系统中来,一者学习知识图谱的基本操作,二简单搭建问答系统的基本框架,三将词向量、bert模型实践应用☆59Updated 5 years ago
- 一个简单的中文事件抽取模型,触发词和实体联合标注识别,同时判定实体角色。☆74Updated 4 years ago
- 篇章级事件抽取☆20Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆101Updated last year
- 关系抽取个人实战总结以及开源工具包使用☆56Updated 6 years ago
- ☆42Updated last year
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆47Updated 4 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆76Updated 5 years ago
- 实体链接demo☆65Updated 6 years ago
- TensorFlow code and pre-trained models for BERT☆58Updated 3 years ago
- ☆88Updated 3 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification,seq2seq,attention,beam search☆32Updated 2 years ago