xiaoshuwen1995 / Text-Similarity-Match
实现功能:新输入一段文本,与已有数据进行相似度进行比较,返回TOP10的文本。主要实现方法:jieba中文分词、gensim、TF-IDF词汇重要性、cosine余弦相似度。
☆11Updated 4 years ago
Alternatives and similar repositories for Text-Similarity-Match:
Users that are interested in Text-Similarity-Match are comparing it to the libraries listed below
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- 利用bert预训练模型生成句向量或词向量☆28Updated 4 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆25Updated 2 years ago
- 这段代码会根据用户定义的正则表达式规则从文本中抽取属性三元组,我用它完成知识图谱构建的一个环节,使用方法写在README中,欢迎交流和指正!☆11Updated 3 years ago
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 3 years ago
- 在bert模型的pre_training基础上进行text_cnn文本分类☆78Updated 4 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括 数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 5 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆33Updated last year
- 一个简单的中文事件抽取模型, 触发词和实体联合标注识别,同时判定实体角色。☆72Updated 4 years ago
- bert文本多分类(情感分析)、bert-bilstm-crf序列标注任务(快递地址的序列标注任务)☆31Updated 3 years ago
- 从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Informatio…☆89Updated 5 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆75Updated 5 years ago
- 多标签文本分类☆53Updated 5 years ago
- 嵌套命名实体识别 Nested NER☆19Updated 3 years ago
- 基于pytorch+bert的中文事件抽取☆70Updated 2 years ago
- 基于知识图谱的问答系统☆134Updated 4 years ago
- bert pytorch模型微调用于的多标签文本分类☆128Updated 5 years ago
- 中文关系抽取☆135Updated 6 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆126Updated 6 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆194Updated 6 months ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 基于Pytorch的命名实体识别框架,支持LSTM+CRF、Bert+CRF、RoBerta+CRF等框架☆82Updated last year
- 本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。☆66Updated 3 years ago
- 多模型中文cnews新闻文本分类☆53Updated 4 years ago
- NLP关系抽取:序列标注、层叠式指针网络、Multi-head Selection、Deep Biaffine Attention☆100Updated 3 years ago
- 基于Pytorch实现的一些经典自然语言处理模型中文短文本分类任务,包含TextCNN,TextRCNN,FastText,BERT,ROBERT以及ERNIE☆53Updated 4 years ago
- 细粒度的情感分析(属性词提取,句法依存分析)☆35Updated 2 years ago
- 使用三种方法实现中文抽取式自动文摘,分别是TextRank算法、MMR(最大边界相关算法)算法和TextRank+Word2vec方法;最后使用Rouge评价方法,将生成的摘要和标准摘要进行比较,输出p、r、f值。☆35Updated 4 years ago
- 基于Pytorch的BERT-IDCNN-BILSTM-CRF中文实体识别实现☆88Updated 2 years ago