xiaoshuwen1995 / Text-Similarity-MatchLinks
实现功能:新输入一段文本,与已有数据进行相似度进行比较,返回TOP10的文本。主要实现方法:jieba中文分词、gensim、TF-IDF词汇重要性、cosine余弦相似度。
☆11Updated 5 years ago
Alternatives and similar repositories for Text-Similarity-Match
Users that are interested in Text-Similarity-Match are comparing it to the libraries listed below
Sorting:
- 利用bert预 训练模型生成句向量或词向量☆27Updated 5 years ago
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 6 years ago
- 多标签文本分类☆53Updated 6 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆196Updated last year
- 使用两种方法(抽取式Textrank和概要式seq2seq)自动提取文本摘要☆219Updated 6 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆78Updated 6 years ago
- 本项目包含几种常用 NLP算法的实现:关键词(keyword)、命名实体(named entity)、自动摘要(abstract)、文本相似度比较(text similarity)等☆16Updated 4 years ago
- multi-label-classification-4-event-type☆138Updated 2 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆44Updated 6 years ago
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆49Updated 4 years ago
- 哈工大bert上fine turning ,中文人物关系抽取任务准确率0.97☆117Updated 6 years ago
- 短文本聚类预处理模块 Short text cluster☆281Updated 6 years ago
- 从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Informatio…☆93Updated 6 years ago
- 中文NER的那些事儿☆320Updated 2 years ago
- 将word2vec训练生成的词向量和BERT生成的词向量进行可视化对比☆15Updated 5 years ago
- bert文本多分类(情感分析)、bert-bilstm-crf序列标注任务(快递地址的序列标注任务)☆33Updated 4 years ago
- 中文命名实体识别NER。用keras实现BILSTM+CRF、IDCNN+CRF、BERT+BILSTM+CRF进行实体识别。结果当然是BERT+BILSTM+CRF最好啦。☆293Updated 6 years ago
- 基于Pytorch的命名实体识别框架,支持LSTM+CRF、Bert+CRF、RoBerta+CRF等框架☆90Updated 2 years ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆151Updated 3 years ago
- 本项目用于展示三元组抽取后形成的知识图谱,包括几本小说的实体关系,以及README.md,介绍这方面的一篇文章。☆202Updated 5 years ago
- bert pytorch模型微调用于的多标签文本分类☆137Updated 6 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆38Updated 7 months ago
- 基于BI-LSTM+CRF的中文命名实体识别 Pytorch☆406Updated 2 years ago
- 利用bert和textcnn解决多标签文本分类的demo。☆34Updated 3 years ago
- 中文文本聚类☆123Updated 3 years ago
- TensorFlow code and pre-trained models for BERT☆58Updated 4 years ago
- 中文wiki百科QA阅读理解问答系统,使用了CCKS2016数据的NER模型和CMRC2018的阅读理解模型,还有W2V词向量搜索,使用torchserve部署☆90Updated 4 years ago
- 在bert模型的pre_training基础上进行text_cnn文本分类☆79Updated 5 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 6 years ago
- 使用开源的Bert-as-Service预训练生成文档特征向量,基于k-means对COVID-19文献聚类,t-SNE可视化数据,通过LDA为每个簇生成主题关键词,画Bokeh图实现按簇、关键词搜索和筛选数据。☆19Updated 5 years ago