HAOzj / gensim_LDA
基于gensim模块,训练LDA(Latent Dirichlet Allocation)模型,用于计算长短文本的相似度.
☆12Updated 4 years ago
Alternatives and similar repositories for gensim_LDA
Users that are interested in gensim_LDA are comparing it to the libraries listed below
Sorting:
- 利用bert预训练模型生成句向量或词向量☆27Updated 4 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 6 years ago
- 使用Python进行自然语言处理相关实践,如新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析☆51Updated 5 years ago
- 利用Doc2Vec计算文本相似度☆138Updated 7 years ago
- 多标签文本分类☆54Updated 5 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆39Updated 5 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆43Updated 5 years ago
- 中文文本聚类☆122Updated 2 years ago
- 基于word2vec预训练词向量; textCNN 模型 ;charCNN 模型 ;Bi-LSTM模型;Bi-LSTM + Attention 模型 ;Transformer 模型 ;ELMo 预训练模型 ;BERT 预训练模型的文本分类项目☆119Updated 4 years ago
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- Clustering text with Bert☆56Updated 4 years ago
- 基于CNN、RNN、GCN、BERT的中文文本 分类☆43Updated last year
- 文本聚类、tfidf、lda、doc2vec+kmeans等各种方法实现☆23Updated 5 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆93Updated 6 years ago
- BTM in python☆73Updated 7 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 5 years ago
- 在bert模型的pre_training基础上进行text_cnn文本分类☆78Updated 5 years ago
- 基于情感词典的文本情感极性分析☆27Updated 7 years ago
- 利用ALBERT实现文本二分类,判别是否属于政治上的出访类事件,提升模型训练和预测速度。☆74Updated 2 years ago