JunfengDuan / word2vectorLinks
用百科数据和搜狗新闻数据训练word2vec模型
☆18Updated 7 years ago
Alternatives and similar repositories for word2vector
Users that are interested in word2vector are comparing it to the libraries listed below
Sorting:
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划 分,先拆后合,并将其效果与传统LDA…☆40Updated 6 years ago
- 嵌入Word2vec词向量的RNN+ATTENTION中文文本分类☆151Updated 4 years ago
- AI100竞赛:http://competition.ai100.com.cn/html/game_det.html?id = 24&tab = 1 的代码,主要用于文本分类,其中涉及CHI选择特征词,TFIDF计算权重,朴素贝叶斯,决策树,SVM,XGBoost等算法☆15Updated 6 years ago
- 以聚类算法、LDA主题模型、分类器为基础,完成对Twitter语料的基于地理位置的主题事件挖掘,并对主题事件进行细粒 度的情绪分析☆35Updated 6 years ago
- “神策杯”关键词提取☆7Updated 6 years ago
- Neural Relation Extraction implemented with LSTM in TensorFlow☆17Updated 7 years ago
- 使用word2vec进行中文词向量的 训练☆91Updated 7 years ago
- Improvement of RAKE Algorithm (Rapid Automatic keyword extraction)☆35Updated 7 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆136Updated 5 years ago
- 基于word2vec的关键词提取☆33Updated 6 years ago
- ☆131Updated 7 years ago
- Self complemented word embedding methods using CBOW,skip-Gram,word2doc matrix , word2word matrix ,基于CBOW、skip-gram、词-文档矩阵、词-词矩阵四种方法的词向量生成☆184Updated 7 years ago
- A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…☆243Updated 6 years ago
- ☆77Updated 7 years ago
- siamese lstm network for text similarity☆95Updated 8 years ago
- 该项目是短文本分类,目前应用于新闻标签的分类☆32Updated 8 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评 论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆94Updated 6 years ago
- 使用分层注意力机制 HAN + 多任务学习 解决 AI Challenger 细粒度用户评论情感分析 。https://challenger.ai/competition/fsauor2018☆58Updated 6 years ago
- 中文的word2vec以及doc2vec模型,使用维基百度的数据训练。供大家参考☆47Updated 7 years ago
- 使用pytorch和京东某商品评价数据集,采用不同模型对文本进行分类☆25Updated 7 years ago
- 基于语义的中文文本关键词提取算法☆20Updated 4 years ago
- 使用gensim训练word2vec模型并对训练得到词向量聚类☆15Updated 7 years ago
- 搜狗新闻语料训练的word2vec中文模型☆68Updated 7 years ago
- NLP 以及相关的学习实践☆40Updated 3 years ago
- CSDN博客的关键词提取算法,融合TF,IDF,词性,位置等 多特征。该项目用于参加2017 SMP用户画像测评,排名第四,在验证集中精度为59.9%,在最终集中精度为58.7%。启发式的方法,通用性强。☆30Updated 7 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- 使用深度学习方法对IMDB电影评价做情感分析,使用的方法分别为:MLP、BiRNN、BiGRU+Attention Model☆226Updated 8 years ago
- CNN, LSTM, NBOW, fasttext 中文文本分类☆121Updated 5 years ago
- NLP的一些小例子,如:文本分类、文本纠错、关键词提取、自动摘要等☆23Updated 6 years ago
- 主要是实现nlp常用网络以及结果比较,各模型的优劣势,如:FastText,TextCNN,TextRNN,TextRCNN,BiLSTM,Seq2seq,BERT,Transformer,ELMo以及Attention机制等等。☆45Updated 6 years ago