liuhuanyong / TopicCluster
A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文档主题聚类,输入多篇文档,输出每个主题的关键词与相应文本,可用于主题发现与热点分析等应用,如历时话题建模,评论画像等。
☆237Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for TopicCluster
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆133Updated 5 years ago
- Keyword extraction based on TF-IDF on specific corpus. 基于特定语料库的TF-IDF的中文关键词提取☆152Updated 5 years ago
- Event monitor based on online news corpus including event storyline and analysis,基于给定事件关键词,采集事件资讯,对事件进行挖掘和分析。☆152Updated 5 years ago
- Syntax and Ruler-Based Doc sentiment analysis 基于依存句法规则的篇章级情感分析demo☆103Updated 5 years ago
- Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…☆140Updated 6 years ago
- gensim-word2vec+svm文本情感分析☆101Updated 7 years ago
- BDCI 2018 汽车行业用户观点主题及情感识别 决赛一等奖方案☆430Updated 5 years ago
- AI-Challenger Baseline 细粒度用户评论情感分析☆225Updated 6 years ago
- 使用句法依存分析抽取事实三元组☆333Updated 8 years ago
- several methods for text classification☆187Updated 6 years ago
- 利用Doc2Vec计算文本相似度☆135Updated 6 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆211Updated 6 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情 感分析、命名实体识别,以及部分数据集等☆195Updated 5 years ago
- 结合python一起学习自然语言处理 (nlp): 语言模型、HMM、PCFG、Word2vec、完形填空式阅读理解任务、朴素贝叶斯分类器、TFIDF、PCA、SVD☆235Updated 6 years ago
- Sequential Event Experiment based on Travel note crawled from XieCheng,基于50W携程出行游记的采集与顺承事件图谱构建.☆181Updated 5 years ago
- AI Challenger 2018 细粒度用户评论情感分析,排名17th,基于Aspect Level 思路的解决方案☆327Updated 6 years ago
- 根据自己搭的 LTP 服务器,实现:分词、词性标注、命名实体识别、依存句法分析、语义角色标、命名实体的抽取:人名,地名,机构名、三元组的抽取:主谓宾,动宾关系,介宾关系,(实体1,关系,实体2)☆143Updated 7 years ago
- 个人代码/项目仓库(具体请看子目录下的README.md)。自取请注明出处,尊重原创,O(∩_∩)O谢谢☆45Updated 6 years ago
- 细粒度情感分析repository1:Wai Mai Opinion Miner,细粒度情感分析系统GUI demo。☆107Updated 8 years ago
- 嵌入Word2vec词向量的RNN+ATTENTION中文文本分类☆150Updated 4 years ago
- self complement of Sentence Similarity compute based on cilin, hownet, simhash, wordvector,vsm models,基于同义词词林,知网,指纹,字词向量,向量空间模型的句子相似度计算。☆359Updated 5 years ago
- 基于ltp的简单评论观点抽取模块☆117Updated 6 years ago
- 神策杯2018高校算法大师赛(中文关键词提取)第二名代码方案☆305Updated 4 years ago
- 今日头条中文新闻文本(多层)分类数据集☆392Updated 3 years ago
- 基于tensorflow 实现的用textcnn方法做情感分析的项目,有数据,可以直接跑。☆344Updated 4 years ago
- BiLstm+CNN+CRF 法律文档(合同类案件)领域分词(100篇标注样本)☆384Updated 6 years ago
- 评论上的情感分析:主题与情感词抽取☆82Updated 4 years ago
- 新闻上的文本分类:机器学习大乱斗☆177Updated 5 years ago