keyucui / weibo_topic_analyzeLinks
关注于某个大的话题,按关键字搜索总话题,分为各个分话题,在每个分话题下爬取多条热门微博及其评论数据,保证内容和评论的多样性
☆18Updated 4 years ago
Alternatives and similar repositories for weibo_topic_analyze
Users that are interested in weibo_topic_analyze are comparing it to the libraries listed below
Sorting:
- 一个基于SnowNLP的新浪微博评论情感分析工具☆50Updated 7 years ago
- 基于关键词搜索结果的微博爬虫☆31Updated 6 years ago
- 微博评论爬取及nlp情感分析☆20Updated 7 years ago
- 基于新浪微博数据的情感极性分析☆58Updated 6 years ago
- 京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、☆80Updated 6 years ago
- 根据关键词爬取微博内容并进行情感分析☆16Updated 5 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- 基于情感字典的情感分析模型☆41Updated 8 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆182Updated 6 years ago
- 疫情背景下,基于情感词典和机器学习对新闻和微博评论的情感分析☆32Updated 4 years ago
- 计算新闻文本类情感分析(采用TF-IDF,余弦距离,情感依存等算法)☆58Updated 7 years ago
- 微博情感分析 中文 八分类 贝叶斯☆18Updated 6 years ago
- 基于selenium的轻量级新浪微博爬虫,可实现:1.后台自动爬取微博搜索结果/2.按时 间段爬取搜索结果/3.爬取用户基本信息☆51Updated 5 years ago
- 多线程爬取电商评论数据,进行情感分析并通过web页面展示效果☆11Updated 4 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆164Updated 6 years ago
- 数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)☆18Updated 4 years ago
- 新浪微博#新冠疫情话题 舆情分析与话题热度预测☆20Updated 4 years ago
- 微博情感分析☆30Updated 7 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- 基于情感词典的文本情感极性分析☆27Updated 8 years ago
- 微博超级话题爬虫,微博词频统计+情感分析+简单分类,新增肺炎超话爬取数据☆284Updated 4 years ago
- 微博评论舆论分析,包括部分数据初级处理☆22Updated 4 years ago
- 新浪微博转发社交网络分析——Python版☆20Updated 9 years ago
- 以聚类算法、LDA主题模型、分类器为基础,完成对Twitter语料的基于地理位 置的主题事件挖掘,并对主题事件进行细粒度的情绪分析☆35Updated 6 years ago
- Python爬取微博,采集的数据属性如下:微博内容,是否原创,转发内容,发布时间,转发数,评论数,点赞数,设备源,微博ID。对于抓取到的页面源码分析不同属性对应的标签分别提取数据。最后将采集到的数据保存为csv格式,供数据分析使用。☆35Updated 6 years ago
- 爬取热门微博评论并进行数据分析、nlp情感分析☆324Updated 6 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆121Updated 6 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- 爬取新浪微博数据并可视化分析☆39Updated 4 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技 术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago