Henryhaohao / Xiecheng_Comment
Xiecheng_Comment多线程Threading爬取携程的丽江古城景点评论并生成词云
☆25Updated 5 years ago
Related projects: ⓘ
- 关于百度旅游、大众点评、驴妈妈、猫途鹰、携程的评论爬虫☆22Updated 6 years ago
- ☆64Updated this week
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- 携程旅游景点爬虫☆20Updated 5 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆102Updated 6 years ago
- ☆79Updated this week
- 对微博评论进行情感三分类(正面,中性,负面)☆16Updated 4 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆66Updated 3 years ago
- Scrapy 新浪微博搜索爬虫☆18Updated 5 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆155Updated 5 years ago
- Python爬取微博,采集的数据属性如下:微博内容,是否原创,转发内容,发布时间,转发数,评论数,点赞数,设备源,微博ID。对于抓取到的页面源码分析不同属性对应的标签分别提取数据。最后将采集到的数据保存为csv格式,供数据分析使用。☆32Updated 5 years ago
- ☆48Updated this week
- ☆105Updated 3 years ago
- 用python判断微博用户的影响力☆51Updated 8 years ago
- 本项目是采用Python语言结合机器学习中的常用算法来对微博传播过程中的转发进行预测。☆11Updated 6 years ago
- 微博关键词搜索爬虫、微博爬虫、链家房产爬虫、新浪新闻爬虫、腾讯招聘爬虫、招投标爬虫☆36Updated 5 years ago
- 马蜂窝游记、景点信息爬虫,热门景点热力图☆18Updated 3 years ago
- 汽车之家口碑网某车型的评论数据情感分析☆28Updated 5 years ago
- 基于selenium的轻量级新浪微博爬虫,可实现:1.后台自动爬取微博搜索结果/2.按时间段爬取搜索结果/3.爬取用户基本信息☆48Updated 4 years ago
- 微博用户关系爬虫☆12Updated 6 years ago
- 大众点评商家评论爬虫☆47Updated 4 years ago
- 我们对一个知乎社交网络进行了基础属性、度分布、节点影响力、社区检测等分析操作,得到了一些有趣的结论(补充),发现了知乎社交网络的哪些特性(具体写出来)。之后,我们又做了一个知乎兴趣内容推荐系统,对 用户的兴趣偏好进行分析,为用户推荐话题、问题、答主等相关内容,取得了不错的效果…☆27Updated 5 years ago
- 淘宝爬虫命令行版,指定爬取淘宝商品和评论,利用selenium爬取商品信息,requests爬取评论信息。☆87Updated 4 years ago
- 游客旅行评论爬虫 + 词频分析 + 情感分析(使用达观数据API)☆22Updated 6 years ago
- 摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)☆11Updated 5 years ago
- 本软件包括对于百度外卖平台的原始评论采集、评论情感计算并分类展示、以及对于用户打分、服务评分等结构化数据进行可视化三个主要功能模块。本软件的主要技术特征在于改造和使用了网络爬虫,来为本软件提供实时数据采集的能力,并将评论情感极性分析和用户打分相结合,在首先考虑用户打分的情况…☆40Updated 3 years ago
- 针对微博的话题聚类实现☆49Updated 8 years ago
- self complemented BaiduIndexSpyder based on Selenium , index image decode and num image transfer,基于关键词的历时百度搜索指数自动采集☆40Updated 6 years ago
- 新闻爬虫,爬取新浪、搜狐、新华网即时财经新闻。☆166Updated 4 years ago
- 一个基于SnowNLP的新浪微博评论情感分析工具☆47Updated 6 years ago