ChenHuabin321 / zhihuSpiderLinks
本爬虫用于爬取知乎网站问题、回答的相关字段信息,问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段,及对该问题回答的内容,作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。
☆43Updated 6 years ago
Alternatives and similar repositories for zhihuSpider
Users that are interested in zhihuSpider are comparing it to the libraries listed below
Sorting:
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆93Updated 6 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆39Updated 5 years ago
- 微博关键词搜索爬虫、微博爬虫、链家房产爬虫、新浪新闻爬虫、腾讯招聘爬虫、招投标爬虫☆37Updated 6 years ago
- 一些 Python 爬虫练习:bilibili用户信息爬取、下载工具、房天下新房二手房redis分布式爬虫、简书全站文章爬取、观察者网站首页新闻爬取、淘宝模拟登陆、淘宝搜索商品信息爬取及可视化展示、知乎问题回答信息爬取\抖音无水印视频下载☆140Updated 5 months ago
- Python爬取微博,采集的数据属性如下:微博内容,是否原创,转发内容,发布时间,转发数,评论数,点赞数,设备源,微博ID。对于抓取到的页面源码分析不同属性对应的标签分别提取数据。最后将采集到的数据保存为csv格式,供数据分析使用。☆35Updated 6 years ago
- 基于微博的数据挖掘与社交舆情分析☆213Updated 6 years ago
- 知乎爬虫,用于爬取问题和对应的回答☆28Updated 2 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆45Updated 7 years ago
- 基于selenium的轻量级新浪微博爬虫,可实现:1.后台自动爬取微博搜索结果/2.按时间段爬取搜索结果/3.爬取用户基本信息☆51Updated 5 years ago
- 大众点评商家评论爬虫☆48Updated 5 years ago
- 豆瓣电影(短评)爬虫☆52Updated 6 years ago
- 京东,淘宝,苏宁,亚马逊爬虫抓取商品信息并分析数据☆183Updated 2 years ago
- recruit 招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条 2.数据处理: 采用pandas对爬取的数据进行清洗和处理 2.数据分析: …☆142Updated 3 years ago
- 豆瓣Top250影评爬虫(用于情感分析语料)☆22Updated 2 years ago
- 微博评论爬虫+评论html tag 清洗+中文词云生成☆28Updated 6 years ago
- 用python判断微博用户的影响力☆53Updated 9 years ago
- 爬取微博用户关注列表,生成好友关系网,绘制社交关系图谱☆39Updated 2 years ago
- Python编写的爬虫框架以及特定网站的信息抓取☆17Updated 7 years ago
- Weibo Spider Using Scrapy☆137Updated 7 years ago
- bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化☆169Updated 2 years ago
- 无cookie版微博爬虫,可以连续爬取一个或多个新浪微博用户信息、用户微博及其微博评论转发。☆158Updated 3 years ago
- B站弹幕、评论爬虫+词云生成☆50Updated 5 years ago
- 对淘宝(天猫)的评论爬取并进行简单分析☆27Updated 5 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 本软件包括对于百度外卖平台的原始评论采集、评论情感计算并分类展示、以及对于用户打分、服务评分等结构化数据进行可视化三个主要功能模块。本软件的主要技术特征在于改造和使用了网络爬虫,来为本软件提供实时数据采集的能力,并将评论情感极性分析和用户打分相结合,在首先考虑用户打分的情况…☆45Updated 4 years ago
- 淘宝模拟登录,销售数据,评论数据,商品评分数据爬取(学数据分析的可以用于获取淘宝电商的销售数据,学爬虫的可以参考一下思路和方法),由于评论数据比较大,暂时没办法上传,大家也可以直接用下面的代码爬取☆45Updated 5 years ago
- 【爬虫】基于Scrapy开发的微博(评论、转发、点赞)爬虫,可以批量抓取。☆27Updated 8 years ago
- 贴吧API 微信智能控制 贴吧舆情监控 关键词分析 热点分析 python3 爬虫☆103Updated 4 years ago
- 关于百度旅游、大众点评、驴妈妈、猫途鹰、携程的评论爬虫