ChenHuabin321 / zhihuSpider
本爬虫用于爬取知乎网站问题、回答的相关字段信息,问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段,及对该问题回答的内容,作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。
☆41Updated 6 years ago
Alternatives and similar repositories for zhihuSpider:
Users that are interested in zhihuSpider are comparing it to the libraries listed below
- 豆瓣电影(短评)爬虫☆52Updated 6 years ago
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆29Updated last year
- 本项目是一个微博爬虫项目,旨在通过微博的mid获取到其对应的所有点赞、转发、评论与二级评论的相关数据。☆52Updated 2 years ago
- 基于selenium的轻量级新浪微博爬虫,可实现:1.后台自动爬取微博搜索结果/2.按时间段爬取搜索结果/3.爬取用户基本信息☆49Updated 5 years ago
- 爬虫项目☆69Updated 6 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆37Updated 5 years ago
- 基于微博的数据挖掘与社交舆情分析☆212Updated 6 years ago
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆89Updated 6 years ago
- 微博超级话题爬虫,微博词频统计+情感分析+简单分类,新增肺炎超话爬取数据☆278Updated 4 years ago
- 网络舆情分析系统☆179Updated 9 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆74Updated 4 years ago
- 微博评论情感分析,爬虫,文本分类,Web。☆44Updated 2 years ago
- 一些 Python 爬虫练习:bilibili用户信息爬取、下载工具、房天下新房二手房redis分布式爬虫、简书全站文章爬取、观察者网站首页新闻爬取、淘宝模拟登陆、淘宝搜索商品信息爬取及可视化展示、知乎问题回答信息爬取\抖音无水印视频下载☆128Updated last month
- 微博话题简单分析,话题爬取、高频词获取、词云生成、情感值获取,python + selenium + jieba + snownlp + wordcloud☆31Updated 4 years ago
- 知乎爬虫,用于爬取问题和对应的回答☆28Updated 2 years ago
- 爬虫+数据分析可视化。爬取的网站有:知乎,淘宝,新浪微博,微信公众号,猫途鹰,今日头条,虎嗅网,人人都是产品经理,猫眼电影☆71Updated 6 years ago
- 情感分析,微博情感分析,微博水军检测,水军检测,营销粉检测,僵尸粉检测,微博爬虫☆68Updated 4 years ago
- 本软件包括对于百度外卖平台的原始评论采集、评论情感计算并分类展示、以及对于用户打分、服务评分等结构化数据进行可视化三个主要功能模块。本软件的主要技术特征在于改造和使用了网络爬虫,来为本软件提供实时数据采集的能力,并将评论情感极性分析和用户打分相结合,在首先考虑用户打分的情况…☆45Updated 4 years ago
- 微博的爬虫,爬个人主页,用的scrapy 框架☆25Updated last week
- 爬取智联招聘网数据,并对其进行招聘数据可视化,爬虫,Data visualization,Django2,echarts☆133Updated last year
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆42Updated 6 years ago
- recruit 招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布 式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条 2.数据处理: 采用pandas对爬取的数据进行清洗和处理 2.数据分析: …☆140Updated 2 years ago
- 用python判断微博用户的影响力☆52Updated 8 years ago
- Python爬取微博,采集的数据属性如下:微博内容,是否原创,转发内容,发布时间,转发数,评论数,点赞数,设备源,微博ID。对于抓取到的页面源码分析不同属性对应的标签分别提取数据。最后将采集到的数据保存为csv格式,供数据分析使用。☆33Updated 5 years ago
- 爬取微博用户关注列表,生成好友关系网,绘制社交关系图谱☆40Updated 2 years ago
- 微博评论爬虫+评论html tag清洗+中文词云生成☆27Updated 6 years ago
- 知网爬虫cnkispider,输入关键字爬取知网检索数据☆33Updated 7 years ago
- 基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化 的批量查询 POI …☆421Updated 4 months ago
- A web crawler for Sina, search and retrieve microblogs that contain certain keywords 一个简单的python爬虫实践,爬取包含关键词的新浪微博☆98Updated 6 years ago
- 一个基于关键词爬虫生成词云的网络内容可视化工具,可爬取百度、谷歌、必应、知乎、微博、微信公众平台☆35Updated 5 years ago