Foxgeek36 / ZhihuSpider
知乎爬虫,可以爬取知乎上特定问题下的所有回答、单个回答,特定用户的所有回答、文章,话题精华,收藏夹,专栏,文章
☆54Updated 5 years ago
Alternatives and similar repositories for ZhihuSpider:
Users that are interested in ZhihuSpider are comparing it to the libraries listed below
- 知乎爬虫,用于爬取问题和对应的回答☆27Updated 2 years ago
- B站弹幕、评论爬虫+词云生成☆49Updated 4 years ago
- 知乎爬虫☆29Updated 10 months ago
- 本爬虫用于爬取知乎网站问题、回答的相关字段信息,问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段,及对该问题回答的内容,作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。☆41Updated 6 years ago
- 一些 Python 爬虫练习:bilibili用户信息爬取、下载工具、房天下新房二手房redis分布式爬虫、简书全站文章爬取、观察者网站首页新闻爬取、淘宝模拟登陆、淘宝搜索商品信息爬取及可视化展示、知乎问题回答信息爬取\抖音无水印视频下载☆126Updated 3 weeks ago
- 使用 Scrapy 写成的 JK 爬虫,图片源自哔哩哔哩、Tumblr、Instagram,以及微博、Twitter☆115Updated 4 years ago
- bilibili(B站)视频评论爬虫,爬取多级评论,用户信息,评论信息等内容☆74Updated 7 months ago
- B站用户精确信息爬虫 Bilibili爬取精确粉丝数、获赞数、播放数、阅读数☆22Updated last year
- 发送邮件,文字识别,获取天气数据,哔哩哔哩弹幕,网易云音乐评论 ,turtle画图,爬虫,贝壳二手房房源数据,二手房可视化,51JOB,猫眼Top榜,微博文章,微博评论,微博热搜榜,CBA数据,批量下载图片,可视化,冰墩墩,佩奇,插画,火柴人,兔子,樱花树,玲娜贝儿,生日蛋…☆207Updated 2 months ago
- 一个基于关键词爬虫生成词云的网络内容可视化工具,可爬取百度、谷歌、必应、知乎、微博、微信公众平台☆35Updated 5 years ago
- 爬虫学习。实战:微博各种类型爬虫,唯品会商品,淘宝商品等☆82Updated last year
- 百度贴吧分布式爬虫,用于贴吧数据挖掘。从贴吧维度和用户维度进行数据分析☆76Updated 5 years ago
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆64Updated last year
- 无cookie版微博爬虫,可以连续爬取一个或多个新浪微博用户信息、用户微博及其微博评论转发。☆153Updated 2 years ago
- B站3亿用户信息爬虫(mid号,昵称,性别,关注,粉丝,等级)☆19Updated 6 years ago
- 本项目是一个微博爬虫项目,旨在通过微博的mid获取到其对应的所有点赞、转发、评论与二级评论的相关数据。☆50Updated 2 years ago
- 爬取b站视频信息,供大数据分析用户喜好。使用scrapy-redis分布式,在16核服务器上实现抓取2500万条/天。可长期部署抓取,实现视频趋势分析☆65Updated 6 years ago
- 爬取智联招聘网数据,并对其进行招聘数据可视化,爬虫,Data visualization,Django2,echarts☆125Updated last year
- 微博的爬虫,爬个人主页,用的scrapy 框架☆23Updated 9 months ago
- 📺 B 站全站视频信息爬虫☆639Updated 5 years ago
- 小红书笔记爬虫☆139Updated 3 years ago
- 知乎回答、专栏及评论数据全覆盖爬取☆18Updated last year
- Bilibili 爬虫合集☆35Updated 5 years ago
- 对b站弹幕、评论进行爬虫,然后使用Word2Vec模型将其转化为词向量进行分析☆29Updated 2 years ago
- 爬取关注列表中微博账号的微博☆186Updated 8 months ago
- 爬取知网页面的文献信息,并存在Excel内☆18Updated 6 years ago
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆29Updated last year
- Bilibili视频数据爬虫 精确爬取完整的b站视频数据,包括标题、up主、up主id、精确播放数、历史累计弹幕数、点赞数、投硬币枚数、收藏人数、转发人数、发布时间、视频时长、视频简介、作者简介和标签☆88Updated last year
- B站视频评论爬虫 Bilibili完整爬取评论数据,包括一级评论、二级评论、昵称、用户ID、发布时间、点赞数☆329Updated 11 months ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆370Updated 2 years ago