dataaug / zhihu-spiderLinks
知乎爬虫,用于爬取问题和对应的回答
☆28Updated 2 years ago
Alternatives and similar repositories for zhihu-spider
Users that are interested in zhihu-spider are comparing it to the libraries listed below
Sorting:
- 知乎爬虫☆33Updated last year
- 情感分析,微博情感分析,微博水军检测,水军检测,营销粉检测,僵尸粉检测,微博爬虫☆75Updated 4 years ago
- 知乎爬虫,可以爬取知乎上特定问题下的所有回答、单个回答,特定用户的所有回答、文章,话题精华,收藏夹,专栏,文章☆68Updated 6 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆430Updated 3 years ago
- 一个知乎话题、问题、用户信息的爬虫☆32Updated 7 months ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训 练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆422Updated last month
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆31Updated 2 years ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆39Updated 8 months ago
- 无cookie版微博爬虫,可以连续爬取一个或多个新浪微博用户信息、用户微博及其微博评论转发。☆163Updated 3 years ago
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆74Updated 2 years ago
- 携程评论爬虫,使用线程池来爬取热门景区评论,简单易用。一键爬取任意省的所有热门景区并分析评论数据,可视化展示。☆141Updated 8 months ago
- 爬取微博关键词相关信息,有远程开发需求可联系,有需要合作加微信: ytouching☆30Updated 10 months ago
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆100Updated 4 years ago
- 微博的爬虫,从个人主页开始 爬博文和评论,用的scrapy 框架☆36Updated 5 months ago
- 关键词爬虫,根据关键词爬取微博、bilibili、知乎、今日头条、微信公众号、抖音、快手、YouTube的图片以及视频,并记录在excel 中,可用于构造深度学习的数据集☆122Updated 2 years ago
- 大模型相关实践记录☆157Updated 9 months ago
- bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化☆175Updated 2 years ago
- 本项目为中南财经政法大学统数学院“基于大语言模型的网络舆情态势感知研究——舆情评论的群体情绪与语义标签化分析”项目中期研究进展情况的部分程序文件☆22Updated last year
- 实现了简单的微博关键字爬虫+基于GPT 3.5模型的情感分析☆16Updated 2 years ago
- 一个新闻政策类爬虫项目,实现上万网站的实时监控、爬取、过滤、存储,具有高可用性和可扩展性。☆39Updated 3 years ago
- 爬取bilibili视频下的评论,最新出品!!!⚠本代码只适用于学习,做其他事情概不负责!!!☆66Updated 2 weeks ago
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆79Updated 9 months ago
- 微博爬虫,一个基于Scrapy框架的轻量微博爬虫,Sina Weibo Spider☆139Updated 2 years ago
- 本爬虫用于爬取知乎网站问题、回答的相关字段信息,问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段,及对该问题回答的内容,作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。☆42Updated 7 years ago
- 知网论文数据爬虫☆61Updated last year
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获 取☆36Updated 10 months ago
- 法律数据挖掘☆21Updated 4 years ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆170Updated 4 years ago
- 发送邮件,文字识别,获取天气数据,哔哩哔哩弹幕,网易云音乐评论 ,turtle画图,爬虫,贝壳二手房房源数据,二手房可视化,51JOB,猫眼Top榜,微博文章,微博评论,微博热搜榜,CBA数据,批量下载图片,可视化,冰墩墩,佩奇,插画,火柴人,兔子,樱花树,玲娜贝儿,生日蛋…☆221Updated last year
- selenium裁判文书网爬虫,文书网登录☆41Updated 3 years ago