dataaug / zhihu-spiderLinks
知乎爬虫,用于爬取问题和对应的回答
☆29Updated 2 years ago
Alternatives and similar repositories for zhihu-spider
Users that are interested in zhihu-spider are comparing it to the libraries listed below
Sorting:
- 知乎爬虫☆33Updated last year
- 知乎爬虫,可以爬取知乎上特定问题下的所有回答、单个回答,特定用户的所有回答、文章,话题精华,收藏夹,专栏,文章☆68Updated 6 years ago
- 无cookie版微博爬虫,可以连续爬取一个或多个新浪微博用户信息、用户微博及其微博评论转发。☆161Updated 3 years ago
- 🐛 新浪微博社交网络分析&虚假用户检测。衍生应用:生成个性化新浪微博用户报告。☆108Updated 5 years ago
- 情感分析,微博情感分析,微博水军检测,水军检测,营销粉检测,僵尸粉检测,微博爬虫☆74Updated 4 years ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆404Updated last week
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆31Updated 2 years ago
- 本爬虫用于爬取知乎网站问题、回答的相关字段信息,问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段,及对该问题回答的内容,作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。☆42Updated 7 years ago
- 能够采集微博博主,博文,评论,分析博主信息,博文话题等,构建社交网络,同时对数据和网络进行分析的工具.☆24Updated 6 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆414Updated 3 years ago
- 微博的爬虫,从个人主页开始 爬博文和评论,用的scrapy 框架☆36Updated 4 months ago
- 微 博爬虫,一个基于Scrapy框架的轻量微博爬虫,Sina Weibo Spider☆138Updated 2 years ago
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆100Updated 3 years ago
- bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化☆174Updated 2 years ago
- 一个知乎话题、问题、用户信息的爬虫☆30Updated 5 months ago
- 携程评论爬虫,使用线程池来爬取热门景区评论,简单易用。一键爬取任意省的所有热门景区并分析评论数据,可视化展示。☆137Updated 6 months ago
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆74Updated 2 years ago
- 本项目是一个微博爬虫项目,旨在通过微博的mid获取到其对应的所有点赞、转发、评论与二级评论的相关数据。☆54Updated 3 years ago
- bilibili(B站)视频评论爬虫,爬取多级评论,用户信息,评论信息等内容☆96Updated last year
- 爬取微博关键词相关信息,有远程开发需求可联系,有需要合作加微信: ytouching☆30Updated 9 months ago
- 大模型相关实践记录☆157Updated 7 months ago
- 该资源为调用大连理工情感词典实现的情感分析和情绪分类,并与SnowNLP进行对比。基础性文章,希望对您有所帮助~☆103Updated 5 years ago
- 爬取bilibili视频下的评论,最新出品!!!⚠本代码只适用于学习,做其他事情概不负责!!!☆65Updated 3 months ago
- 对b站弹幕、评论进行爬虫,然后使用Word2Vec模型将其转化为词向量进行分析☆33Updated 3 years ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆38Updated 7 months ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆81Updated 4 years ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆168Updated 3 years ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆50Updated 3 years ago
- 爬取关注列表中微博账号的微博☆195Updated 3 weeks ago
- 爬虫学习。实战:微博各种类型爬虫,唯品会商品,淘宝商品等☆82Updated last year