csuldw / AntSpider
1000万豆瓣电影/评论/名人/评分数据采集源码分享(内含千万电影数据集,可下载)
☆436Updated last year
Related projects: ⓘ
- 豆瓣电影爬虫☆315Updated last year
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆331Updated last year
- 基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI …☆400Updated last year
- 豆瓣电影/豆瓣读书 Scarpy 爬虫☆729Updated 9 months ago
- 借助Python抓取微博数据,并对抓取的数据进行情绪分析☆345Updated last year
- Social media (Weibo) comments analyzing toolbox in Chinese 微博评论分析工具, 实现功能: 1.微博评论数据爬取; 2.分词与关键词提取; 3.词云与词频统计; 4.情感分析; 5.主题聚类☆748Updated 5 years ago
- TOP250豆瓣电影短评:Scrapy 爬虫+数据清理/分析+构建中文文本情感分析模型☆859Updated 2 years ago
- 大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目☆708Updated 5 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆669Updated 11 months ago
- 微博超级话题爬虫,微博词频统计+情感分析+简单分类,新增肺炎超话爬取数据☆268Updated 4 years ago
- 使用python抓取微博数据并对微博文本分析和可视化,LDA(树图)、关系图、词云、时间趋势(折线图)、热度地图、词典情感分析(饼图和3D柱状图)、词向量神经网络情感分析、tfidf聚类、词向量聚类、关键词提取、文本相似度分析等☆803Updated 4 years ago
- 中文谣言数据☆692Updated 4 years ago
- 利用Python实现酒店评论的中文情感分析☆778Updated 6 years ago
- 中文微博语料库 情感二分类☆248Updated 4 years ago
- 與情分析系统,包括爬虫、数据清洗、文本摘要、主题分类、情感倾向性识别以及分析结果数据可视化☆315Updated 2 years ago
- 爬取关注列表中微博账号的微博☆176Updated 4 months ago
- 爬取豆瓣电影评论并对评论自动化分类☆34Updated 6 years ago
- ☆154Updated this week
- 爬取热门微博评论并进行数据分析、nlp情感分析☆298Updated 5 years ago
- 根据关键词抓取微博数据,再生成词云☆217Updated 6 years ago
- 长行的爬虫集合:微博、Twitter、玩加、知网、虎牙、斗鱼、B站、WeGame、猫眼、豆瓣、安居客、居理新房☆364Updated 3 years ago
- 该系列资源是Python疫情大数据分析,涉及网络爬虫、可视化分析、GIS地图、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。推荐大家结合作者CSDN博客阅读,武汉必胜、湖北必胜、中国必胜!☆389Updated 3 years ago
- Weibo-COV: A Large-Scale COVID-19 Social Media Dataset from Weibo☆573Updated 10 months ago
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Chinese sentiment analysis library, which supports counting the number of different emotiona…☆510Updated last year
- 中文商品评论短文本分类器,可用于情感分析☆343Updated 2 years ago
- 文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法☆2,385Updated 4 months ago
- 今日头条中文新闻文本(多层)分类数据集☆388Updated 3 years ago
- 利用微博热点话题舆情聚类分析☆249Updated 4 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆155Updated 5 years ago
- 爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱☆928Updated 4 years ago