linuxvae / movie_spiderLinks
爬取知乎某个问题下面的所有问题,并正则匹配获取关键数据,输出成txt,并输出词云图
☆14Updated 3 years ago
Alternatives and similar repositories for movie_spider
Users that are interested in movie_spider are comparing it to the libraries listed below
Sorting:
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆80Updated 4 years ago
 - 利用文本挖掘技术进行新闻热点关注问题分析☆166Updated 6 years ago
 - 新闻爬虫,爬取新浪、搜狐、新华网即时财经新闻。☆188Updated 5 years ago
 - 基于python对国内政府开放数据平台数据质量分析☆15Updated 7 years ago
 - Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆117Updated 7 years ago
 - 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated last month
 - 创建《Python自然语言处理》学习代码的中文注释版本。☆87Updated 4 years ago
 - 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆109Updated 7 years ago
 - Python 网络爬虫实例☆53Updated 3 years ago
 - 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆118Updated 7 years ago
 - 本爬虫用于爬取知乎网站问题、回答的相关字段信息,问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段,及对该问题回答的内容,作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。☆42Updated 6 years ago
 - self complemented BaiduIndexSpyder based on Selenium , index image decode and num image transfer,基于关键词的历时百度搜索指数自动采集☆42Updated 7 years ago
 - 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆411Updated 3 years ago
 - 各种爬虫---大众点评,amazon,安居客,58,1688,养老网,人人贷,和讯网股票,豆瓣,无讼案例,爱回收...☆130Updated 5 years ago
 - 爬取今日头条,网易,腾讯等新闻,并建立简单的搜索引擎☆637Updated last year
 - 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
 - 2018/2019/校招/春招/秋招/算法/机器学习(Machine Learning)/深度学习(Deep Learning)/自然语言处理(NLP)/C/C++/Python/面试笔记☆106Updated 7 years ago
 - machine learning examples in commercial area, based on Python, ideas from 《Python大数据分析与机器 学习商业案例实战》☆31Updated 4 years ago
 - 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆34Updated 5 years ago
 - 获取滚动新闻☆56Updated 6 years ago
 - 基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI …☆437Updated last year
 - 全唐诗数据挖掘,分析☆86Updated 7 years ago
 - 对QQ群的聊天记录进行分析,得出此群情感,话题演化等☆21Updated 7 years ago
 - 慕课网公开课:数据预处理☆75Updated 6 years ago
 - 机器学习数据集导航☆75Updated 5 years ago
 - 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆98Updated 7 years ago
 - 利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),对新闻文本做相似度计算,训练新闻分类模型☆19Updated 7 years ago
 - 📉 金融文本情感分析模型☆350Updated 7 years ago
 - 基于情感字典的情感分析模型☆41Updated 8 years ago
 - spss统计分析☆24Updated 6 years ago