linuxvae / movie_spiderLinks
爬取知乎某个问题下面的所有问题,并正则匹配获取关键数据,输出成txt,并输出词云图
☆14Updated 4 years ago
Alternatives and similar repositories for movie_spider
Users that are interested in movie_spider are comparing it to the libraries listed below
Sorting:
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要 …☆81Updated 5 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆168Updated 7 years ago
- 基于python对国内政府开放数据平台数据质量分析☆15Updated 7 years ago
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆118Updated 7 years ago
- 全唐诗数据挖掘,分析☆86Updated 8 years ago
- 学习python过程中的知识积累☆64Updated 5 years ago
- self complemented BaiduIndexSpyder based on Selenium , index image decode and num image transfer,基于关键词的历时百度搜索指数自动采集☆42Updated 7 years ago
- 新闻爬虫,爬取新浪、搜狐、新华网即时财经新闻。☆190Updated 5 years ago
- 为了实现百度的为你写诗 2.0 版的论文 “Chinese Poetry Generation with Planning based Neural Network” , 先自己爬取古诗词网站,然后对诗歌鉴赏进行自然语言处理,构建知识图谱作为基础的知识积累。最后实现“为你写…☆23Updated 7 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆109Updated 7 years ago
- 获取知乎、V2EX、微博、贴吧、IT之家、豆瓣、虎扑、天涯、GitHub等网站热门头条的多线程爬虫,使用Flask聚合网站。☆34Updated 2 years ago
- 基于python语言,对小红书热门旅游城市武汉的热门景点、美食等进行数据数据可视化分析☆25Updated 2 years ago
- 机器学习数据集导航☆81Updated 5 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 7 years ago
- 基于ARIMA时间序列的销量预测模型,实际预测准确率达90%以上,内含有测试记录和实际上线效果。☆112Updated 6 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated 4 months ago
- 文本分类是指在 给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- 使用pyltp的工具,基于中文依存句法的四大名著人物情节分析系统。分为整体分析和章节分析两大模块,实现了人物篇幅分析,故事发生地分析,主要人物情绪变化分析,人物互动情况分析.☆94Updated 8 years ago
- 极简爬虫工作流☆43Updated 2 years ago
- 文本对关系比较 - 语义相似度、字面相似度、文本蕴含等等☆55Updated 5 years ago
- 洛杉矶房价预测☆18Updated 5 years ago
- 深圳链家租房数据分析☆44Updated 5 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆35Updated 5 years ago
- 对QQ群的聊天记录进行分析,得出此群情感,话题演化等☆21Updated 8 years ago
- 全国房价数据爬取+分析☆111Updated 7 years ago
- Python实现经典分类回归、关联分析、聚类以及推荐算法等☆213Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆118Updated 7 years ago
- 中文语料库-每日自动更新 版 ── 语料文件☆170Updated 5 years ago
- 深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者。 全书分为15个章节,近20万字。由于水平有限,书中不妥之处恳请广大读者批评指正。 未完待续............ 如有意合作,联系sc…☆267Updated 7 years ago
- 比赛中的通用方法和模板☆16Updated 5 years ago