本项目以数据采集、处理、分析及数据可视化为项目流程,实现百万级电影数据离线处理与计算。功能包括python爬虫,Matplotlib、Echarts数据可视化、Mapreduce、hive数据统计、情感分析、词图云、电影票房与评分预测
☆233Nov 14, 2021Updated 4 years ago
Alternatives and similar repositories for Bigdata-Movie
Users that are interested in Bigdata-Movie are comparing it to the libraries listed below
Sorting:
- 3个小项目分别是利用 Python 实现报表自动化、某连锁超市、某银行数据分析,展示了问题分解、数据清洗、数据分析与可视化的过程。☆48Jul 20, 2019Updated 6 years ago
- 爬虫+数据分析实战项目(基于python)☆15Oct 12, 2019Updated 6 years ago
- [豆瓣+猫眼]电影数据可视化及票房影响因素分析与预测☆53Feb 25, 2023Updated 3 years ago
- 使用机器学习算法的电影推荐系统以及票房预测系统☆335Feb 19, 2021Updated 5 years ago
- python爬虫 豆瓣电影Top250数据分析与可视化(应用Flask框架、Echarts、WordCloud等技术)☆99Mar 27, 2025Updated 11 months ago
- 基于Python的南京二手房数据采集及可视化分析☆672Jun 4, 2020Updated 5 years ago
- 利用用户画像数据、物品元数据、用户行为数据为特征构建推荐系统,使用CB和CF算法做推荐召回,使用 Redis数 据库做缓存处理,结合机器学习LR算法推荐排序,达到粗排、精排效果,实现推荐引擎搭建。☆46Feb 10, 2021Updated 5 years ago
- 船!☆14Apr 26, 2025Updated 10 months ago
- 使用python抓取微博数据并对微博文本分析和可视化,LDA(树图)、关系图、词云、时间趋势(折线图)、热度地图、词典情感分析(饼图和3D柱状图)、词向量神经网络情感分析、tfidf聚类、词向量聚类、关键词提取、文本相似度分析等☆946Aug 28, 2020Updated 5 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆19Mar 2, 2022Updated 4 years ago
- 豆瓣探索者这个作品是依托豆瓣这个平台制作的一个数据分析系统。本作品使用Python的BeautifulSoup库爬取了电影、图书、音乐这三个方向的数据存入MongoDB的NoSQL数据库,使用Pyecharts库得到了诸如单部电影评分分布的一维数据图、评分与评论数关系的二维…☆86Apr 4, 2021Updated 4 years ago
- 使用python,从知网上爬取相关的数据,并进行数据分析,涉及到pycharm和jupyter notebook☆28Mar 24, 2021Updated 4 years ago
- NoSql链家房源数据爬虫可视化:本项目爬取链家729个房源数据,并 将其数据可视化,将使用到Python、mongodb等编程技术,利用requests爬虫,re正则,proxy_pool(代理ip池)和fake useragent(虚假请求头)防反爬对网页进行爬取,再通过…☆47Apr 30, 2025Updated 10 months ago
- 基于python的春节电影信息爬取与数据可视化分析 毕业设计项目☆39May 23, 2023Updated 2 years ago
- 基于Pytorch框架的多源图像像素级融合,包含多种网络结构。☆16Jan 20, 2021Updated 5 years ago
- “2020 Bilibili 百大UP主” 数据分析与可视化-Python数据可视化☆15Feb 25, 2022Updated 4 years ago
- 利用python,进行数据爬虫、数据处理、数据分析和数据可视化,是一个比较好的练手小项目☆15Mar 7, 2018Updated 7 years ago
- 基于Hadoop、Spark、FLUME、HIVE等大数据组件搭建的一个分布式集群环境下的电影推荐及日志分析平台☆18Jan 6, 2023Updated 3 years ago
- 京东评论爬虫,包含对数据的采集、清洗、可视化、分析等过程,作为数据库课程设计项目☆333Dec 22, 2024Updated last year
- 基于Python的豆瓣Top250排行榜影片数据爬取和分析毕业论文+开题报告+答辩PPT+视频讲解+项目源码及运行结果☆15Jul 14, 2022Updated 3 years ago
- Python基于Django城市PM2.5空气质量数据可视化分析毕业源码案例设计☆31Apr 29, 2023Updated 2 years ago
- 基于豆瓣电影爬虫及Spark数据分析可视化设计毕业源码案例设计☆19Apr 30, 2023Updated 2 years ago
- flask 公交数据可视化分析☆16Jul 11, 2022Updated 3 years ago
- 计算机毕业设计Python+Spark知识图谱视频推荐系统 短视频推荐系统 视频流量预测系统 短视频爬虫 视频数据分析 视频可视化 视频大数据 大数据毕业设计 大数据毕设☆19Jun 28, 2023Updated 2 years ago
- 该资源主要总结AI文本挖掘、知识发现、数据挖掘、图书情报和知识图谱相关论文。重点以国内和国外优秀论文为主,希望能帮助到大家,也欢迎大家补充。☆21Oct 9, 2021Updated 4 years ago
- 1421基于python网易新闻scrapy爬虫数据分析与可视化大屏展示-毕业源码案例设计☆20Apr 3, 2024Updated last year
- 最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban…☆143Nov 8, 2021Updated 4 years ago
- 基于python实现,通过协同过滤算法实现的一个简单的豆瓣电影推荐系统☆55Nov 17, 2020Updated 5 years ago
- 本系统是我的毕业设计项目,题目为“基于用户画像的电影推荐系统的设计与实现”。主要是以Django作为基础框架,采用MTV模式,数据库使用MongoDB、MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户…☆740Dec 17, 2024Updated last year
- Python数据分析实战项目汇总~☆391Apr 2, 2020Updated 5 years ago
- 基于BOSS直聘“数据分析师”职位信息的爬虫实现、数据分析、数据可视化及机器学习预测与结果分析。☆97Oct 23, 2018Updated 7 years ago
- 2017 DF,CCF大数据与计算智能大赛——“中印对峙事件舆情分析”赛题全网数据☆25Apr 22, 2018Updated 7 years ago
- 数据挖掘常用算法:关联分析Apriori算法,数据分类决策树算法,数据聚类K-means算法☆25Jun 16, 2019Updated 6 years ago
- 基于改进YOLOv8与DeepSeek微调的智能交通监控与问答系统☆19Apr 16, 2025Updated 10 months ago
- 本科毕业设计,基于python的图像复制粘贴篡改识别软件。☆26Sep 13, 2021Updated 4 years ago
- python数据分析与数据挖掘实例☆64Oct 17, 2023Updated 2 years ago
- 快速风格迁移学习实践☆26May 16, 2018Updated 7 years ago
- 基于python的影评数据爬取和分析研究(此项目用于毕业设计)☆28May 22, 2020Updated 5 years ago
- 一个数据分析项目,利用 Pandas 库进行数据预处理,缺少值填充,利用sklearn 模块建模并对多种农产品价格进行预测☆28Sep 19, 2025Updated 5 months ago