本项目以数据采集、处理、分析及数据可视化为项目流程,实现百万级电影数据离线处理与计算。功能包括python爬虫,Matplotlib、Echarts数据可视化、Mapreduce、hive数据统计、情感分析、词图云、电影票房与评分预测
☆247Nov 14, 2021Updated 4 years ago
Alternatives and similar repositories for Bigdata-Movie
Users that are interested in Bigdata-Movie are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- Spark电影数据分析实战,利用spark开发针对用户观影等历史行为数据进行采集、分析和展示☆21Feb 3, 2021Updated 5 years ago
- 豆瓣电影网与艺恩票房网的电影数据采集与分析及可视化☆37Jun 4, 2020Updated 6 years ago
- ⭐️ 课程项目_基于toshare的机器量化分析(含数据采集+预处理与建模+模拟交易与回测+可视化)☆13Oct 6, 2019Updated 6 years ago
- 基于猫眼电影数据和SVR回归器的电影票房预测系统, 包括数据爬取, 特征分析以及数据预测☆16May 16, 2020Updated 6 years ago
- 本项目利用Python的scrapy框架爬取链家网的上海市租房信息,利用pandas、numpy、matplotlib、seaborn、folium 、wordcloud 等库进行数据分析和可视化,通过one-hot编码和文本特征提取出120个训练特征,搭建3层神经网络对上…☆77Dec 10, 2020Updated 5 years ago
- Deploy to Railway using AI coding agents - Free Credits Offer • AdUse Claude Code, Codex, OpenCode, and more. Autonomous software development now has the infrastructure to match with Railway.
- 毕业设计python电影数据可视化☆13Jun 1, 2023Updated 3 years ago
- python爬虫 豆瓣电影Top250数据分析与可视化(应用Flask框架、Echarts、WordCloud等技术)☆100Mar 27, 2025Updated last year
- [JLU 2023 豆瓣+猫眼]电影数据可视化及票房影响因素分析与预测☆54Feb 25, 2023Updated 3 years ago
- 豆瓣探索者这个作品是依托豆瓣这个平台制作的一个数据分析系统。本作品使用Python的BeautifulSoup库爬取了电影、图书、音乐这三个方向的数据存入MongoDB的NoSQL数据库,使用Pyecharts库得到了诸如单部电影评分分布的一维数据图、评分与评论数关系的二维…☆86Apr 4, 2021Updated 5 years ago
- 计算机毕业设计Python+Spark知识图谱视频推荐系统 短视频推荐系统 视频流量预测系统 短视频爬虫 视频数据分析 视频可视化 视频大数据 大数据毕业设计 大数据毕设☆18Jun 28, 2023Updated 2 years ago
- Python基于Scrapy豆瓣电影爬虫及Django电影展示网站设计毕业源码案例设计☆22May 7, 2023Updated 3 years ago
- 基于Python的南京二手房数据采集及可视化分析☆677Jun 4, 2020Updated 6 years ago
- Django+Python+Echarts对招聘数据进行可视化分析☆116Apr 21, 2023Updated 3 years ago
- NoSql链家房源数据爬虫可视化:本项目爬取链家729个房源数据,并将其数据可视化,将使用到Python、mongodb等编程技术,利用requests爬虫,re正则,proxy_pool(代理ip池)和fake useragent(虚假请求头)防反爬对网页进行爬取,再通过…☆51Apr 30, 2025Updated last year
- Managed hosting for WordPress and PHP on Cloudways • AdManaged hosting for WordPress, Magento, Laravel, or PHP apps, on multiple cloud providers. Deploy in minutes on Cloudways by DigitalOcean.
- “2020 Bilibili 百大UP主” 数据分析与可视化-Python数据可视化☆15Feb 25, 2022Updated 4 years ago
- 基于Hadoop、Spark、FLUME、HIVE等大数据组件搭建的一个分布式集群环境下的电影推荐及日志分析平台☆18Jan 6, 2023Updated 3 years ago
- 一个利用机器学习做数据挖掘实战的小项目,参考书《Python数据分析与挖掘实战》☆29Jul 23, 2018Updated 7 years ago
- 基于豆瓣电影爬虫及Spark数据分析可视化设计毕业源码案例设计☆19Apr 30, 2023Updated 3 years ago
- 基于spark、hive等大数据分布式工具的京东平台手机商品分析项目☆15Feb 13, 2022Updated 4 years ago
- 使用python抓取微博数据并对微博文本分析和可视化,LDA(树图)、关系图、词云、时间趋势(折线图)、热度地图、词典情感分析(饼图和3D柱状图)、词向量神经网络情感分析、tfidf聚类、词向量聚类、关键词提取、文本相似度分析等☆951Aug 28, 2020Updated 5 years ago
- 该项目是一个歌曲偏好分析系统,它可以抓取特定用户的网易云音乐数据,进行相关处理,然后在网页上将数据可视化。它还包括根据用户的喜好向他们推荐艺术家和歌单,以及分析艺术家的听众用户情况。项目中存在大量私货。使用HTML,CSS,JS,Python,Flask☆53Jun 21, 2023Updated 2 years ago
- 京东评论爬虫,包含对数据的采集、清洗、可视化、分析等过程,作为数据库课程设计项目☆340Dec 22, 2024Updated last year
- Python+Spark+Hadoop大数据基于用户画像电影推荐系统毕业源码案例设计☆24May 1, 2023Updated 3 years ago
- 1-Click AI Models by DigitalOcean Gradient • AdDeploy popular AI models on DigitalOcean Gradient GPU virtual machines with just a single click. Zero configuration with optimized deployments.
- 基于python的春节电影信息爬取与数据可视化分析 毕业设计项目☆39May 23, 2023Updated 3 years ago
- Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的☆16Nov 8, 2015Updated 10 years ago
- Python基于Django城市PM2.5空气质量数据可视化分析毕业源码案例设计☆32Apr 29, 2023Updated 3 years ago
- 数据挖掘常用算法:关联分析Apriori算法,数据分类决策树算法,数据聚类K-means算法☆25Jun 16, 2019Updated 6 years ago
- 使用python,从知网上爬取相关的数据,并进行数据分析,涉及到pycharm和jupyter notebook☆30Mar 24, 2021Updated 5 years ago
- 该资源主要总结AI文本挖掘、知识发现、数据挖掘、图书情报和知识图谱相关论文。重点以国内和国外优秀论文为主,希望能帮助到大家,也欢迎大家补充。☆21Oct 9, 2021Updated 4 years ago
- 实战项目:Python入门到进阶、Python可视化、Python自动化办公、高效工具、商业数据分析、爬虫、大数据☆42Sep 2, 2021Updated 4 years ago
- 爬虫+数据分析实战项目☆593Mar 4, 2019Updated 7 years ago
- 大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目☆944Oct 9, 2018Updated 7 years ago
- Managed Kubernetes at scale on DigitalOcean • AdDigitalOcean Kubernetes includes the control plane, bandwidth allowance, container registry, automatic updates, and more for free.
- 《Python预测之美-数据分析与算法实战》代码维护☆21Feb 26, 2021Updated 5 years ago
- 基于spark+mysql+springboot+echarts的豆瓣电影大数据分析可视化项目☆14Sep 2, 2024Updated last year
- 爬虫+数据分析可视化。爬取的网站有:知乎,淘宝,新浪微博,微信公众号,猫途鹰,今日头条,虎嗅网,人人都是产品经理,猫眼电影☆76Mar 3, 2019Updated 7 years ago
- 基于BOSS直聘“数据分析师”职位信息的爬虫实现、数据分析、数据可视化及机器学习预测与结果分析。☆96Oct 23, 2018Updated 7 years ago
- Python数据分析实战项目汇总~☆392Apr 2, 2020Updated 6 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆22Mar 2, 2022Updated 4 years ago
- 本系统是我的毕业设计项目,题目为“基于用户画像的电影推荐系统的设计与实现”。主要是以Django作为基础框架,采用MTV模式,数据库使用MongoDB、MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户…☆743Jun 2, 2026Updated last week