MrQuJL / area-hot-product
分析各区域热门商品 —— 使用 Flume 采集数据,MapReduce 或 Spark Core 进行数据清洗,最后使用 Hive 或 Spark SQL 进行数据的分析和处理。
☆14Updated 6 years ago
Alternatives and similar repositories for area-hot-product:
Users that are interested in area-hot-product are comparing it to the libraries listed below
- 基于Hadoop、Spark、FLUME、HIVE等大数据组件搭建的一个分布式集群环境下的电影推荐及日志分析平台☆16Updated 2 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆46Updated 6 years ago
- 此项目是对大学生的一卡通消费数据、图书借阅记录和图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用…☆62Updated 4 months ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- 使用Hadoop、Spark等实现的大数据平台项目☆22Updated 2 years ago
- Spark大型项目实战:电商用户行为分析大数据平台\Spark大型项目实战:电商用户行为分析大数据平台(史上第一套高端大数据项目实战课程)☆30Updated last year
- 基于Spark2.2新闻网大数据实时系统项目☆60Updated 5 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆50Updated 2 years ago
- 电商大数据项目-推荐系统(java和scala语言)☆200Updated last year
- 最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban…☆122Updated 3 years ago
- 牛客网上的sql实战题解,准备面试大数据开发,数据分析同学可以进来学习☆21Updated 2 years ago
- spark大数据大型电商项目☆13Updated 4 years ago
- Spark电影数据分析实战,利用spark开发针对用户观影等历史行为数据进行采集、分析和展示☆18Updated 4 years ago
- 基于spark的外卖大数据平台分析系统☆43Updated 6 years ago
- 大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)☆13Updated 2 years ago
- 基于spark的大数据分析心脏病信息 更多详细说明在我的博客//zhuozhuo233.github.io/☆15Updated 3 years ago
- 拉勾网+BOSS直聘网招聘信息大数据分析项目_数据获取+数据清洗+数据分析+数据可视化☆158Updated 2 years ago
- 本次数据分 析基于阿里云天池数据集(用户行为数据集),使用转化漏斗,AARRR模型,对常见电商分析指标,包括转化率,PV,UV,留存率,复购率等进行分析,分析过程中使用python进行数据清洗及可视化。☆28Updated 4 years ago
- 大数据招聘信息分析平台☆42Updated 8 years ago
- 电商大数据分析平台——静态页面模板☆80Updated 4 years ago
- 027 基于Spark协同过滤的农产品个性推荐系统-设计展示 python pyspark hadoop django scrapy vue element-plus 协同过滤 算法 通过scrapy爬虫框架抓取“惠农网”网站上的农产品数据 前台用户通过登陆注册后进入系统 用…☆9Updated last year
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆117Updated 4 years ago
- 电商平台数据仓库搭建☆126Updated 3 weeks ago
- 大数据项目实战之基于Spark2.X的新闻话题的实时统计分析☆27Updated 2 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆32Updated 7 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆16Updated 2 years ago
- 基于Python语言的Spark数据处理分析案例集锦(PySpark)☆27Updated 3 years ago
- 基于hadoop生态搭建的电商数据仓库,整体功能架构包含数据采集、数仓搭建、数据导出、数据可视化等☆54Updated 2 years ago
- 基于Spark企业级用户画像项目☆115Updated last year
- 基于spark的电商用户行为分析系统☆13Updated last year