wolf-song-ml / bi-etlLinks
大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)
☆14Updated 3 years ago
Alternatives and similar repositories for bi-etl
Users that are interested in bi-etl are comparing it to the libraries listed below
Sorting:
- 大数据招聘信息分析平台☆46Updated 9 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆55Updated 7 years ago
- 最好的大数据项目。《Titan数 据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban…☆142Updated 4 years ago
- 电商大数据分析平台——静态页面模板☆84Updated 5 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆122Updated 3 years ago
- 基于Spark2.2新闻网大数据实时系统项目☆61Updated 6 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆35Updated 8 years ago
- 基于spark的外卖大数据平台分析系统☆47Updated 7 years ago
- 电商大数据项目-推荐系统(java和scala语言)☆204Updated 2 years ago
- 大数据企业实训项目:基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我…☆140Updated 7 years ago
- 本人毕业设计课题为《互联网大数据时代的酒店预订平台 设计与实现》,由Leme34/fun+Leme34/fun-app+Leme34/fun-backend三个项目构成,项目以及全部组件使用Docker搭建,全套Hadoop+Hive+Kafka+Spark+ElasticS…☆26Updated last year
- 拉勾网+BOSS直聘网招聘信息大数据分析项目_数据获取+数据清洗+数据分析+数据可视化☆172Updated 3 years ago
- 使用Hadoop、Spark等实现的大数据平台项目☆30Updated 3 years ago
- 本项目旨在建立一个基于大数据处理的大学生就业方向分析预测系统,通过爬虫 技术获取各大公司和著名招聘网站的大量招聘信息,然后将获取的数据进行清洗分类后储存在数据库中,最后从大学生的就业角度出发,通过算法分析数据,建立一个帮助大学生明确就业方向与社会需求的平台☆125Updated 7 years ago
- Spark大型项目实战:电商用户行为分析大数据平台\Spark大型项目实战:电商用户行为分析大数据平台(史上第一套高端大数据项目实战课程)☆34Updated 2 years ago
- 电商平台数据仓库搭建☆139Updated last year
- 此项目是对大学生的一卡通消费数据、图书借阅记录和 图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用…☆71Updated last year
- 共享单车综合管控大数据分析平台☆19Updated 3 years ago
- 基于Spark2.x新闻网大数据实时分析可视化系统项目☆534Updated 6 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 3 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆115Updated 3 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆63Updated 7 years ago
- 基于spark streaming+flume+kafka+hbase的实时日志处理分析系统(分为控制台版本和基于springboot、Echarts等的Web UI可视化版本)☆39Updated 2 years ago
- 数仓实时项目☆10Updated 6 years ago
- 基于hadoop生态搭建的电商数据仓库,整体功能架构包含数据采集、数仓搭建、数据导出、数据可视化等☆63Updated 3 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆57Updated 3 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆138Updated 5 years ago
- 基于Hadoop的视频收视率分析,毕设项目☆65Updated 7 months ago
- 大数据实践项目 Hadoop、Spark、Kafka、Hbase、Flink.....☆541Updated 6 years ago