JRhuang-96 / offline-hadoopLinks
Hadoop离线计算. 使用hadoop MR 进行数据清洗,再使用shell 脚本执行hive 进行数据统计,维度分析
☆12Updated 6 years ago
Alternatives and similar repositories for offline-hadoop
Users that are interested in offline-hadoop are comparing it to the libraries listed below
Sorting:
- 大数据招聘信息分析平台☆43Updated 9 years ago
- 大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)☆13Updated 2 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- Spark混合推荐系统大数据监控平台☆12Updated 7 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- 基于Spark2.2新闻网大数据实时系统项目☆61Updated 6 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Updated 7 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续 会上传CDH版本…☆52Updated 3 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆30Updated 7 years ago
- 基于spark的外卖大数据平台分析系统☆45Updated 6 years ago
- spark tutorial for big data mining。包括app流量运营分析、als推荐、smote样本采样、RFM客户价值分群、AHP层次分析客户价值得分、手机定位数据商圈挖掘、马尔可夫智能邮件预测、时序预测、关联规则、推荐电影好友等。☆40Updated 2 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆15Updated 7 years ago
- 基于web日志的个性化推荐学习平台☆34Updated 6 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- springboot项目使用脚手架,集成redis、mysql、pg,hbase、elasticsearch、kafka等常用组件功能☆21Updated 3 years ago
- AMS实时推荐系统☆17Updated 2 years ago
- Flink电商项目,实时统计分析 + 风控☆25Updated 5 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago
- 基于spark streaming+flume+kafka+hbase的实时日志处理分析系统(分为控制台版本和基于springboot、Echarts等的Web UI可视化版本)☆38Updated last year
- 微博数据展示与舆情监控系统后台API☆68Updated 7 years ago
- 基于springcloud开发的分布式美剧订阅系统(含爬虫)☆17Updated 2 years ago
- 以慕课网日志分析为例 进入大数据 Spark SQL 的世界☆15Updated 7 years ago
- 一个用Solr做企业应用内的搜索引擎的SpringBoot项目☆22Updated 6 years ago
- java学习及找工作记录。包括java基础,并发,数据库,算法,网络,设计模式,spring等参考书籍,jdk1.8源码,demo,笔面试题记录及阿里巴巴java开发手册等☆12Updated 4 years ago
- 数据可视化, 数据挖掘, 数据处理 ETL分析☆167Updated 3 years ago
- 基于flink的推荐系统,实时获取kafka数据进行数据清洗,离线计算进行文件读取(文件,mongodb,hbase)运用协同过滤算法进行计算得出推荐数据☆19Updated 3 years ago
- 论坛日志分析系统☆24Updated 7 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆52Updated 6 years ago