JRhuang-96 / offline-hadoop
Hadoop离线计算. 使用hadoop MR 进行数据清洗,再使用shell 脚本执行hive 进行数据统计,维度分析
☆12Updated 6 years ago
Alternatives and similar repositories for offline-hadoop:
Users that are interested in offline-hadoop are comparing it to the libraries listed below
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- 大数据招聘信息分析平台☆42Updated 9 years ago
- 大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)☆13Updated 2 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 6 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆51Updated 2 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆15Updated 7 years ago
- 基于Spark2.2新闻网大数据实时系统项目☆60Updated 5 years ago
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆88Updated 6 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 9 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- 基于spark streaming+flume+kafka+hbase的实时日志处理分析系统(分为控制台版本和基于springboot、Echarts等的Web UI可视化版本)☆36Updated last year
- 对电影进行个性化推荐,基于Mahout框架实现的,使用的协同过滤算法☆33Updated 12 years ago
- 一个用Solr做企业应用内的搜索引擎的SpringBoot项目☆22Updated 6 years ago
- 基于flink的推荐系统,实时获取kafka数据进行数据清洗,离线计算进行文件读取(文件,mongodb,hbase)运用协同过滤算法进行计算得出推荐数据☆18Updated 2 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated 2 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 6 years ago
- Flink 案例开发数据清洗、数据报表☆52Updated 2 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 7 years ago
- Flink电商项目,实时统计分析 + 风控☆25Updated 4 years ago
- 一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目☆14Updated 7 years ago
- Spark混合推荐系统大数据监控平台☆11Updated 6 years ago
- AMS实时推荐系统☆17Updated 2 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Updated 6 years ago
- docker-hadoop-spark-hive 快速构建你的大数据环境☆21Updated 5 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆66Updated 8 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆74Updated 2 years ago
- 传统大数据分析工具以Hadoop、Spark为代表,集成了大量的技术框架, 对用户来说又重又笨又不灵活,难以维护和驾驭,国际和国内的敏捷型BI工具在对接时又面临性能、友好性、定制化能力弱的缺点。本项目独辟蹊径,以阿里开源的DataX为ETL工具,以列式数据库ClickHou…☆64Updated 4 years ago
- 基于标签的用户行为日志大数据分析系统☆20Updated 4 years ago