liguozhong / demo_11.11_storm-spark-hadoopLinks
hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离 线报表)第三阶段(大规模订单即席查询,和多维度查询) 第四阶段(数据挖掘和图计算)
☆323Updated 10 years ago
Alternatives and similar repositories for demo_11.11_storm-spark-hadoop
Users that are interested in demo_11.11_storm-spark-hadoop are comparing it to the libraries listed below
Sorting:
- 基于spark streaming和kafka,hbase的日志统计分析系统☆263Updated 7 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 8 years ago
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆189Updated 6 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆212Updated last year
- elasticsearch+hbase海量数据查询,支持千万数据秒回查询☆281Updated 8 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆86Updated 7 years ago
- MapReduce Demo☆399Updated 9 years ago
- kafka spark hbase 日志统计☆80Updated 8 years ago
- 基于spark、mahout和spring boot构建的推荐系统☆131Updated 2 months ago
- The project of data cleaning and data analysis based on MapReduce.☆62Updated 7 years ago
- Based on hbase 1.2.4 , multi-methods to operate hbase using Java.☆56Updated 8 years ago
- Spark Streaming+Flume+Kafka+HBase+Hadoop+Zookeeper实现实时日志分析统计;SpringBoot+Echarts实现数据可视化展示☆514Updated 6 years ago
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆176Updated 7 years ago
- 推荐项目(实时推荐和离线推荐)☆252Updated 7 years ago
- Flink代码实例☆122Updated 4 years ago
- Spark Streaming监控平台,支持任务部署与告警、自启动☆128Updated 7 years ago
- 项目实战:Hadoop生态圈☆31Updated 7 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 3 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆162Updated 3 years ago
- 一个开源、成体系的大数据学习教程。spark学习 hadoop hive hbase flink教程 linux 从入门到精通☆279Updated 5 years ago
- 关于大数据的面试题,包括hadoop、hbase、hive、spark、storm、zookeeper、kafka、flume、logstash、redis、ELK、ETL、算法等等,持续更新中☆443Updated 6 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆116Updated 3 years ago
- 使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。☆231Updated 4 years ago
- hive仓库元数据管理系统☆166Updated 8 years ago
- 基于Docker构建的Hadoop开发测试环境,包含Hadoop,Hive,HBase,Spark☆305Updated 6 years ago
- Real-Time Analysis Integration with Kafka in Apache Spark’s Structured Streaming☆59Updated 7 years ago
- BigData Project 大数据项目由浅入深☆644Updated 7 years ago
- docker构建大数据开发学习环境☆50Updated 8 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago