ruoyu-chen / hadoop-docker
基于Docker构建的Hadoop开发测试环境,包含Hadoop,Hive,HBase,Spark
☆301Updated 5 years ago
Alternatives and similar repositories for hadoop-docker:
Users that are interested in hadoop-docker are comparing it to the libraries listed below
- 基于spark streaming和kafka,hbase的日志统计分析系统☆261Updated 7 years ago
- 如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Spark SQL、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse、Kudu等不同实现方案之间的表现,…☆281Updated 6 years ago
- ☆271Updated 6 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆320Updated 10 years ago
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆177Updated 7 years ago
- Flink代码实例☆122Updated 4 years ago
- Spark Streaming监控平台,支持任务部署与告警、自启动☆128Updated 7 years ago
- Spark 学习之路,包含 Spark Core,Spark SQL,Spark Streaming,Spark mllib 学习笔记☆146Updated 6 years ago
- 一键搭建zookeeper/hadoop/hive/hbase/sqoop/kafka/spark/kylin☆34Updated 5 years ago
- elasticsearch+hbase海量数据查询,支持千万数据秒回查询☆281Updated 8 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆211Updated last year
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆85Updated 7 years ago
- hadoop,hbase,storm,spark,etc..☆160Updated 5 years ago
- azkaban小助手,增加任务web配置、远程脚本调用、报警扩展、跨项目依赖等功能。☆119Updated 7 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统☆476Updated 2 years ago
- flink简易使用教程,结合官方仓库的example样例,结合常见场景,使用flink的基本功能☆111Updated 2 years ago
- hadoop各组件使用,持续更新☆901Updated 2 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 2 years ago
- 分布式数据仓库最佳实践☆57Updated 6 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 7 years ago
- Apache Flink 中文文档☆385Updated last year
- 封装sparkstreaming动态调节batch time(有数据就执行计算); 支持运行过程中增删topic; 封装sparkstreaming 1.6 - kafka 010 用 以支持 SSL。☆180Updated 3 years ago
- An ad hoc query service based on the spark sql engine.(基于spark sql引擎的即席查询服务)☆383Updated last year
- 关于大数据的面试题,包括hadoop、hbase、hive、spark、storm、zookeeper、kafka、flume、logstash、redis、ELK、ETL、算法等等,持续更新中☆442Updated 6 years ago
- Learning Apache spark,including code and data .Most part can run local.☆602Updated 3 years ago
- ☆133Updated 7 years ago
- CDH安装手册☆86Updated last year
- 大数据组件 All-in-One 的 Dockerfile☆96Updated 4 months ago
- Deploy bigdata platform using docker compose. Big data components include hadoop, hive, hbase, presto, flink, es, kafka, etc.☆139Updated 6 months ago
- Real-Time Analysis Integration with Kafka in Apache Spark’s Structured Streaming☆60Updated 7 years ago