onyas / bigData-in-dockerLinks
Make it easier to learn big data
☆32Updated 4 years ago
Alternatives and similar repositories for bigData-in-docker
Users that are interested in bigData-in-docker are comparing it to the libraries listed below
Sorting:
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 3 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆170Updated 8 years ago
- 分布式数据仓库最佳实践☆58Updated 7 years ago
- docker构建大数据开发学习环境☆51Updated 9 years ago
- 基于spark、mahout和spring boot构建的推荐系统☆130Updated last week
- elasticsearch+hbase海量数据查询,支持千万数据秒回查询☆282Updated 9 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆31Updated 7 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆326Updated 10 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 8 years ago
- 基于spark streaming和kafka,hbase的日志统计分析系统☆265Updated 8 years ago
- 使用spring-boot-spark的一个样例☆11Updated 7 years ago
- spark全示例代码(java、scala) Spark most full instance code DEMO (java、scala)☆85Updated 5 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆22Updated 3 years ago
- kafka spark hbase 日志统计☆82Updated 9 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆170Updated 3 years ago
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆35Updated 7 years ago
- 项目实战:Hadoop生态圈☆31Updated 7 years ago
- Flink代码实例☆123Updated 5 years ago
- Flink 案例代码☆43Updated 3 years ago
- 如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Spark SQL、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse、Kudu等不同实现方案之间的表现,…☆286Updated 7 years ago
- 【bigdata】spirngboot+spark 脚手架+相关实例☆22Updated 3 years ago
- Spark Streaming监控平台,支持任务部署与告警、自启动☆129Updated 7 years ago
- 一个基于Spring Boot的Storm开发手脚架,开箱即用!集成读写Kafka、写Redis、写MySQL示例。☆59Updated 7 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆216Updated 2 years ago
- 分布式大数据SQL查询可视化界面!☆68Updated 10 years ago
- 基于Drools的规则引擎☆136Updated 10 years ago
- datax web。datax中的web配置界面没有集成在一起开源出来,此为web端配置项目。☆99Updated 6 years ago
- hbase+solr实现hbase的二级索引☆46Updated 2 weeks ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 11 years ago