little-bit-shy / docker-hadoopLinks
一键搭建zookeeper/hadoop/hive/hbase/sqoop/kafka/spark/kylin
☆33Updated 6 years ago
Alternatives and similar repositories for docker-hadoop
Users that are interested in docker-hadoop are comparing it to the libraries listed below
Sorting:
- 基于SparkSQL的电影分析项目实战☆40Updated 5 years ago
- 关于 HDFS,Yarn,MapReduce,HBase,Hive,Pig,Sqoop,Flume,Zookeeper,MemCached,Redis,Storm,Scala,Spark,Flink 等大数据框架的学习笔记☆78Updated 6 years ago
- docker构建大数据开发学习环境☆51Updated 9 years ago
- 基于Docker构建的Hadoop开发测试环境,包含Hadoop,Hive,HBase,Spark☆307Updated 6 years ago
- 数据治理、数据质量检核/监控平台(Django+jQuery+MySQL)☆190Updated 3 years ago
- flink简易使用教程,结合官方仓库的example样例,结合常见场景,使用flink的基本功能☆115Updated 3 years ago
- Deploy bigdata platform using docker compose. Big data components include hadoop, hive, hbase, presto, flink, es, kafka, etc.☆149Updated last year
- 用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务☆107Updated 2 years ago
- spark全示例代码(java、scala) Spark most full instance code DEMO (java、scala)☆85Updated 5 years ago
- Flink 案例开发数据清洗、数据报表☆56Updated 4 months ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆97Updated 3 years ago
- 基于flink的用户行为分析☆51Updated 2 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- docker-hadoop-spark-hive 快速构建你的大数据环境☆21Updated 6 years ago
- 大数据自动化部署,包括自动化部署hadoop、hive、hbase、spark、storm等等一系列组件☆70Updated 7 years ago
- 大数据建模分析平台☆67Updated 7 years ago
- 大数据组件 All-in-One 的 Dockerfile☆98Updated last year
- 电商平台数据仓库搭建☆139Updated 11 months ago
- Flink 案例代码☆43Updated 3 years ago
- This is code of book "Spark Big Data Business Trilogy"☆70Updated 3 years ago
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆40Updated last year
- hive仓库元数据管理系统☆167Updated 9 years ago
- FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。☆70Updated 3 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆68Updated 3 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 8 years ago
- 全套大数据基础学习教程,包含最基础的centos、maven。大数据主要包含hdfs、mr、yarn、hbase、kafka、scala、sparkcore、sparkstreaming、sparksql。教程包含所有的源代码演示以及在线文档说明。☆54Updated 3 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆22Updated 3 years ago
- 分布式数据仓库最佳实践☆58Updated 7 years ago