enkhalifapro / bigdata-all-in-one
Docker-compose contains the most common big data systems like: Apache Hadoop, Apache Hive, Apache Spark, Jupyter, Flink
☆27Updated last year
Alternatives and similar repositories for bigdata-all-in-one:
Users that are interested in bigdata-all-in-one are comparing it to the libraries listed below
- spark自学手册,包含了例如spark core、spark sql、spark streaming、spark-kafka、delta-lake,以及scala基础练习,还有一些例如master、shuffle源码分析,总结及翻译。☆18Updated last year
- 一键搭建zookeeper/hadoop/hive/hbase/sqoop/kafka/spark/kylin☆34Updated 5 years ago
- k8s hadoop,在k8s上快速搭建一个hadoop/hbase/hive环境,很早的项目自已用,腾讯tbds培训,以此为基础(多了一个kafka/flink)搭一套环境练习,又捡起来了☆21Updated 4 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- Hadoop-Hive-Spark cluster + Jupyter on Docker☆69Updated 2 months ago
- 基于Spark的实时推荐系统,使用MovieLens作为测试数据集☆28Updated 2 years ago
- 基于SparkSQL的电影分析项目实战☆39Updated 4 years ago
- Infrastructure automation to deploy Hadoop,Hive,Spark,airflow nodes on a docker host☆20Updated 6 years ago
- 基于Spark2.2新闻网大数据实时系统项目☆60Updated 5 years ago
- 基于flink的用户行为分析☆50Updated last year
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆39Updated last year
- 大数据课程☆29Updated 4 years ago
- Base Docker image with just essentials: Hadoop, Hive and Spark.☆68Updated 4 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- docker-hadoop-spark-hive 快速构建你的大数据环境☆21Updated 5 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 6 years ago
- Streaming 相关项目☆15Updated 8 years ago
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆36Updated 6 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 7 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 5 years ago
- Spark Sql进行离线日志分析,Java Web+Echarts+Ajax进行数据可视化展示☆27Updated 6 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 2 years ago
- 用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务☆101Updated last year
- ☆29Updated 5 years ago
- docker构建大数据开发学习环境☆51Updated 8 years ago
- 实时数据仓库搭建☆16Updated 5 years ago
- flink读取kafka数据,按照业务逻辑计算完之后以数据流的方式快速导入到redis集群,并实现了将计算结果以流的方式快速导入MySQL库中。☆15Updated 5 years ago
- A Hadoop cluster based on Docker, including Hive and Spark.☆79Updated 2 years ago
- 基于PySpark库,使用SparkSql连接MYSQL数据库并对数据进行统计分析的基础架构☆14Updated 6 years ago