xiaohei-info / MapReduce
MapReduce Demo
☆395Updated 8 years ago
Related projects ⓘ
Alternatives and complementary repositories for MapReduce
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆174Updated 7 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆313Updated 9 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆213Updated 11 months ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆169Updated 7 years ago
- Spark 学习之路,包含 Spark Core,Spark SQL,Spark Streaming,Spark mllib 学习笔记☆144Updated 6 years ago
- 基于spark streaming和kafka,hbase的日志统计 分析系统☆265Updated 7 years ago
- Learning Apache spark,including code and data .Most part can run local.☆602Updated 3 years ago
- 关于大数据的面试题,包括hadoop、hbase、hive、spark、storm、zookeeper、kafka、flume、logstash、redis、ELK、ETL、算法等等,持续更新中☆443Updated 5 years ago
- 基于Apache Spark的Netflix电影的离线与实时推荐系统☆248Updated 7 years ago
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆185Updated 5 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆84Updated 6 years ago
- Spark2.4.0 学习笔记分享☆201Updated 5 years ago
- 一个手动管理spark streaming集成kafka时的偏移量到zookeeper中的小项目☆136Updated 3 months ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆95Updated 5 years ago
- Spark Streaming+Flume+Kafka+HBase+Hadoop+Zookeeper实现实时日志分析统计;SpringBoot+Echarts实现数据可视化展示☆501Updated 6 years ago
- Real-Time Analysis Integration with Kafka in Apache Spark’s Structured Streaming☆60Updated 6 years ago
- 基于Spark2.x新闻网大数据实时分析可视化系统项目☆506Updated 5 years ago
- Java开发者或者大数据开发者面试知识点整理☆250Updated 5 years ago
- BigData Project 大数据项目由浅入深☆636Updated 6 years ago
- Hadoop分布式文件系统hdfs代码分析☆184Updated 9 years ago
- 大数据实践项目 Hadoop、Spark、Kafka、Hbase、Flink.....☆486Updated 5 years ago
- ☆270Updated 5 years ago
- spark example code, has some production practice.☆175Updated 8 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 2 years ago
- 基于Spark ML实现的豆瓣电影推荐系统☆224Updated 6 years ago
- Spark源码分析,主要包含SparkContext源码、Executor进程启动、Stage划分、Task执行和Spark2.0的新特性☆82Updated 5 years ago
- 清华大数据作业MapReduce处理几百个G的JSON数据☆51Updated 8 years ago
- 定期更新Hadoop生态圈中常用大数据组件文档 重心依次为: Flink Solr Sparksql ES Scala Kafka Hbase/phoenix Redis Kerberos (项目包含hadoop思维导图 印象笔记 Scala版本简单demo …☆925Updated last year
- IntelliJ IDEA Plugin for Hadoop☆187Updated 2 years ago