datamaning / MapReduce
清华大数据作业MapReduce处理几百个G的JSON数据
☆49Updated 8 years ago
Alternatives and similar repositories for MapReduce:
Users that are interested in MapReduce are comparing it to the libraries listed below
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆186Updated 6 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆74Updated 2 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆85Updated 7 years ago
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆177Updated 7 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 5 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆211Updated last year
- 关于 HDFS,Yarn,MapReduce,HBase,Hive,Pig,Sqoop,Flume,Zookeeper,MemCached,Redis,Storm,Scala,Spark,Flink 等大数据框架的学习笔记☆77Updated 5 years ago
- 金融风控系统(springboot+drools)、flink流 计算、mongodb☆156Updated 2 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 2 years ago
- 大数据招聘信息分析平台☆42Updated 9 years ago
- 基于spark的外卖大数据平台分析系统☆43Updated 6 years ago
- SparkSQL慕课网日志分析及可视化展示☆21Updated 6 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆33Updated 7 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆320Updated 10 years ago
- Hadoop,MapReduce编程学习练手实例☆147Updated 6 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 7 years ago
- 全套大数据基础学习教程,包含最基础的centos、maven。大数据主要包含hdfs、mr、yarn、hbase、kafka、scala、sparkcore、sparkstreaming、sparksql。教程包含所有的源代码演示以及在线文档说明。☆54Updated 2 years ago
- 一个大数据实时流处理日志分析系统 Demo☆29Updated 2 years ago
- 基于wifi抓取信息的大数据查询分析系统☆107Updated 7 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆116Updated 2 years ago
- review pamphlet 大数据程序员面试宝典☆38Updated 6 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- 1.Spark离线批处理,用户实时点击统计;2.SparkSQL日志内容分析;3.受众电影分析 =>(Kafka + SparkStreaming + Redis)和(Kafka + SparkStreaming + Mysql)☆29Updated 2 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆95Updated 2 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- 尚硅谷大数据Spark-2019版最新 Spark 学习☆51Updated 2 years ago
- 基于flink的用户行为分析☆50Updated last year
- Spark源码分析,主要包含SparkContext源码、Executor进程启动、Stage划分、Task执行和Spark2.0的新特性☆82Updated 5 years ago
- 电商平台数据仓库搭建☆129Updated 2 months ago