datamaning / MapReduceLinks
清华大数据作业MapReduce处理几百个G的JSON数据
☆49Updated 8 years ago
Alternatives and similar repositories for MapReduce
Users that are interested in MapReduce are comparing it to the libraries listed below
Sorting:
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆188Updated 6 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆86Updated 7 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆36Updated 7 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆213Updated last year
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆177Updated 7 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆117Updated 2 years ago
- 大数据招聘信息分析平台☆43Updated 9 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆322Updated 10 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 8 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 电商大数据项目-推荐系统(java和scala语言)☆201Updated last year
- 一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目☆14Updated 7 years ago
- docker构建大数据开发学习环境☆50Updated 8 years ago
- review pamphlet 大数据程序员面试宝典☆38Updated 6 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆162Updated 2 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆50Updated 6 years ago
- 基于spark的外卖大数据平台分析系统☆44Updated 6 years ago
- 电信大数据项目实战☆13Updated 6 years ago
- Spark 学习之路,包含 Spark Core,Spark SQL,Spark Streaming,Spark mllib 学习笔记☆145Updated 6 years ago
- The project of data cleaning and data analysis based on MapReduce.☆62Updated 7 years ago
- spark机器学习算法研究和源码分析☆32Updated 8 years ago
- Spark源码分析,主要包含SparkContext源码、Executor进程启动、Stage划分、Task执行和Spark2.0的新特性☆82Updated 5 years ago
- 基于wifi抓取信息的大数据查询分析系统☆107Updated 8 years ago
- spark全示例代码(java、scala) Spark most full instance code DEMO (java、scala)☆83Updated 5 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 2 years ago
- Java开发者或者大数据开发者面试知识点整理☆251Updated 6 years ago