datamaning / MapReduceLinks
清华大数据作业MapReduce处理几百个G的JSON数据
☆50Updated 9 years ago
Alternatives and similar repositories for MapReduce
Users that are interested in MapReduce are comparing it to the libraries listed below
Sorting:
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆211Updated last year
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆177Updated 8 years ago
- 电商大数据项目-推荐系统(java和scala语言)☆201Updated 2 years ago
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆189Updated 6 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 7 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆36Updated 8 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆117Updated 3 years ago
- Spark源码分析,主要包含SparkContext源码、Executor进程启动、Stage划分、Task执行和Spark2.0的新特性☆82Updated 6 years ago
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆131Updated 5 years ago
- 基于spark的外卖大数据平台分析系统☆46Updated 6 years ago
- Spark 学习之路,包含 Spark Core,Spark SQL,Spark Streaming,Spark mllib 学习笔记☆145Updated 7 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 大数据招聘信息分析平台☆44Updated 9 years ago
- 基于Spark2.x新闻网大数据实时分析可视化系统项目☆520Updated 6 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- Hadoop,MapReduce编程学习练手实例☆148Updated 6 years ago
- Real-Time Analysis Integration with Kafka in Apache Spark’s Structured Streaming☆59Updated 7 years ago
- 关于 HDFS,Yarn,MapReduce,HBase,Hive,Pig,Sqoop,Flume,Zookeeper,MemCached,Redis,Storm,Scala,Spark,Flink 等大数据框架的学习笔记☆78Updated 5 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆52Updated 6 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆162Updated 3 years ago
- 一个开源、成体系的大数据学习教程。spark学习 hadoop hive hbase flink教程 linux 从入门到精通☆280Updated 5 years ago
- 大数据全栈学习【生态组件,技术栈,数据流,数据仓库,数据库,指标体系,血缘关系,元数据管理,数据质量,DataWorks,Hadoop,Spark,Flink,面试,笔记文档,实战练习,公共脚本,常用Shell脚本,Java,Scala,离线,实时,采集,计算,存储,可视化…☆122Updated 4 years ago
- Java开发者或者大数据开发者面试知识点整理☆255Updated 6 years ago
- review pamphlet 大数据程序员面试宝典☆38Updated 7 years ago
- Spark Streaming+Flume+Kafka+HBase+Hadoop+Zookeeper实现实时日志分析统计;SpringBoot+Echarts实现数据可视化展示☆516Updated 7 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 3 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆323Updated 10 years ago
- 基于WIFI探针的商业大数据分析技术☆294Updated 2 years ago