chucheng92 / HadoopDedupLinks
基于Hadoop和HBase的大规模海量数据去重
☆30Updated 7 years ago
Alternatives and similar repositories for HadoopDedup
Users that are interested in HadoopDedup are comparing it to the libraries listed below
Sorting:
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 8 years ago
- phoenix 操作hbase和springboot的整合☆11Updated 7 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 3 years ago
- kafka spark hbase 日志统计☆80Updated 8 years ago
- hadoop flume hbase kafka storm;读取kafka数据=》storm实时处理(分割字符,统计字符)=》写入hdfs☆21Updated 6 years ago
- 基于spark、mahout和spring boot构建的推荐系统☆130Updated 4 months ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 7 years ago
- 【bigdata】spirngboot+spark 脚手架+相关实例☆22Updated 3 years ago
- tools for bigData☆37Updated 6 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- Streaming 相关项目☆15Updated 8 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆33Updated 8 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆323Updated 10 years ago
- 基于DataX的通用数据同步微服务,一个Restful接口搞定所有通用数据同步☆54Updated 3 years ago
- spark全示例代码(java、scala) Spark most full instance code DEMO (java、scala)☆85Updated 5 years ago
- spring+spark streaming+kafka 10版本集成和异常问题处理☆17Updated 8 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 分布式数据仓库最佳实践☆57Updated 7 years ago
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆189Updated 6 years ago
- Storm Kafka 流数据 处理系统☆20Updated 6 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆165Updated 3 years ago
- flink rest api的spring-boot-starter☆17Updated 2 years ago
- Flink代码实例☆122Updated 5 years ago
- 一个基于Spring Boot的Storm开发手脚架,开箱即用!集成读写Kafka、写Redis、写MySQL示例。☆59Updated 6 years ago
- 项目实战:Hadoop生态圈☆30Updated 7 years ago
- elasticsearch reader and writer plugin for datax☆39Updated 8 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 3 years ago
- ETL Tools 数据抽取-转换-加载工具☆79Updated 8 years ago