bys-eric-he / com-hadoop-bigdata-demoLinks
源码主要用于学习:1. Spring Boot+Hadoop+Hive+Hbase实现数据基本操作,Hive数据源使用Alibaba DruidDataSource,以及JDBCTemplate操作数据, Hbase使用hbase-client实现数据操作, API可视化界面集成Swagger-UI 2.9.2。2.引入Azkaban离线任务调度,实现Hive数据分层ETL过程,并结合Sqoop实现数据从Hive同步到MySQL操作。3. 引入Kafka消息服务,实现前端日志收集,将消息接收到的数据包持久化到Hive ODS原始数据层。4. 通过SpringBoot API方式提供可视化数据访问服务。
☆21Updated 3 years ago
Alternatives and similar repositories for com-hadoop-bigdata-demo
Users that are interested in com-hadoop-bigdata-demo are comparing it to the libraries listed below
Sorting:
- 基于flink的推荐系统,实时获取kafka数据进行数据清洗,离线计算进行文件读取(文件,mongodb,hbase)运用协同过滤算法进行计算 得出推荐数据☆18Updated 2 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 2 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 7 years ago
- kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流(设置时间窗口,EventTime)☆32Updated 7 years ago
- Flink 案例开发数据清洗、数据报表☆53Updated 2 years ago
- FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。☆70Updated 2 years ago
- 利用SpringBoot整合HBase,基于HBaseJavaAPI的二次封装,可以直接引用jar包使用,目前测试已支持HBase1.1.2和HBase1.4.6以及HBase2.0.2三个版本。☆16Updated 8 months ago
- 大数据招聘信息分析平台☆43Updated 9 years ago
- 大数据生态圈学习☆18Updated 2 years ago
- 基于Java,封装了hbase的底层api,提供了基于注解的ORM支持,只需定义实体类对象,即可完成对hbase的各种操作。同时对List、Set、Map等复杂数据类型提供了支持☆43Updated 8 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆19Updated 2 years ago
- MySQL增量数据实时同步到HDFS/Hive☆11Updated 6 years ago
- 用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务☆102Updated last year
- 关于 HDFS,Yarn,MapReduce,HBase,Hive,Pig,Sqoop,Flume,Zookeeper,MemCached,Redis,Storm,Scala,Spark,Flink 等大数据框架的学习笔记☆77Updated 5 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- Streaming 相关项目☆15Updated 8 years ago
- 基于DataX的通用数据同步微服务,一个Restful接口搞定所有通用数据同步☆53Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- hadoop flume hbase kafka storm;读取kafka数据=》storm实时处理(分割字符,统计字符)=》写入hdfs☆21Updated 6 years ago
- 基于spark streaming+flume+kafka+hbase的实时日志处理分析系统(分为控制台版本和基于springboot、Echarts等的Web UI可视化版本)☆37Updated last year
- Flink 实时ETL案例☆46Updated 2 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 2 years ago
- 大数据全栈学习【生态组件,技术栈,数据流,数据仓库,数据库,指标体系,血缘关系,元数据管理,数据质量,DataWorks,Hadoop,Spark,Flink,面试,笔记文档,实战练习,公共脚本,常用Shell脚本,Java,Scala,离线,实时,采集,计算,存储,可视化…☆122Updated 4 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆113Updated 3 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆36Updated 7 years ago
- 本项目主要用于搭建一个基于docker的实时监控系统,涉及的大数据相关组件有Filebeat,Kafka,Zookeeper,Flink,后端主要使用了SpringBoot进行开发,数据库使用了Redis做缓存,前端用了Vue框架,通过Ant Design组件库和Echar…☆42Updated 2 years ago
- 基于canal.deployer-1.1.1-SNAPSHOT.tar,canal连接kafka,springboot消费kafka数据入hbase和ElasticSearch☆14Updated 6 years ago
- 【雪球-Infra】功能:实现kafka消息实时落地hbase,支持csv/json字符串两种格式的消息,支持自定义组合rowkey,列簇和列名,支持按照kafka消息流中不同字段join不同的hbase表,并自定义写入列簇和列(join时需评估一下性能), …☆21Updated last year