xiongmozhou / gmall-realtime
数仓实时项目
☆10Updated 5 years ago
Alternatives and similar repositories for gmall-realtime:
Users that are interested in gmall-realtime are comparing it to the libraries listed below
- 基于spark-streaming的实时数仓☆12Updated last year
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆95Updated 2 years ago
- 数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘☆82Updated 3 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- Hive hook, obtain task information from Hive, fetch input/output tables and lineage information from HSQL.☆40Updated last year
- 大数据工具封装☆19Updated 2 years ago
- 基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf☆50Updated 2 years ago
- hive仓库元数据管理系统☆166Updated 8 years ago
- 信托数据仓库及商业智能☆32Updated 6 years ago
- 《Spark大数据分析源码解析与实例详解》图书配套实例资源☆38Updated 2 years ago
- Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to cons…☆79Updated last year
- 一个实时数仓项目,从0到1搭建实时数仓☆57Updated 3 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- Learning Flink : Flink CEP,Flink Core,Flink SQL☆71Updated 3 years ago
- hive sql 字段血缘☆22Updated 2 years ago
- Flink 案例开发数据清洗、数据报表☆53Updated 2 years ago
- 基于flink的用户行为分析☆51Updated last year
- FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。☆70Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 此项目主要应用于数据中台或数据平台的数据总线,支持直接实时监听MySQL、MongoDB、PostgreSQL、Oracle、SQL Server、Db2和Cassandra等数据库的数据变更。☆62Updated last year
- Flink Sql 教程☆34Updated 4 months ago
- 实时数据仓库搭建☆16Updated 5 years ago
- 从本地IDEA提交Flink/Spark任务到Yarn/k8s集群☆161Updated 3 years ago
- 大数据实习hdfs+flume+kafka+spark+hbase+hive项目☆34Updated 7 years ago
- sql实现Structured Streaming☆39Updated 6 years ago
- 数据采集平台zdh,etl 处理服务☆71Updated 2 weeks ago
- flink简易使用教程,结合官方仓库的example样例,结合常见场景,使用flink的基本功能☆113Updated 2 years ago
- 京东RTF实时数据湖,是一个从底层重新构建的系统,解决了数据的接入、解析及清洗等ETL 过程,同时解决了传统离线模式达不到的实时性和流式实时数据做不到的数据清洗、还原,是一套大数据领域改革性的实时数据方案。RTF可以直接查询最新状态的数据,并且无需去重,可以让数据分析人员即…☆127Updated last year
- 大数据自动化部署,包括自动化部署hadoop、hive、hbase、spark、storm等等一系列组件☆67Updated 6 years ago
- flinksql-platform☆19Updated 4 years ago