xiongmozhou / gmall-realtimeLinks
数仓实时项目
☆10Updated 6 years ago
Alternatives and similar repositories for gmall-realtime
Users that are interested in gmall-realtime are comparing it to the libraries listed below
Sorting:
- hive仓库元数据管理系统☆166Updated 8 years ago
- 基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf☆50Updated 2 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- 基于spark-streaming的实时数仓☆12Updated last year
- Spark Streaming监控平台,支持任务部署与告警、自启动☆128Updated 7 years ago
- 数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘☆82Updated 3 years ago
- 大数据工具封装☆19Updated 2 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 2 years ago
- 京东RTF实时数据湖,是一个从底层重新构建的系统,解决了数据的接入、解析及清洗等ETL 过程,同时解决了传统离线模式达不到的实时性和流式实时数据做不到的数据清洗、还原,是一套大数据领域改革性的实时数据方案。RTF可以直接查询最新状态的数据,并且无需去重,可以让数据分析人员即…☆126Updated last year
- 手动管理spark streaming集成kafka的数据偏移量到zookeeper中☆22Updated 7 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 数据治理、数据质量检核/监控平台(Django+jQuery+MySQL)☆186Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 《Spark大数据分析源码解析与实例详解》图书配套实例资源☆38Updated 3 years ago
- 用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务☆103Updated last year
- 给flink开发的web系统。支持页面上定义udf,进行sql和jar任务的提交;支持source、sink、job的管理;可以管理openshift上的flink集群☆284Updated 2 years ago
- Hive hook, obtain task information from Hive, fetch input/output tables and lineage information from HSQL.☆40Updated last year
- 从本地IDEA提交Flink/Spark任务到Yarn/k8s集群☆162Updated 3 years ago
- Flink代码实例☆122Updated 4 years ago
- Flink应用程序开发支持框架☆16Updated 4 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆117Updated 3 years ago
- sql解析工具。主要解析hive sql、spark sql、presto sql。从sql中解析出输入表、输出表以及字段等信息☆96Updated 2 years ago
- 实时数据仓库搭建☆16Updated 5 years ago
- flink-sql 在 flink 上运行 sql 和 构建数据流的平台 基于 apache flink 1.10.0☆111Updated 3 years ago
- 数据采集平台zdh,etl 处理服务☆72Updated last week
- 因现有 的datax、sqoop满足不了需求,使用spark封装了一个数据同步工具。☆9Updated 6 years ago
- FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。☆70Updated 3 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 6 years ago
- hive sql 字段血缘☆23Updated 3 years ago
- Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to cons…☆79Updated last year