xiongmozhou / gmall-realtimeLinks
数仓实时项目
☆10Updated 6 years ago
Alternatives and similar repositories for gmall-realtime
Users that are interested in gmall-realtime are comparing it to the libraries listed below
Sorting:
- hive仓库元数据管理系统☆167Updated 9 years ago
- Spark Streaming监控平台,支持任务部署与告警、自启动☆129Updated 7 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 3 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- 基于spark-streaming的实时数仓☆12Updated 2 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 6 years ago
- 基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf☆50Updated 2 years ago
- 手动管理spark streaming集成kafka的数据偏移量到zookeeper中☆22Updated 7 years ago
- 数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘☆82Updated 4 years ago
- 实时数据仓库搭建☆16Updated 5 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。☆70Updated 3 years ago
- 用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务☆104Updated last year
- 京东RTF实时数据湖,是一个从底层重新构建的系统,解决了数据的接入、解析及清洗等ETL 过程,同时解决了传统离线模式达不到的实时性和流式实时数据做不到的数据清洗、还原,是一套大数据领域改革性的实时数据方案。RTF可以直接查询最新状态的数据,并且无需去重,可以让数据分析人员即…☆127Updated last year
- 数据治理、数据质量检核/监控平台(Django+jQuery+MySQL)☆187Updated 2 years ago
- Flink代码实例☆122Updated 4 years ago
- 一个手动管理spark streaming集成kafka时的偏移量到zookeeper中的小项目☆134Updated 4 months ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆19Updated 3 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流(设置时间窗口,EventTime)☆32Updated 7 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆211Updated last year
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 6 years ago
- flink-sql 在 flink 上运行 sql 和 构建数据流的平台 基于 apache flink 1.10.0☆112Updated 3 years ago
- Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to cons…☆80Updated last year
- 大数据工具封装☆19Updated 2 years ago
- Apache Ambari Web 中文汉化 2.7.x版本直接修改☆41Updated 2 years ago
- Hive hook, obtain task information from Hive, fetch input/output tables and lineage information from HSQL.☆40Updated 2 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆117Updated 3 years ago
- 分享一些在工作中的大数据实战案例,包括flink、kafka、hadoop、presto等等。欢迎大家关注我的公众号【大数据技术与应用实战】,一起成长。☆262Updated last year