Mrkuhuo / bigdata_learningLinks
大数据组件学习代码
☆63Updated last year
Alternatives and similar repositories for bigdata_learning
Users that are interested in bigdata_learning are comparing it to the libraries listed below
Sorting:
- 大数据平台后端项目☆255Updated last week
- 基于Flink+Kafka的全链路数仓, 包括实时和离线☆39Updated 2 years ago
- 一个实时数仓项目,从0到1搭建实时数仓☆61Updated 4 years ago
- 大数据平台前端项目☆46Updated 2 months ago
- 数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等☆426Updated 2 months ago
- dataService platform is a low-code platform, which only needs to write SQL to realize the development of API services, solve the unificat…☆111Updated 2 years ago
- 该项目整合了多款优秀的开源产品,构建了一个功能全面的数据开发平台。平台提供了强大的数据集成、数据开发、数据查询、数据服务、数据质量管理、工作流调度和元数据管理功能。#dinky #dolphinscheduler #datavines #flinkcdc #openmeta…☆556Updated 2 months ago
- zhili数据平台主要包含统一认证(zhili-auth)、元数据管理(zhili-metadata)、即席查询(zhili-adhoc)、数据服务(zhili-dataservice)、数据采集(zhili-collect)等子项目。☆61Updated 3 years ago
- 大数据采集,抽取平台,zdh_web是zdh系列服务的可视化管理平台,包含数据采集,调度,权限,审批流,私域营销等模块☆527Updated 2 months ago
- 基于flink的电商实时数据分析、推荐、风控项目☆64Updated 3 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆115Updated 3 years ago
- 京东RTF实时数据湖,是一个从底层重新构建的系统,解决了数据的接入、解析及清洗等ETL 过程,同时解决了传统离线模式达不到的实时性和流式实时数据做不到的数据清洗、还原,是一套大数据领域改革性的实时数据方案。RTF可以直接查询最新状态的数据,并且无需去重,可以让数据分析人员即…☆127Updated 2 years ago
- Doris表和字段血缘项目☆83Updated last year
- Flink cdc 整库同步 & flink 代码 demo☆44Updated 3 months ago
- 这是一个可自由拖拽的BI可视化系统 支持主流的关系数据:MySQL,Oracle,PostgreSQL等 同时支持Apache Doris☆214Updated 3 years ago
- HiveWriter for alibaba DataX☆14Updated last year
- 大数据全栈学习【生态组件,技术栈,数据流,数据仓库,数据库,指标体系,血缘关系,元数据管理,数据质量,DataWorks,Hadoop,Spark,Flink,面试,笔记文档,实战练习,公共脚本,常用Shell脚本,Java,Scala,离线 ,实时,采集,计算,存储,可视化…☆125Updated 5 years ago
- 该仓库专注于为读者分享大数据领域的技术组件,面经、以及关于大数据的面试辅导内容,具体内容涉及Java、Linux、Hadoop、Hbase、Hive、Kafka、Spark、Redis、ClickHouse、Hudi、Doris、starRocks等多个组件内容,同时会实时…☆42Updated last year
- 数据采集平台zdh,etl 处理服务☆73Updated 2 months ago
- Fire框架是由中通大数据自主研发并开源的、专门用于进行Spark和Flink任务开发的大数据框架,可节约70%以上的代码量。首创基于注解进行Spark和Flink任 务开发,具备实时血缘、根因诊断、动态调优、参数热调整等众多平台化功能。Fire框架在中通内部每天处理数据量高…☆42Updated last year
- FlinkTutorial 专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。☆70Updated 3 years ago
- 解析 SQL 字段数据血缘☆85Updated 5 months ago
- 基于 Flink 的 sqlSubmit 程序☆148Updated last year
- 分享一些在工作中的大数据实战案例,包括flink、kafka、hadoop、presto等等。欢迎大家关注我的公众号【大数据技术与应用实战】,一起成长。☆263Updated last year
- 这个平台旨在提供一个高效、便捷的数据处理和分析环境,适用于数据科学家、数据工程师以及任何对数据处理有需求的用户。☆52Updated 2 months ago
- Flink 案例开发数据清洗、数据报表☆56Updated 3 weeks ago
- DorisDB SQL解析器Java实现;Clickhouse SQL解析器Java实现☆97Updated 3 years ago
- A distributed data factory, providing data access, etl, scheduling. Easily manage tasks such as hive, spark, clickhouse, flink, shell, py…☆33Updated 3 years ago
- Streaming application development and management system, based on Linkis and DSS, planning to provide the workflow-like graphical drag-an…☆109Updated 5 months ago
- 智数通2.0是新一代完全自主研发的数据治理平台,现拥有数据建设平台、数据治理平台、数据服务平台、任务调度平台等四大基础数据治理平台, 实现了数据集成、元数据管理、数据标准管理、数据质量管理、数据服务管理、数据建模管理、数据血缘查看、数据资产管理、任务调度管理等功能模块, 打…☆95Updated 5 months ago