数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等
☆443Aug 8, 2025Updated 7 months ago
Alternatives and similar repositories for bigdata-hub
Users that are interested in bigdata-hub are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- LarkMidTable 是一站式开源的数据中台,实现中台的 基础建设,数据治理,数据开发,监控告警,数据服务,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。☆2,031Aug 20, 2023Updated 2 years ago
- 大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。☆1,735Feb 12, 2026Updated last month
- 🔥🔥 AllData可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为工厂,以大模型应用为上游产品,提供全链路数字化解决方案。产品正式演示体验、社群咨询、商务采购:https://docs.qq.com/doc/DVHlkSEtvVXVCdEFo☆2,990Feb 26, 2026Updated 3 weeks ago
- 大数据采集,抽取平台,zdh_web是zdh系列服务的可视化管理平台,包含数据采集,调度,权限,审批流,私域营销等模块☆526Mar 7, 2026Updated 2 weeks ago
- 智数通提供了元数据管理、数据标准管理、数据质量管理、主数据管理、数据集市管理、可视化图表看板、流程管理等微服务,是为数字化建设而生的企业级一站式数据治理平台。☆328Feb 11, 2025Updated last year
- 【2026最新版】 大数据 数据分析 电商系统 实时数仓 离线数仓 数据湖 建设方案及实战代码,涉及组件 #flink #paimon #doris #seatunnel #dolphinscheduler #datart #dinky #hudi #iceberg。☆1,075Oct 8, 2025Updated 5 months ago
- 一个实时数仓项目,从0到1搭建实时数仓☆63May 27, 2021Updated 4 years ago
- 智数通2.0是新一代完全自主研发的数据治理平台,现拥有数据建设平台、数据治理平台、数据服务平台、任务调度平台等四大基础数据治理平台, 实现了数据集成、元数据管理、数据标准管理、数据质量管理、数据服务管理、数据建模管理、数据血缘查看、数据资产管理、任务调度管理等功能模块, 打…☆101Apr 27, 2025Updated 10 months ago
- 从数据仓库到用户画像,从数据建设到数据应用☆626Jan 26, 2022Updated 4 years ago
- Support agile DataOps Based on Flink, DataX and Flink-CDC, Chunjun with Web-UI☆1,292Updated this week
- 大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料☆3,148Jan 20, 2026Updated 2 months ago
- Know your data better!Datavines is Next-gen Data Observability Platform, support metadata manage and data quality.☆723Mar 6, 2026Updated 2 weeks ago
- 分享一些在工作中的大数据实战案例,包括flink、kafka、hadoop、presto等等。欢迎大家关注我的公众号【Hello大数据】,一起成长。☆261Feb 21, 2024Updated 2 years ago
- 📚深入浅出数据库存储:数据库理论、关系型数据库、文档型数据库、键值型数据库、New SQL、搜索引擎、数据仓库与 OLAP、大数据与数据中台☆1,364Mar 15, 2026Updated last week
- 基于 antlr4 的多种数据库SQL解析器,获取SQL中元数据,可用于数据平台产品中的多个场景:ddl语句提取元数据、sql 权限校验、表级血缘、sql语法校验等场景。支持spark、flink、gauss、starrocks、Oracle、MYSQL、Postgresq…☆407Mar 10, 2026Updated last week
- 此项目主要应用于数据中台或数据平台的数据总线,支持直接实时监听MySQL、MongoDB、PostgreSQL、Oracle、SQL Server、Db2和Cassandra等数据库的数据变更。☆63Dec 5, 2023Updated 2 years ago
- Dinky is a real-time data development platform based on Apache Flink, enabling agile data development, deployment and operation.☆3,711Updated this week
- 大数据处理相关技术学习之路(持续更新中...)。 Bigdata整理 --> 慢慢滴~ 大数据相关技术包括离线处理,实时处理,OLAP等,如hadoop、spark、flink、hive、hbase、oozie...以及大数据项目,如用户画像、数据仓库等,…☆333Jan 15, 2024Updated 2 years ago
- 专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...☆10,432Aug 7, 2023Updated 2 years ago
- Flink cdc 整库同步 & flink 代码 demo☆45Mar 2, 2026Updated 3 weeks ago
- 大数据平台后端项目☆308Mar 11, 2026Updated last week
- DataX集成可视化页面,选择数据源即可一键生成数据同步任务,支持RDBMS、Hive、HBase、ClickHouse、MongoDB等数据源,批量创建RDBMS数据同步任务,集成开源调度系统,支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、…☆5,988Jun 2, 2024Updated last year
- 该项目整合了多款优秀的开源产品,构建了一个功能全面的 数据开发平台。平台提供了强大的数据集成、数据开发、数据查询、数据服务、数据质量管理、工作流调度和元数据管理功能。#dinky #dolphinscheduler #datavines #flinkcdc #openmeta…☆628Aug 5, 2025Updated 7 months ago
- 深圳地铁大数据客流分析系统🚇🚄🌟☆2,448May 16, 2024Updated last year
- 大数据入门指南☆16,884Jan 5, 2024Updated 2 years ago
- 大数据全栈学 习【生态组件,技术栈,数据流,数据仓库,数据库,指标体系,血缘关系,元数据管理,数据质量,DataWorks,Hadoop,Spark,Flink,面试,笔记文档,实战练习,公共脚本,常用Shell脚本,Java,Scala,离线,实时,采集,计算,存储,可视化…☆135Sep 27, 2020Updated 5 years ago
- A data integration framework☆4,109Dec 2, 2025Updated 3 months ago
- 该仓库专注于让读者秒懂Flink组件,包含Flink实战代码和文档、200个Flink教程知识点,Flink Datastream、Flink Table、Flink Window、Flink State、Flink Checkpoint、Flink Metrics、Fli…☆763Jun 14, 2024Updated last year
- flink learning blog. http://www.54tianzhisheng.cn/ 含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。涉及 Flink Connector、Metrics、Library、DataStream API、Ta…☆15,058Mar 9, 2026Updated 2 weeks ago
- The next generation of cloud-native big data management expert , Aims to help users rapidly build stable, efficient, and scalable cloud-n…☆1,309Jul 22, 2025Updated 8 months ago
- 基于Flink实现的商品实时推荐系统。flink统计商品热度,放入redis缓存,分析日志信息,将画像标签和实时记录放入Hbase。在用户发起推荐请求后,根据用户画像重排序热度榜,并结合协同过滤和标签两个推荐模块为新生成的榜单的每一个产品添加关联产品,最后返回新的用户列表。☆4,474Feb 4, 2024Updated 2 years ago
- 基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生flink SQL所有的语法☆2,059Feb 21, 2024Updated 2 years ago
- 大数据实践项目 Hadoop、Spark、Kafka、Hbase、Flink.....☆540May 14, 2019Updated 6 years ago
- 数据采集平台zdh,etl 处理服务☆72Nov 8, 2025Updated 4 months ago
- Ultra-Lightweight AI-Powered Big Data Center | 至轻云-超轻量级智能化大数据中心/数据中台☆248Updated this week
- 低代码,在线表单,工作流程,智能报表,大屏设计,应用设计,自动化运维,数 据治理,商业智能,任务编排。☆224Feb 3, 2026Updated last month
- 数据治理、数据标准相关的 web 工具☆39Apr 22, 2022Updated 3 years ago
- SeaTunnel is a distributed, high-performance data integration platform for the synchronization and transformation of massive data (offlin…☆807Jan 22, 2026Updated 2 months ago
- 定期更新Hadoop生态圈中常用大数据组件文档 重心依次为: Flink Solr Sparksql ES Scala Kafka Hbase/phoenix Redis Kerberos (项目包含hadoop思维导图 印象笔记 Scala版本简单demo …☆923Mar 9, 2026Updated 2 weeks ago