MTlpc / automaticDeploy
大数据环境一键安装脚本
☆52Updated 3 years ago
Alternatives and similar repositories for automaticDeploy:
Users that are interested in automaticDeploy are comparing it to the libraries listed below
- Apache StreamPark quickstart☆68Updated this week
- flink 集成CDH5的自定义paracels☆71Updated 2 years ago
- 基于 Flink 的 sqlSubmit 程序☆144Updated 10 months ago
- 一个实时数仓项目,从0到1搭建实时数仓☆55Updated 3 years ago
- flink-parcel compiler tool☆47Updated 5 years ago
- 分享一些在工作中的大数据实战案例,包括flink、kafka、hadoop、presto等等。欢迎大家关注我的公众号【 大数据技术与应用实战】,一起成长。☆263Updated 11 months ago
- 从本地IDEA提交Flink/Spark任务到Yarn/k8s集群☆161Updated 3 years ago
- Spark、Flink等离线任务的调度以及实时任务的监控☆298Updated last year
- 数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘☆81Updated 3 years ago
- Hive hook, obtain task information from Hive, fetch input/output tables and lineage information from HSQL.☆39Updated last year
- HBaseManager,是一款强大的HBase表管理系统,目前系统集成的功能有,命名空间管理,表管理,列簇管理,标签机制,快照管理,以及一些常见的统计指标展示等,另外,系统还内置了HBaseSQL的功能,欢迎大家尝鲜。☆79Updated 9 months ago
- dataService platform is a low-code platform, which only needs to write SQL to realize the development of API services, solve the unificat…☆110Updated last year
- ☆49Updated 2 years ago
- Using Flink SQL to build ETL job☆200Updated last year
- 数据治理、数据质量检核/监控平台(Django+jQuery+MySQL)☆183Updated 2 years ago
- Cluster manager for Apache Doris☆175Updated last year
- datax数据同步elasticsearch的reader和writer插件,支持一对多的扁平数据转换成es的嵌套对象,也支持嵌套对象的读取和ognl表达式过滤,理论上可以无限嵌套。☆89Updated last year
- 大数据平台前端项目☆37Updated 3 weeks ago
- 大数据全栈学习【生态组件,技术栈,数据流,数据仓库, 数据库,指标体系,血缘关系,元数据管理,数据质量,DataWorks,Hadoop,Spark,Flink,面试,笔记文档,实战练习,公共脚本,常用Shell脚本,Java,Scala,离线,实时,采集,计算,存储,可视化…☆114Updated 4 years ago
- ☆68Updated 2 years ago
- ☆451Updated 2 years ago
- ☆20Updated 3 years ago
- 数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等☆345Updated 10 months ago
- 该项目整合了多款优秀的开源产品,构建了一个功能全面的数据开发平台。平台提供了强大的数据集成、数据开发、数据查询、数据服务、数据质量管理、工作流调度和元数据管理功能。#dinky #dolphinscheduler #datavines #flinkcdc #openmeta…☆353Updated 4 months ago
- Doris表和字段血缘项目☆77Updated 9 months ago
- Apache SeaTunnel documents☆59Updated this week
- ☆118Updated last year
- 京东RTF实时数据湖,是一个从底层重新构建的系统,解决了数据的接入、解析及清洗等ETL 过程,同时解决了传统离线模式达不到的实时性和流式实时数据做不到的数据清洗、还原,是一套大数据领域改革性的实时数据方案。RTF可以直接查询最新状态的数据,并且无需去重,可以让数据分析人员即…☆127Updated last year
- FlinkSQL数据脱敏和行级权限解决方案及源码,支持面向用户级别的数据脱敏和行级数据访问控制,即特定用户只能访问到脱敏后的数据或授权过的行。此方案是实时领域Flink的解决方案,类似于离线数仓Hive Ranger中的Row-level Filter和Column Mas…☆131Updated last year
- CDH安装手册☆86Updated last year