maguichang / DataQuality
数据治理->数据质量
☆10Updated 5 years ago
Alternatives and similar repositories for DataQuality
Users that are interested in DataQuality are comparing it to the libraries listed below
Sorting:
- Learning Flink : Flink CEP,Flink Core,Flink SQL☆71Updated 3 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 《Spark大数据分析源码解析与实例详解》图书配套实例资源☆38Updated 2 years ago
- 基于flink的用户行为分析☆51Updated last year
- 数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘☆82Updated 3 years ago
- flink sql☆11Updated 2 years ago
- 使用Flink实现用户行为分析☆11Updated 4 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆39Updated last year
- Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to cons…☆79Updated last year
- User behavior log analysis system based on Flink☆24Updated 4 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter 项目☆19Updated 2 years ago
- Flink Sql 教程☆34Updated 5 months ago
- 因现有的datax、sqoop满足不了需求,使用spark封装了一个数据同步工具。☆9Updated 6 years ago
- 此项目主要应用于数据中台或数据平台的数据总线,支持直接实时监听MySQL、MongoDB、PostgreSQL、Oracle、SQL Server、Db2和Cassandra等数据库的数据变更。☆62Updated last year
- 利用Druid SQL Parser解析HiveSQL日志,自动构建字段级别的血缘关系及主外键的自动抽取☆44Updated last year
- 基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf☆50Updated 2 years ago
- 超实用的hive表数据、分区,hdfs文件的自动化清理工具☆19Updated 2 years ago
- 简单易用的ETL工具☆17Updated 6 years ago
- 基于Flink的批流处理实战案例☆37Updated 2 years ago
- flink rest api的spring-boot-starter☆17Updated last year
- log、event 、time 、window 、table、sql、connect、join、async IO、维表、CEP☆68Updated 2 years ago
- Flink 案例代码☆43Updated 2 years ago
- 记录HBase版本API的变迁Demo☆33Updated 6 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 8 years ago
- A distributed data factory, providing data access, etl, scheduling. Easily manage tasks such as hive, spark, clickhouse, flink, shell, py…☆32Updated 2 years ago
- kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流(设置时间窗口,EventTime)☆32Updated 7 years ago
- ☆42Updated 6 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- 学习Spark的代码,关于Spark Core、Spark SQL、Spark Streaming、Spark MLLib☆13Updated 6 years ago