maguichang / DataQuality
数据治理->数据质量
☆10Updated 5 years ago
Alternatives and similar repositories for DataQuality:
Users that are interested in DataQuality are comparing it to the libraries listed below
- Learning Flink : Flink CEP,Flink Core,Flink SQL☆71Updated 3 years ago
- ☆11Updated 5 years ago
- 数据血缘,Hive/Sqoop/HBase/Spark等,发送到kafka后,解析处理使用neo4j生成血缘☆81Updated 3 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 5 years ago
- Flink 案例代码☆43Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 简单易用的ETL工具☆17Updated 5 years ago
- 基于Flink+ClickHouse实时计算平台☆31Updated 2 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆95Updated 2 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- Encapsulated spark 与其他组件的结合api,方便使用,例如 es,hbase,kudu,kafka,mq等☆35Updated 5 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- SparkStreaming中利用MySQL保存Kafka偏移量保证0数据丢失☆45Updated 7 years ago
- 基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf☆50Updated 2 years ago
- hbase+solr实现hbase的二级索引☆48Updated 3 years ago
- flink sql☆11Updated 2 years ago
- 数据治理、数据标准相关的 web 工具☆36Updated 2 years ago
- flink rest api的spring-boot-starter☆17Updated last year
- Flink Sql 教程☆34Updated 3 months ago
- Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to cons…☆78Updated 11 months ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- 此项目主要应用于数据中台或数据平台的数据总线,支持直接实时监听MySQL、MongoDB、PostgreSQL、Oracle、SQL Server、Db2和Cassandra等数据库的数据变更。☆62Updated last year
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆36Updated 6 years ago
- ☆42Updated 5 years ago
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 5 years ago
- A distributed data factory, providing data access, etl, scheduling. Easily manage tasks such as hive, spark, clickhouse, flink, shell, py…☆32Updated 2 years ago
- 基于CDH5.x parcles安装,一键卸载脚本☆38Updated 2 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 7 years ago
- flink技术学习笔记分享☆82Updated 5 years ago
- Flink 案例开发数据清洗、数据报表☆52Updated 2 years ago