PU-101 / spark-etl
因现有的datax、sqoop满足不了需求,使用spark封装了一个数据同步工具。
☆9Updated 5 years ago
Alternatives and similar repositories for spark-etl:
Users that are interested in spark-etl are comparing it to the libraries listed below
- Learning Flink : Flink CEP,Flink Core,Flink SQL☆71Updated 3 years ago
- Flink Sql 教程☆34Updated 3 months ago
- ☆38Updated last year
- 基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf☆50Updated 2 years ago
- flinksql-platform☆19Updated 3 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆19Updated 2 years ago
- 基于DataX的通用数据同步微服务,一个Restful接口搞定所有通用数据同步☆53Updated 2 years ago
- MySQL增量数据实时同步到HDFS/Hive☆11Updated 6 years ago
- kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流(设置时间窗口,EventTime)☆32Updated 6 years ago
- 大数据工具封装☆19Updated 2 years ago
- sql实现Structured Streaming☆39Updated 6 years ago
- Encapsulated spark 与其他组件的结合api,方便使用,例如 es,hbase,kudu,kafka,mq等☆35Updated 5 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 7 years ago
- flink-sql 在 flink 上运行 sql 和 构建数据流的平台 基于 apache flink 1.10.0☆110Updated 2 years ago
- Spark 脚手架工程,标准化 spark 开发、部署、测试流程。☆93Updated 5 months ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix ;Hive;Hbase;☆23Updated 2 years ago
- Kafka delivery semantics in the case of failure depend on how and when offsets are stored. Spark output operations are at-least-once. So …☆37Updated 7 years ago
- log、event 、time 、window 、table、sql、connect、join、async IO、维表、CEP☆68Updated 2 years ago
- 基于Java,封装了hbase的底层api,提供了基于注解的ORM支持,只需定义实体类对象,即可完成对hbase的各种操作。同时对List、Set、Map等复杂数据类型提供了支持☆43Updated 8 years ago
- 执行Flink SQL 文件的客户端☆25Updated 3 years ago
- kudu可视化工具☆38Updated 4 years ago
- flink sql☆11Updated 2 years ago
- 智能数据探索服务(Intelligent Data Exploration Service),一站式Data + AI数据解决方案!☆36Updated last year
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数 据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 5 years ago
- 基于flink1.9.1,flink-sql-client模块SDK单独实现,支持Yarn集群的远程SQL任务发布,可以支撑flink sql任务的远程化执行☆48Updated 2 years ago
- hive sql 字段血缘☆22Updated 2 years ago
- java性能采集工具☆51Updated 6 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- Spark structured-streaming 消费kafka数据写入hbase☆33Updated 6 years ago
- Doris表和字段血缘项目☆78Updated 10 months ago