PU-101 / spark-etlLinks

因现有的datax、sqoop满足不了需求，使用spark封装了一个数据同步工具。

☆9

Alternatives and similar repositories for spark-etl

Users that are interested in spark-etl are comparing it to the libraries listed below

Sorting:

pdaodao / fiflow
flink-sql 在 flink 上运行 sql 和构建数据流的平台基于 apache flink 1.10.0
☆111Updated 3 years ago
LinMingQiang / flink-learn
Learning Flink : Flink CEP,Flink Core,Flink SQL
☆72Updated 3 years ago
dijiekstra / flinksql
Flink Sql 教程
☆34Updated 7 months ago
yiwei00000 / flinkSql-remote-submit
☆38Updated 2 years ago
xianqiangHub / flink-practice
log、event 、time 、window 、table、sql、connect、join、async IO、维表、CEP
☆68Updated 2 years ago
TianLangStudio / DataXServer
为DataX(https://github.com/alibaba/DataX) 提供远程多语言调用（ThriftServer，HttpServer）分布式运行（DataX on YARN）功能
☆144Updated 2 weeks ago
xinghalo / Teddy
Spark Streaming监控平台，支持任务部署与告警、自启动
☆128Updated 7 years ago
GuoNingNing / fire-spark
Spark 脚手架工程，标准化 spark 开发、部署、测试流程。
☆94Updated 9 months ago
duhanmin / structured-streaming-Kafka2HBase
Spark structured-streaming 消费kafka数据写入hbase
☆33Updated 6 years ago
thestyleofme / common-datax
基于DataX的通用数据同步微服务，一个Restful接口搞定所有通用数据同步
☆53Updated 3 years ago
E-SoulDataGroup / spark_streaming_kafka_offset
SparkStreaming中利用MySQL保存Kafka偏移量保证0数据丢失
☆45Updated 7 years ago
shengjk / flinksql-platform
flinksql-platform
☆19Updated 4 years ago
code-dm / mriya
Real-time ETL developed by Flink, data from MySQL to Greenplum. Use canal to parse the MySQL binlog, put it into kafka, use Flink to cons…
☆80Updated last year
LinMingQiang / spark-utils
Encapsulated spark 与其他组件的结合api，方便使用，例如 es，hbase，kudu，kafka，mq等
☆35Updated 5 years ago
analysys / Backquarter
易观开源大数据互联网百亿级记录互传Backquarter项目
☆19Updated 3 years ago
scxwhite / parseX
sql解析工具。主要解析hive sql、spark sql、presto sql。从sql中解析出输入表、输出表以及字段等信息
☆96Updated 2 years ago
L11168032 / sql-lineage-parser
通过语法树解析获取字段级血缘数据
☆61Updated 2 years ago
bebee4java / ides
智能数据探索服务(Intelligent Data Exploration Service)，一站式Data + AI数据解决方案！
☆36Updated 2 years ago
jacksoup / hiveMetaMgr
hive仓库元数据管理系统
☆166Updated 8 years ago
Xchunguang / kudu-plus
kudu可视化工具
☆38Updated 2 weeks ago
molsionmo / flink-sql-client
基于flink1.9.1,flink-sql-client模块SDK单独实现，支持Yarn集群的远程SQL任务发布，可以支撑flink sql任务的远程化执行
☆49Updated 2 years ago
thestyleofme / flink-explore
基于canal/kafka conenct的mysql/oracle数据实时同步、flink rest api、flink sql以及udf
☆50Updated 2 years ago
duhanmin / kafka-flink-hbase
flink实时处理kafka传来的数据通过连接池技术写入hbase
☆96Updated 3 years ago
teeyog / blog
My Blog
☆76Updated 7 years ago
wangliangbd / SparkStreaming_Store_KafkaTopicOffset_To_HBase
Kafka delivery semantics in the case of failure depend on how and when offsets are stored. Spark output operations are at-least-once. So …
☆37Updated 8 years ago
xxrznj / flink-kafka-sql
kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流（设置时间窗口，EventTime）
☆32Updated 7 years ago
quan2005 / flink-connector-debezium
此项目主要应用于数据中台或数据平台的数据总线，支持直接实时监听MySQL、MongoDB、PostgreSQL、Oracle、SQL Server、Db2和Cassandra等数据库的数据变更。
☆62Updated last year
ljygz / Flink-CEPplus
基于flink 1.8 源码二次开发，详见MD
☆82Updated 5 years ago
wushengyeyouya / Hive-JDBC-Proxy
Hive-JDBC-Proxy是一个高性能的HiveServer2和Spark ThriftServer的代理服务，具备负载均衡、基于规则转发Hive JDBC Client的请求给到HiveServer2和Spark ThriftServer的能力。
☆32Updated 3 years ago
LinMingQiang / sparkstreaming
封装sparkstreaming动态调节batch time(有数据就执行计算)；支持运行过程中增删topic；封装sparkstreaming 1.6 - kafka 010 用以支持 SSL。
☆180Updated 4 years ago