tbs005 / DataX
DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。
☆23Updated 3 years ago
Alternatives and similar repositories for DataX:
Users that are interested in DataX are comparing it to the libraries listed below
- SpringBoot操作Elasticsearch的实战案例,elasticsearch 2.4.5/5.6.1☆35Updated 4 years ago
- poseidonX 是一个基于jstorm和flink的一体化实时计算服务平台☆55Updated 6 years ago
- 分布式大数据SQL查询可视化界面!☆68Updated 9 years ago
- 数据的导出(支持DB2、MySQL、Oracle、Teradata数据库的数据导出)、合并(支持将多个小数据文件合并成一个大的数据文件)、传输(支持FTP、SFTP数据传输)程序,适用于向指定FTP服务器供数的情况,常见于多个源系统以数据文件的形式向数据仓库集中供数。该程序…☆24Updated 9 years ago
- 基于springboot定义接口网关☆35Updated 7 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆74Updated 2 years ago
- xxl-job-admin 任务调度平台 Spring Boot 版本[后台部分] ,统一改为rest接口☆38Updated 2 years ago
- 基于Drools的 规则引擎+CEP+事件流☆23Updated 7 years ago
- 用于数据迁移、缓存预热,springboot架构。支持数据区间分割、动态调整线程池配置、任务进度实时查看等特性☆45Updated 7 years ago
- springboot项目使用脚手架,集成redis、mysql、pg,hbase、elasticsearch、kafka等常用组件功能☆20Updated 2 years ago
- 实时风控系统,基于spark-streaming、drools、kafka、redis☆51Updated 6 years ago
- 一个优秀的大数据查询平台,提供hive异步任务查询、LDAP用户、数据权限控制、历史查询任务与结果存储、邮件通知、excel下载等功能。☆24Updated 7 years ago
- 规则引擎☆21Updated 7 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 7 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 6 years ago
- 在mysql-binlog-connector-java基础上参考 keking-binlog-distributor,提供了监听mysql数据库二进制日志并进行分发的功能☆15Updated 2 years ago
- 简单实用的同步工具,实现mysql数据库中数据定期同步到elasticsearch,只需简单的配置,便能达到非凡的效果,支持elasticsearch 5.X版本☆48Updated 8 years ago
- 移动用户行为统计系统,服务器端的数据采集分析,参考开源的cobub razor的设计☆36Updated 7 years ago
- 个人学习xxl-job源码 核心部分加上了中文注释☆16Updated 6 years ago
- 分布式数据仓库最佳实践☆57Updated 6 years ago
- 分布式锁,默认是redis实现,可扩展接口增加zk、等其他实现☆10Updated 6 years ago
- 简约而不简单功能强大的配置中心。部署简单、支持 多环境多版本配置管理。支持全局配置、多应用共享配置、配置加密、配置实时同步、spring/springboot无缝对接,细粒度权限控制、安全过滤等功能☆48Updated 2 years ago
- 本项目目的在于构建一个标准化的NLP处理框架,提供企业级的API,以及各种推荐实现和测试包。 目前国内外有不少NLP语言包,包括中科院、复旦大学的,通过对这些常用NLP软件的封装,可以为企业提供一个可以根据需要来对比和无缝切换底层实现的NLP框架。☆22Updated last year
- 一个通用的开源工具集,集Web、Restful服务、分布式服务、分布式数据库、分布式事务、大数据、数据分析、云计算、人工智能、深度学习、机器学习、算法等为一体的通用开源解决方案,持续更新中。。。☆77Updated 2 years ago
- 2016年阿里中间件性能挑战赛初赛题,RocketMQ+JStorm+Tair实时统计双11交易金额☆43Updated 6 years ago
- 易观KongPlus☆19Updated 2 years ago
- 基于DataX的通用数据同步微服务,一个Restful接口搞定所有通用数据同步☆53Updated 2 years ago
- 高效的分布式id生成器,每个客户端实例tps可达到100万,服务端毫无压力。即使服务端宕机了,id生成依然可用。支持多数据中心,支持id加密。☆47Updated 6 years ago
- dubbo日志扩展插件☆25Updated 7 years ago
- java性能采集工具☆51Updated 6 years ago