如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Spark SQL、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse、Kudu等不同实现方案之间的表现,那你就需要一份标准的数据进行测试,这个开源项目就是为了生成这样的标准数据。
☆285May 24, 2018Updated 7 years ago
Alternatives and similar repositories for data-generator
Users that are interested in data-generator are comparing it to the libraries listed below
Sorting:
- 适合2到6岁的宝宝打字游戏☆10May 29, 2020Updated 5 years ago
- DataX 是异构数据广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。☆23Jan 31, 2018Updated 8 years ago
- 微服务日志之实时日志☆30Jul 6, 2018Updated 7 years ago
- Data self exporting and monitoring platform based on Hive data warehouse. https://hc.smartloli.org☆36Jul 28, 2017Updated 8 years ago
- A data integration framework☆4,109Dec 2, 2025Updated 3 months ago
- 数据库访问中间件,统一的标准sql查询,底层可以是不同的数据库包括mysql、ElasticSearch、kylin、presto等。☆14Apr 21, 2018Updated 7 years ago
- 保障服务的持续高可用、高性能及负载均衡☆17Feb 13, 2017Updated 9 years ago
- 基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生flink SQL所有的语法☆2,062Feb 21, 2024Updated 2 years ago
- presto hbase connector 组件基于Presto Connector接口规范实现,用来给Presto增加查询HBase的功能。相比其他开源版本的HBase Connector,我们的性能要快10到100倍以上。☆241Jan 2, 2023Updated 3 years ago
- 分布式环境下的原子计数器和API每天调用次数限制☆17Feb 13, 2017Updated 9 years ago
- presto's elasticsearch connector☆11Dec 7, 2016Updated 9 years ago
- 自定制的精准短文本搜索服务☆18Jun 7, 2021Updated 4 years ago
- 杭州第六次 Spark & Flink Meetup☆30May 14, 2018Updated 7 years ago
- Bireme is an incremental synchronization tool for the Greenplum / HashData data warehouse☆138Feb 23, 2022Updated 4 years ago
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆177Jul 20, 2017Updated 8 years ago
- datax web。datax中的web配置界面没有集成在一起开源出来,此为web端配置项目。☆100Mar 19, 2019Updated 7 years ago
- 此项目主要应用于数据中台或数据平台的数据总线,支持直接实时监听MySQL、MongoDB、PostgreSQL、Oracle、SQL Server、Db2和Cassandra等数据库的数据变更。☆63Dec 5, 2023Updated 2 years ago
- Byzer (former MLSQL): A low-code open-source programming language for data pipeline, analytics and AI.☆1,843May 29, 2024Updated last year
- 使用spring-boot-spark的一个样例☆11Aug 3, 2018Updated 7 years ago
- Alerting and monitoring tool for Apache Spark☆23May 20, 2022Updated 3 years ago
- A Flexible, Fast, Federated(3F) SQL Analysis Middleware for Multiple Data Sources☆2,051Oct 25, 2022Updated 3 years ago
- Profiling Spark Applications for Performance Comparison and Diagnosis☆17Nov 11, 2018Updated 7 years ago
- spark to yandex clickhouse connector☆69Sep 4, 2019Updated 6 years ago
- An ad hoc query service based on the spark sql engine.(基于spark sql引擎的即席查询服务)☆380Dec 16, 2023Updated 2 years ago
- 一个基于ElasticSearch的业务日志记录工具☆10Nov 5, 2018Updated 7 years ago
- Distributed SQL query engine for running interactive analytic queries against big data sources.☆44Dec 12, 2016Updated 9 years ago
- 分布式任务调度框架教程, 包括: Quartz、Elastic-Job和TBSchedule.☆32Mar 4, 2019Updated 7 years ago
- 基于TBSchedule开发的一个分布式任务调度框架,可以解析任务间的依赖,并执行任务(执行Shell、bat脚本)☆12Aug 5, 2016Updated 9 years ago
- 数据的导出(支持DB2、MySQL、Oracle、Teradata数据库的数据导出)、合并(支 持将多个小数据文件合并成一个大的数据文件)、传输(支持FTP、SFTP数据传输)程序,适用于向指定FTP服务器供数的情况,常见于多个源系统以数据文件的形式向数据仓库集中供数。该程序…☆23Jun 24, 2015Updated 10 years ago
- flink learning blog. http://www.54tianzhisheng.cn/tags/Flink/☆12Jun 14, 2019Updated 6 years ago
- kudu可视化工具☆38Jul 12, 2025Updated 8 months ago
- SQL语法词法分析 SQL表级血缘 SQL字段级别血缘 SQL函数血缘 SQL编译器☆17Nov 1, 2022Updated 3 years ago
- AntsDB is a low latency, high concurrency, MySQL compliant SQL layer for HBase☆109Jun 21, 2022Updated 3 years ago
- log、event 、time 、window 、table、sql、connect、join、async IO、维表、CEP☆69Sep 8, 2022Updated 3 years ago
- A curated list of awesome Greenplum resources, tools☆61Jun 20, 2019Updated 6 years ago
- Apache DolphinScheduler is the modern data orchestration platform. Agile to create high performance workflow with low-code☆14,186Updated this week
- 基于Spring Boot 2.x的前后端分离架构JBoot 前台:Vue+iView 后台:Spring Boot 2.x/Spring Security/JWT/Spring Data JPA+Mybatis-Plus/Redis/Elasticsearch 分布式限…☆23Jan 28, 2019Updated 7 years ago
- SpringMVC+mybaits+Maven+anguljs+html5+mysql+nodejs+BO报表 集成的大数据地产分析项目☆27Mar 7, 2016Updated 10 years ago
- 定期更新Hadoop生态圈中常用大数据组件文档 重心依次为: Flink Solr Sparksql ES Scala Kafka Hbase/phoenix Redis Kerberos (项目包含hadoop思维导图 印象笔记 Scala版本简单demo …☆924Mar 9, 2026Updated last week