wirelessr / flink-iceberg-playgroundLinks

minio as local storage and DynamoDB as catalog

☆15

Alternatives and similar repositories for flink-iceberg-playground

Users that are interested in flink-iceberg-playground are comparing it to the libraries listed below

Sorting:

sap1ens / heimdall
Dashboard for operating Flink jobs and deployments.
☆41Updated last month
duckdb / duckdb-aws
☆55Updated 3 weeks ago
aws-samples / amazon-kinesis-data-analytics-snapshot-manager-for-flink
Snapshot manager for Amazon Kinesis Data Analytics for Apache Flink helps the users to generate a snapshot on a periodic basis.
☆19Updated 2 years ago
awslabs / s3-tables-catalog
The Amazon S3 Tables catalog is a client library that bridges control plane operations provided by S3 Tables to engines like Apache Spark…
☆139Updated 2 months ago
Wuerike / kafka-iceberg-streaming
Docker envinroment to stream data from Kafka to Iceberg tables
☆30Updated last year
vinimdocarmo / quackfs
FUSE-based DuckDB file system 🦆
☆48Updated 4 months ago
polyzos / stream-processing-with-apache-flink
☆61Updated last year
MaterializeInc / mz-hack-day-2022
Official repo for the Materialize + Redpanda + dbt Hack Day 2022, including a sample project to get everyone started!
☆60Updated 3 years ago
conduktor / conduktor-gateway-demos
Demos using Conduktor Gateway
☆18Updated last year
arempter / hive-metastore-docker
Example for article Running Spark 3 with standalone Hive Metastore 3.0
☆102Updated 2 years ago
developer-advocacy-dremio / definitive-guide-to-apache-iceberg
☆103Updated 9 months ago
sibytes / yetl
Yet Another (Spark) ETL Framework
☆21Updated 2 years ago
ismailsimsek / iceberg-examples
Apache iceberg Spark s3 examples
☆20Updated last year
memiiso / debezium-server-bigquery
Replicates any database (CDC events) to Bigquery in real time
☆23Updated last week
aws-samples / amazon-kinesis-analytics-streaming-etl
Streaming ETL with Apache Flink and Amazon Kinesis Data Analytics
☆65Updated 2 years ago
aws-samples / amazon-kinesis-data-analytics-flink-benchmarking-utility
Amazon Managed Service for Apache Flink Benchmarking Utility helps with capacity planning, integration testing, and benchmarking of Amazo…
☆21Updated 2 years ago
twalthr / flink-api-examples
Examples for using Apache Flink® with DataStream API, Table API, Flink SQL and connectors such as MySQL, JDBC, CDC, Kafka.
☆64Updated 2 years ago
rivian / delta-go
☆85Updated 5 months ago
ververica / lab-flink-latency
Lab for testing different Flink job latency optimization techniques covered in a Flink Forward 2021 talk
☆27Updated 3 years ago
trinodb / tempto
A testing framework for Trino
☆26Updated 7 months ago
MartijnVisser / flink-only-sql
Traditionally, engineers were needed to implement business logic via data pipelines before business users can start using it. Using this …
☆12Updated this week
linkedin / Hoptimator
Multi-hop declarative data pipelines
☆122Updated last week
aws-samples / amazon-managed-service-for-apache-flink-examples
Collection of code examples for Amazon Managed Service for Apache Flink
☆75Updated last week
BigDataBoutique / presto-cloud-deploy
Deploy Presto on the cloud easily, using Terraform and Packer
☆45Updated 2 years ago
aws-samples / amazon-kinesis-data-analytics-examples
Example applications in Java, Python and SQL for Kinesis Data Analytics, demonstrating sources, sinks, and operators.
☆146Updated last year
FINRAOS / MegaSparkDiff
A Spark-based data comparison tool at scale which facilitates software development engineers to compare a plethora of pair combinations o…
☆52Updated 4 months ago
aws-samples / amazon-eks-apache-spark-etl-sample
Spark ETL example processing New York taxi rides public dataset on EKS
☆44Updated 2 years ago
slidoapp / duckberg
Python package for querying iceberg data through duckdb.
☆70Updated last year
bernhard-42 / pyspark-atlas
PySpark for ETL jobs including lineage to Apache Atlas in one script via code inspection
☆18Updated 8 years ago
aws-samples / emr-spark-benchmark
☆25Updated last year