airscholar / ApacheFlink-SalesAnalyticsLinks

This repository contains an end-to-end data engineering project using Apache Flink, focused on performing sales analytics. The project demonstrates how to ingest, process, and analyze sales data, showcasing the capabilities of Apache Flink for big data processing.

☆11

Alternatives and similar repositories for ApacheFlink-SalesAnalytics

Users that are interested in ApacheFlink-SalesAnalytics are comparing it to the libraries listed below

Sorting:

airscholar / changecapture-e2e
This project shows how to capture changes from postgres database and stream them into kafka
☆36Updated last year
airscholar / FlinkCommerce
This repository contains an Apache Flink application for real-time sales analytics built using Docker Compose to orchestrate the necessar…
☆45Updated last year
airscholar / RealtimeStreamingEngineering
This project serves as a comprehensive guide to building an end-to-end data engineering pipeline using TCP/IP Socket, Apache Spark, OpenA…
☆38Updated last year
airscholar / SparkingFlow
This project demonstrates how to use Apache Airflow to submit jobs to Apache spark cluster in different programming laguages using Python…
☆45Updated last year
Kavit900 / data-streaming-kafka-flink-postgres
☆33Updated last year
airscholar / realtime-voting-data-engineering
This repository contains the code for a realtime election voting system. The system is built using Python, Kafka, Spark Streaming, Postgr…
☆41Updated last year
airscholar / modern-data-eng-dbt-databricks-azure
In this project, we setup and end to end data engineering using Apache Spark, Azure Databricks, Data Build Tool (DBT) using Azure as our …
☆32Updated last year
josephmachado / beginner_de_project_stream
Simple stream processing pipeline
☆102Updated last year
josephmachado / online_store
End to end data engineering project
☆56Updated 2 years ago
raashidsalih / churn-pipeline
A custom end-to-end analytics platform for customer churn
☆12Updated last month
LinkedInLearning / end-to-end-data-engineering-project-4413618
This repo is for the Linkedin Learning course: End-to-End Data Engineering Project
☆22Updated last year
airscholar / Kubernetes-For-DataEngineering
This repository contains the necessary configuration files and DAGs (Directed Acyclic Graphs) for setting up a robust data engineering en…
☆21Updated last year
sarthak-sarbahi / data-analytics-minio-spark
☆14Updated last year
ongxuanhong / de02-pyspark-optimization
☆14Updated 2 years ago
dominikhei / Local-Data-LakeHouse
Sample Data Lakehouse deployed in Docker containers using Apache Iceberg, Minio, Trino and a Hive Metastore. Can be used for local testin…
☆72Updated last year
damavis / advanced-airflow
Apache Airflow advanced functionalities examples
☆19Updated last year
JesusAcuna / data-engineering-project
☆28Updated last year
josephmachado / data-engineering-interview-series
Repository for Data Engineering Interview Series
☆32Updated 8 months ago
muhammetbektas / spark_clickhouse_streaming
Realtime Data Engineering Project
☆30Updated 5 months ago
simardeep1792 / Data-Engineering-Streaming-Project
☆41Updated 11 months ago
Stefen-Taime / modern-data-pipeline
reating a modern data pipeline using a combination of Terraform, AWS Lambda and S3, Snowflake, DBT, Mage AI, and Dash.
☆14Updated 2 years ago
josephmachado / docker_for_data_engineers
Code for blog at: https://www.startdataengineering.com/post/docker-for-de/
☆38Updated last year
astronautyates / AirflowSnowflakeDBTQuickstart
☆22Updated last year
SatadruMukherjee / Data-Preprocessing-Models
☆66Updated last month
GrzegorzGatkowski / Air_Pollution_Pipeline
Data Engineering Project in GCP
☆20Updated 2 years ago
josephmachado / data_engineering_best_practices_log
Code to demonstrate data engineering metadata & logging best practices
☆16Updated last year
airscholar / Japan-visa-data-engineering
This project provides an end-to-end data processing and visualization of visa numbers in Japan using PySpark and Plotly. The spark cluste…
☆11Updated last year
yTek01 / docker-spark-airflow
☆39Updated 2 years ago
judeleonard / Prescriber-ETL-data-pipeline
An End-to-End ETL data pipeline that leverages pyspark parallel processing to process about 25 million rows of data coming from a SaaS ap…
☆25Updated 2 years ago
alonsomedo / os-data-stack
Building a Data Pipeline with an Open Source Stack
☆55Updated last year