gbieul / spyrk-cluster
Spyrk-cluster is a data mini-lab, considering the main technologies used these days. It's useful to either understand how to configure a cluster, or just to take it for granted to use for testing with submit or interactive jobs.
☆29Updated 4 years ago
Alternatives and similar repositories for spyrk-cluster:
Users that are interested in spyrk-cluster are comparing it to the libraries listed below
- ☆44Updated 2 years ago
- ☆71Updated last year
- ☆38Updated 8 months ago
- Big Data Ecosystem Docker☆81Updated 2 years ago
- ☆33Updated 3 years ago
- Data Engineering made simple - An opinionated Data Engineering framework☆65Updated last year
- Projeto de simulação de ingestão, tratamento e analise de dados do Ministério da Cultura☆46Updated last year
- Repositório do curso de introdução a data pipelines da Alura Online☆34Updated 4 years ago
- ☆37Updated 2 years ago
- Estudos e projetos.☆62Updated 3 years ago
- ☆21Updated 4 years ago
- Instalador autonomo do Apache Spark para Sistemas linux: based(Debian,RHEL)☆13Updated 4 months ago
- This repository exemplifies a simple ELT process using delta to perform upsert and remove data files that aren't in the latest state of t…☆86Updated 3 years ago
- Exercícios do módulo 1 - Bootcamp EDC - IGTI 2021☆49Updated 2 years ago
- Repositório com as demonstrações e dados compartilhadas durante os webinars do Databricks Journey Brasil☆19Updated 2 years ago
- Repositório no Bootcamp de Engenharia de Dados da Stack Academy.☆44Updated 2 years ago
- Projeto de construção de datalake do zero☆82Updated 7 months ago
- Repository to place/show my python apps☆19Updated 3 years ago
- ☆141Updated last year
- Bootcamp Engenharia de Dados realizado pela IGTI☆27Updated 4 years ago
- Desafio para Engenheiro(a) de Dados - VAGAS.com☆28Updated 5 years ago
- Código para workshops Spark com ambiente de desenvolvimento em docker☆27Updated 3 years ago
- ☆126Updated last month
- Modern Data Stack☆62Updated 7 months ago
- Criando Lambda Functions para Ingerir Dados de APIs com AWS CDK☆13Updated 3 years ago
- Estrutura completa para iniciar um projeto de dados com Python, abrangendo ambiente, git, desenvolvimento, testes e documentação.☆101Updated 5 months ago
- ☆13Updated 3 years ago
- ☆14Updated last year
- Projeto de Machine Learning do início ao fim no contexto de um e-commerce☆231Updated 11 months ago
- Arquitetura CRM de Baixo Custo com Gen AI, projetada para startups que precisam processar e analisar dados de vendas de forma eficiente.☆52Updated 2 months ago