lvgalvao / datalake-format-explorerLinks
Este é um projeto de exemplo que demonstra um processo de ETL (Extração, Transformação e Carga) de dados usando Python, Polars e AWS LocalStack. Ele foi projetado para extrair informações de um artista musical do Spotify, transformar esses dados em diferentes formatos e carregá-los em um "datalake" local usando o LocalStack.
☆15Updated 2 years ago
Alternatives and similar repositories for datalake-format-explorer
Users that are interested in datalake-format-explorer are comparing it to the libraries listed below
Sorting:
- Estudos e projetos.☆62Updated 3 years ago
- ☆146Updated 8 months ago
- Configurações Inicias de Projetos Python☆38Updated 2 years ago
- ☆40Updated last year
- ☆143Updated last year
- Repositório do curso de introdução a data pipelines da Alura Online☆34Updated 4 years ago
- Repositório no Bootcamp de Engenharia de Dados da Stack Academy.☆45Updated 2 years ago
- Big Data Ecosystem Docker☆80Updated 3 years ago
- Projeto de construção de datalake do zero☆100Updated last year
- Projeto de Machine Learning do início ao fim no contexto de um e-commerce☆233Updated last year
- ☆43Updated 3 years ago
- This repository exemplifies a simple ELT process using delta to perform upsert and remove data files that aren't in the latest state of t…☆107Updated 3 years ago
- Curso de SQL do Zero com dados da Gamers Club☆166Updated 3 years ago
- ☆73Updated 2 years ago
- Projeto de simulação de ingestão, tratamento e analise de dados do Ministério da Cultura☆46Updated last year
- ⚡ Este repositório é direcionado para dicas com a linguagem python, que estão sendo postadas em meu linkedin.☆90Updated 2 months ago
- Desafio 5DataGlowUp☆23Updated 2 years ago
- ☆14Updated 4 years ago
- Bootcamp Engenharia de Dados realizado pela IGTI☆28Updated 4 years ago
- Curso oferecido para a DIO sobre ETL utilizando a linguagem Python e as bibliotecas pandas e pandera.☆99Updated 3 years ago
- Repositório central do segundo Workshop☆16Updated last year
- The One Billion Row Challenge using Python☆82Updated last year
- ☆98Updated 3 years ago
- Spyrk-cluster is a data mini-lab, considering the main technologies used these days. It's useful to either understand how to configure a …☆29Updated 4 years ago
- Repository to place/show my python apps☆20Updated 3 years ago
- Projeto de Dados para Data Science do início ao fim☆54Updated last year
- ☆18Updated 3 years ago
- Compartilhamento de estudos e ideias para aplicação prática de Python em diversas áreas (data science, web scraping, microcontroladores, …☆37Updated 11 months ago
- Coisas que eu escrevi na internet da vida sobre transição de carreira, trabalho no exterior e dados para iniciantes☆61Updated 2 years ago
- Instalador autonomo do Apache Spark para Sistemas linux: based(Debian,RHEL)☆13Updated 10 months ago