basedosdados / pipelines
🔀 Orquestrador de fluxos de captura, ingestão e tratamento de dados da BD
☆35Updated this week
Alternatives and similar repositories for pipelines:
Users that are interested in pipelines are comparing it to the libraries listed below
- 🖥 Website oficial da BD☆25Updated last week
- 📊 Repositório de códigos simples e replicáveis das análises publicadas.☆107Updated this week
- Gerenciador de fluxos de captura e subida de dados no datalake da Prefeitura do Rio de Janeiro | https://docs.dados.rio/guia-desenvolvedo…☆36Updated last month
- ipeadatapy is a data and metadata extraction package made in Python using Ipeadata database official API. In it's essence it is an API wr…☆74Updated 2 months ago
- Dados sobre os planos de governo das eleições municipais de 2020☆30Updated 4 years ago
- Fast Project Templates☆12Updated 4 years ago
- Data Engineering made simple - An opinionated Data Engineering framework☆65Updated last year
- Library to download, clean and analyze openly available datasets from Brazilian Universal health system, SUS.☆50Updated 2 years ago
- Airflow plugins for implementing data pipelines. | Plugins do Airflow para implementação de pipelines de dados.☆45Updated this week
- ☆51Updated last year
- Repositório com um tutorial simples e claro de Polars, biblioteca de análise de dados no Python, uma alternativa ao Pandas.☆38Updated 2 years ago
- Análise de Dados Abertos da Prova Brasil 2011 com Airflow, S3, Redshift e Metabase☆16Updated last year
- ☆71Updated last year
- This repository exemplifies a simple ELT process using delta to perform upsert and remove data files that aren't in the latest state of t…☆86Updated 3 years ago
- ☆37Updated 7 months ago
- A data engineering personal project for applying some of my skills☆19Updated 3 years ago
- Módulo no Python para extração de dados mensais do CAGED (desagregado a nível de Município, Setor da Economia e Sexo)☆14Updated 2 years ago
- ⚙️ Código de manutenção do datalake (metadados e pacotes de acesso) | 📖 Docs: https://basedosdados.github.io/sdk/☆401Updated last week
- Library to download, clean and analyze openly available datasets from Brazilian Universal health system, SUS.☆182Updated 2 months ago
- Repositório do PoD MeetUp: "Data Science GeoEspacial no Python - Uma Introdução ao GIS".☆11Updated 4 years ago
- Censo de 1872 por município, disponibilizado pela Cedeplar, organizado em formato tidy☆30Updated 2 years ago
- Introdução a séries temporais☆12Updated 4 years ago
- Repositório central do segundo Workshop☆15Updated last year
- This repo provides the Kubernetes Helm chart for deploying Pyspark Notebook.☆17Updated 2 years ago
- A containerized Python framework for a better Data X development workflow. Where X = Science, Engineering, Analytics, etc.☆28Updated 3 years ago
- Projeto de construção de datalake do zero☆82Updated 6 months ago
- ☆33Updated 3 years ago
- Projeto do grupo 3GTeam apresentado no Hackathon de Engenharia de Dados da A3Data no mês de Junho de 2021.☆11Updated 3 years ago
- ☆15Updated 2 months ago
- My data science Docker image.☆17Updated last month