cmdviegas / hadoop-sparkLinks
This is a script to deploy a cluster with Apache Hadoop and Apache Spark + Apache Hive in distributed mode using Docker as infrastructure.
☆27Updated 2 months ago
Alternatives and similar repositories for hadoop-spark
Users that are interested in hadoop-spark are comparing it to the libraries listed below
Sorting:
- Big Data Ecosystem Docker☆421Updated 2 years ago
- ☆33Updated 3 years ago
- ☆40Updated last year
- Data Engineering made simple - An opinionated Data Engineering framework☆65Updated last year
- ☆44Updated 3 years ago
- Projeto da palestra apresentada no GDG DevFest Cerrado 2019 e TDC BH 2020☆33Updated 5 years ago
- ☆71Updated 2 years ago
- This repository exemplifies a simple ELT process using delta to perform upsert and remove data files that aren't in the latest state of t…☆101Updated 3 years ago
- ☆198Updated 2 years ago
- ☆23Updated 4 years ago
- Spyrk-cluster is a data mini-lab, considering the main technologies used these days. It's useful to either understand how to configure a …☆29Updated 4 years ago
- Estudos e projetos.☆62Updated 3 years ago
- Instalador autonomo do Apache Spark para Sistemas linux: based(Debian,RHEL)☆13Updated 8 months ago
- Repository to place/show my python apps☆20Updated 3 years ago
- Projeto de simulação de ingestão, tratamento e analise de dados do Ministério da Cultura☆46Updated last year
- Apply for a job at Olist's Data Team: https://olist.gupy.io/☆51Updated 3 years ago
- ☆143Updated last year
- Estudo e implementação dos principais algoritmos de Machine Learning em Jupyter Notebooks.☆222Updated last month
- Repositório para armazenamento de código e notebooks de postagens do blog e cursos.☆333Updated 2 years ago
- ☆21Updated 4 years ago
- Big Data Ecosystem Docker☆80Updated 3 years ago
- Repositório do curso de introdução a data pipelines da Alura Online☆34Updated 4 years ago
- Desafio para Engenheiro(a) de Dados - VAGAS.com☆31Updated 6 years ago
- ☆34Updated 4 years ago
- Código para workshops Spark com ambiente de desenvolvimento em docker☆27Updated 3 years ago
- Projeto de construção de datalake do zero☆91Updated 11 months ago
- Personal roadmap to guide my studies.☆80Updated 3 years ago
- Repositório com um tutorial simples e claro de Polars, biblioteca de análise de dados no Python, uma alternativa ao Pandas.☆40Updated 2 years ago
- The One Billion Row Challenge using Python☆81Updated 11 months ago
- ☆24Updated last year