cmdviegas / hadoop-sparkLinks
This is a script to deploy a cluster with Apache Hadoop and Apache Spark + Apache Hive in distributed mode using Docker as infrastructure.
☆27Updated 3 weeks ago
Alternatives and similar repositories for hadoop-spark
Users that are interested in hadoop-spark are comparing it to the libraries listed below
Sorting:
- ☆71Updated 2 years ago
- ☆44Updated 2 years ago
- ☆39Updated 11 months ago
- Projeto de construção de datalake do zero☆89Updated 9 months ago
- ☆33Updated 3 years ago
- Data Engineering made simple - An opinionated Data Engineering framework☆65Updated last year
- This repository exemplifies a simple ELT process using delta to perform upsert and remove data files that aren't in the latest state of t…☆97Updated 3 years ago
- Repositório com um tutorial simples e claro de Polars, biblioteca de análise de dados no Python, uma alternativa ao Pandas.☆40Updated 2 years ago
- ☆142Updated last year
- Instalador autonomo do Apache Spark para Sistemas linux: based(Debian,RHEL)☆13Updated 6 months ago
- Estudos e projetos.☆63Updated 3 years ago
- Projeto da palestra apresentada no GDG DevFest Cerrado 2019 e TDC BH 2020☆33Updated 5 years ago
- Projeto de simulação de ingestão, tratamento e analise de dados do Ministério da Cultura☆46Updated last year
- Estudo e implementação dos principais algoritmos de Machine Learning em Jupyter Notebooks.☆223Updated 3 years ago
- Desafio para Engenheiro(a) de Dados - VAGAS.com☆29Updated 5 years ago
- My data science Docker image.☆17Updated last week
- Repositório no Bootcamp de Engenharia de Dados da Stack Academy.☆44Updated 2 years ago
- ☆31Updated 2 months ago
- ☆34Updated 4 years ago
- ☆23Updated 4 years ago
- Big Data Ecosystem Docker☆81Updated 3 years ago
- This repo provides the Kubernetes Helm chart for deploying Pyspark Notebook.☆17Updated 2 years ago
- Projeto de Machine Learning do início ao fim no contexto de um e-commerce☆229Updated last year
- The One Billion Row Challenge using Python☆80Updated 10 months ago
- Bootcamp Engenharia de Dados realizado pela IGTI☆28Updated 4 years ago
- Personal roadmap to guide my studies.☆80Updated 3 years ago
- ☆137Updated 4 months ago
- Projeto de Dados para Data Science do início ao fim☆52Updated 10 months ago
- Exercícios do módulo 1 - Bootcamp EDC - IGTI 2021☆49Updated 2 years ago
- Big Data Ecosystem Docker☆418Updated 2 years ago