ayshaysha / aws-csv-to-parquet-converterLinks

This Script gets CSV file from Amazon S3 using Python Library Boto3 and converts it to Parquet Format before uploading the new Parquet Version again to S3.

☆9

Alternatives and similar repositories for aws-csv-to-parquet-converter

Users that are interested in aws-csv-to-parquet-converter are comparing it to the libraries listed below

Sorting:

mehd-io / duckdb-dataviz-demo
DuckDB with Dashboarding tools demo evidence, streamlit and rill
☆16Updated last year
anna-anisienia / data-discovery-api
☆15Updated 4 years ago
aws-samples / email-intelligent-automation-bedrock
☆10Updated 10 months ago
untitled-data-company / dlt-rest-api-tutorial
The code to follow along our tutorials for the dlt rest_api source
☆10Updated last year
aws-samples / aws-glue-test-data-generator
AWS Glue Configurable Test Data Generator for S3 Data Lakes and DynamoDB
☆17Updated last year
aws-samples / serverless-datalake
Serverless Datalake architecture
☆13Updated 2 years ago
dacort / duckdb-athena-extension
An experimental Athena extension for DuckDB 🐤
☆54Updated 6 months ago
moj-analytical-services / etl_manager
A python package to create a database on the platform using our moj data warehousing framework
☆22Updated this week
tinybirdco / use-case-examples
Use cases examples using Versions
☆11Updated 2 months ago
aws-samples / aws-dynamodb-large-object-patterns
This repository contains example patterns for storing large objects with DynamoDB.
☆12Updated last year
Zenobia000 / Stock-Prediction-System
股市情報系統
☆11Updated 10 months ago
syahvan / simple-doc-chatbot
a Retrieval-Augmented Generation (RAG) multi-document chatbot application using Llama 3, Langchain, Streamlit, and Groq API
☆10Updated 10 months ago
aws-solutions-library-samples / guidance-for-generating-product-descriptions-with-amazon-bedrock
Building Product Descriptions with AWS Bedrock and Rekognition
☆10Updated 8 months ago
velascoluis / serverless-duckdb
A serverless duckDB deployment at GCP
☆39Updated 2 years ago
aws-samples / amazon-textract-a2i-pdf
☆16Updated 2 years ago
infinityworks / snow-cannon
An infrastructure as code approach to deploying Snowflake using Terraform
☆25Updated 2 years ago
moj-analytical-services / dataengineeringutils3
Fully unit tested utility functions for data engineering. Python 3 only.
☆17Updated 10 months ago
duckdb / duckdb-aws
☆52Updated this week
giusedroid / serverless-rag-python
Retrieval Augmented Generation, but no servers involved. Backed by S3
☆10Updated last year
codingcyclist / dlt-aws-lambda
Boilerplates for running DLT on AWS Lambda to create well-structured datasets from unstructured JSON without breaking a sweat
☆18Updated 3 months ago
nicor88 / dbt-serverless
Run dbt serverless in the Cloud (AWS)
☆42Updated 5 years ago
dlt-hub / dlt_demos
demo examples how to load data from different sources to different destinations
☆21Updated 5 months ago
aws-samples / tabular-column-semantic-search
Code accompanying AWS blog post "Build a Semantic Search Engine for Tabular Columns with Transformers and Amazon OpenSearch Service"
☆17Updated last year
danielbeach / DuckDBwithAWSLambda
Using DuckDB with AWS Lambda to process Delta Lake data
☆28Updated 5 months ago
garystafford / dbt-redshift-demo
dbt / Amazon Redshift Demonstration Project
☆34Updated 2 years ago
aws-samples / iceberg-streaming-examples
This repo contains examples of high throughput ingestion using Apache Spark and Apache Iceberg. These examples cover IoT and CDC scenario…
☆25Updated last week
bmsuisse / lakeapi
API for distributing Data Lake Data
☆11Updated 3 months ago
duyet / related-skills-visualization
https://duyet.github.io/related-skills-visualization/index.html
☆11Updated 5 years ago
aws-samples / sam-sf-sagemaker-workflow
☆13Updated 2 years ago
danhphan / trusted-data-pipeline
Building 3D Trusted Data Pipelines With Dagster, Dbt, and Duckdb
☆21Updated last year