Introdução ao PySpark para Engenharia de Dados

Track

Others

Type

Talk

Level

beginner

Language

Portuguese

Duration

20 minutes

Abstract

Esta palestra é destinada para ser uma introdução ao PySpark, a API Python para executar o Apache Spark, com foco na aplicação em engenharia de dados. Serão apresentados os principais conceitos, como processamento distribuído, criação de DataFrames e operações de transformação. O objetivo é mostrar e simplificar o PySpark para iniciantes na área de Engenharia de Dados.

Speakers

Vitoria Rodrigues
Bold Metrics