Talk

SparkSQL: de lo básico a la optimización

Miguel Ángel Fernández Díaz

Apache Spark se ha convertido en el framework de analítica referencia dentro del mundo del Big Data. Uno de sus módulos más populares es Spark SQL, que actúa como nexo de unión entre el propio mundo Big Data y el mundo de Business Intelligence.

Sin embargo, ¿a qué retos se enfrenta, por ejemplo, un consultor de BI cuando va a empezar a utilizar Spark SQL?, ¿tiene Spark SQL un lenguaje SQL estándar?, ¿qué diferencias hay respecto a una base de datos relacional?, ¿cómo podemos acelerar nuestros procesos de análisis de datos?, ¿qué ocurre por dentro de Spark desde que llega una consulta SQL hasta que se obtiene el resultado?

Todos estas preguntas se resolverán en esta charla, empezando desde una perspectiva básica de usuario final hasta una perspectiva más profunda del funcionamiento interno de Spark para así poder sacar el máximo partido a esta herramienta de Big Data.

Medio Spanish Open Source / Free Software Big Data / Data Science

Slides y material adicional

Thursday 14/03/2019

15:30 - 16:20

Track 3 (4.1.D03)

Sobre el ponente

Miguel Ángel Fernández Díaz

Stratio Big Data

Arquitecto Big Data en Stratio. Más de 5 años de experiencia en el sector. Ingeniero en Informática.