Temario del curso
Introducción
- Apache Spark vs Hadoop MapReduce
Resumen de las características y arquitectura de Apache Spark
Elegir un lenguaje de programación
Configurar Apache Spark
Crear una aplicación de ejemplo
Elegir el conjunto de datos
Realizar análisis de datos en el conjunto de datos
Procesamiento de datos estructurados con Spark SQL
Procesamiento de datos en streaming con Spark Streaming
Integrar Apache Spark con herramientas de aprendizaje automático de terceros
Usar Apache Spark para el procesamiento de grafos
Optimizar Apache Spark
Resolución de problemas
Resumen y conclusión
Requerimientos
- Experiencia con la línea de comandos de Linux
- Comprensión general del procesamiento de datos
- Experiencia en programación con Java, Scala, Python o R
Audiencia
- Desarrolladores
Testimonios (3)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
La combinación de teoría y práctica con herramientas como databricks