Programa del Curso

Introducción a Google Colab y Apache Spark

  • Visión general de Google Colab
  • Introducción a Apache Spark
  • Configuración de Spark en Google Colab

Procesamiento de Datos con Apache Spark

  • Trabajo con RDDs y DataFrames
  • Carga y procesamiento de conjuntos de datos grandes
  • Uso de Spark SQL para consultar datos estructurados

Análisis Avanzado con Spark

  • Aprendizaje automático con Spark MLlib
  • Realización de análisis de datos en tiempo real
  • Computación distribuida con Spark

Visualización y Collaboration en Google Colab

  • Integración de Colab con bibliotecas populares de visualización
  • Flujos de trabajo colaborativos con cuadernos de Colab
  • Compartir y exportar resultados

Optimización de Flujos de Trabajo Big Data

  • Afinación de Spark para rendimiento
  • Optimización del uso de memoria y almacenamiento
  • Escalado de flujos de trabajo para conjuntos de datos grandes

Big Data en la Nube

  • Integración de Google Colab con herramientas basadas en la nube
  • Uso del almacenamiento en la nube para big data
  • Trabajo con Spark en entornos distribuidos en la nube

Estudios de Caso y Mejores Prácticas

  • Revisión de aplicaciones de big data del mundo real
  • Estudios de caso utilizando Apache Spark y Colab
  • Mejores prácticas para el análisis de big data

Resumen y Próximos Pasos

Requerimientos

  • Conocimientos básicos de conceptos de ciencia de datos
  • Familiaridad con Apache Spark
  • Habilidades de programación en Python

Público objetivo

  • Científicos de datos
  • Ingenieros de datos
  • Investigadores que trabajan con grandes volúmenes de datos
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (5)

Próximos cursos

Categorías Relacionadas