Contacta con nosotros

Temario del curso

Revisión de los fundamentos de Apache Airflow

  • Conceptos fundamentales: DAGs (Grafos Acíclicos Dirigidos), tareas y operadores
  • Arquitectura y componentes de Airflow
  • Repaso de casos de uso y flujos de trabajo comunes

Optimización del rendimiento de los flujos de trabajo

  • Identificación de cuellos de botella en las tuberías de Airflow
  • Técnicas de optimización a nivel de tarea
  • Aprovechamiento de reintentos de tareas, paralelismo y concurrencia

Gestión de dependencias complejas

  • Definición de dependencias dinámicas en los flujos de trabajo
  • Gestión de flujos de trabajo condicionales y ramificados
  • Uso efectivo de grupos de tareas y sub-DAGs

Características avanzadas en Apache Airflow

  • Creación de operadores y hooks personalizados
  • Implementación de sensores para disparadores externos
  • Integración de servicios de terceros y plugins

Escalado de implementaciones de Apache Airflow

  • Enfoques de escalado horizontal y vertical
  • Uso de Celery Executors para ejecución distribuida
  • Buenas prácticas para el escalado en entornos en la nube

Monitoreo y depuración de flujos de trabajo

  • Configuración del registro (logging) y alertas para el monitoreo de flujos de trabajo
  • Uso de la interfaz de usuario (UI) y la CLI de Airflow para solucionar problemas
  • Identificación y resolución de problemas comunes en implementaciones de Airflow

Seguridad de Apache Airflow

  • Autenticación y control de acceso en Airflow
  • Protección de datos sensibles y configuraciones del entorno
  • Implementación de registros de auditoría para flujos de trabajo

Estudios de caso empresariales y buenas prácticas

  • Diseño de flujos de trabajo robustos para entornos de producción
  • Aprovechamiento de Airflow para ingeniería de datos y pipelines ETL
  • Análisis de casos de la vida real sobre implementaciones escalables de Airflow

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de Apache Airflow
  • Familiaridad con la programación en Python y conceptos de orquestación de flujos de trabajo
  • Experiencia en la gestión e implementación de aplicaciones en entornos Linux

Público objetivo

  • Ingenieros de datos
  • Profesionales de DevOps
  • Desarrolladores de software
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas