Temario del curso

Introducción a AIOps

  • ¿Qué es AIOps y por qué es importante?
  • Monitoreo tradicional vs. observabilidad impulsada por AIOps
  • Arquitectura de AIOps y componentes clave

Recopilación y Normalización de Datos Operativos

  • Tipos de datos de observabilidad: métricas, registros y rastreos
  • Ingesta de datos desde múltiples fuentes (servidores, contenedores, nube)
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd)

Correlación de Datos y Detección de Anomalías

  • Correlación de series temporales y métodos estadísticos
  • Uso de modelos de ML para la detección de anomalías
  • Detección de incidentes en sistemas distribuidos

Alertas y Reducción de Ruido

  • Diseño de reglas y umbrales de alerta inteligentes
  • Supresión, deduplicación y agrupamiento de alertas
  • Integración con Alertmanager, Slack, PagerDuty o Opsgenie

Análisis de Causa Raíz y Visualización

  • Uso de tableros para visualizar métricas y detectar tendencias
  • Exploración de eventos y líneas de tiempo para el análisis de causa raíz (RCA)
  • Rastreo de problemas a través de capas con herramientas de rastreo distribuido

Automatización y Remediación

  • Activación de scripts o flujos de trabajo automatizados a partir de incidentes
  • Integración con sistemas ITSM (ServiceNow, Jira)
  • Casos de uso: autocuración, escalado, reenrutamiento de tráfico

Plataformas AIOps de Código Abierto y Comerciales

  • Visión general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Criterios de evaluación para seleccionar una plataforma AIOps
  • Demostración y práctica con un stack seleccionado

Resumen y Pasos Siguientes

Requerimientos

  • Comprensión de las operaciones de TI y los conceptos de monitoreo del sistema
  • Experiencia con herramientas de monitoreo o tableros de control
  • Familiaridad con formatos básicos de registros y métricas

Audiencia

  • Equipos de operaciones responsables de la infraestructura y las aplicaciones
  • Ingenieros de Fiabilidad del Sitio (SREs)
  • Equipos de monitoreo y observabilidad de TI
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas