Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a AIOps
- ¿Qué es AIOps y por qué es importante?
- Monitoreo tradicional vs. observabilidad impulsada por AIOps
- Arquitectura de AIOps y componentes clave
Recopilación y Normalización de Datos Operativos
- Tipos de datos de observabilidad: métricas, registros y rastreos
- Ingesta de datos desde múltiples fuentes (servidores, contenedores, nube)
- Uso de agentes y exportadores (Prometheus, Beats, Fluentd)
Correlación de Datos y Detección de Anomalías
- Correlación de series temporales y métodos estadísticos
- Uso de modelos de ML para la detección de anomalías
- Detección de incidentes en sistemas distribuidos
Alertas y Reducción de Ruido
- Diseño de reglas y umbrales de alerta inteligentes
- Supresión, deduplicación y agrupamiento de alertas
- Integración con Alertmanager, Slack, PagerDuty o Opsgenie
Análisis de Causa Raíz y Visualización
- Uso de tableros para visualizar métricas y detectar tendencias
- Exploración de eventos y líneas de tiempo para el análisis de causa raíz (RCA)
- Rastreo de problemas a través de capas con herramientas de rastreo distribuido
Automatización y Remediación
- Activación de scripts o flujos de trabajo automatizados a partir de incidentes
- Integración con sistemas ITSM (ServiceNow, Jira)
- Casos de uso: autocuración, escalado, reenrutamiento de tráfico
Plataformas AIOps de Código Abierto y Comerciales
- Visión general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criterios de evaluación para seleccionar una plataforma AIOps
- Demostración y práctica con un stack seleccionado
Resumen y Pasos Siguientes
Requerimientos
- Comprensión de las operaciones de TI y los conceptos de monitoreo del sistema
- Experiencia con herramientas de monitoreo o tableros de control
- Familiaridad con formatos básicos de registros y métricas
Audiencia
- Equipos de operaciones responsables de la infraestructura y las aplicaciones
- Ingenieros de Fiabilidad del Sitio (SREs)
- Equipos de monitoreo y observabilidad de TI
14 Horas