Contacta con nosotros

Temario del curso

Introducción a AIOps

  • ¿Qué es AIOps y por qué es importante?
  • Monitoreo tradicional versus observabilidad impulsada por AIOps
  • Arquitectura de AIOps y componentes clave

Recopilación y normalización de datos operativos

  • Tipos de datos de observabilidad: métricas, registros y trazas
  • Ingestión de datos desde múltiples fuentes (servidores, contenedores, nube)
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd)

Correlación de datos y detección de anomalías

  • Correlación de series temporales y métodos estadísticos
  • Uso de modelos de aprendizaje automático para la detección de anomalías
  • Detección de incidentes en sistemas distribuidos

Alertado y reducción de ruido

  • Diseño de reglas y umbrales inteligentes para alertas
  • Supresión, deduplicación y agrupación de alertas
  • Integración con Alertmanager, Slack, PagerDuty u Opsgenie

Análisis de causa raíz y visualización

  • Uso de paneles de control para visualizar métricas y detectar tendencias
  • Exploración de eventos y líneas temporales para el análisis de causa raíz (RCA)
  • Trazado de problemas a través de capas con herramientas de trazabilidad distribuida

Automatización y remediación

  • Ejecución de scripts o flujos de trabajo automatizados a partir de incidentes
  • Integración con sistemas ITSM (ServiceNow, Jira)
  • Casos de uso: autosanación, escalado y reenvío de tráfico

Plataformas AIOps de código abierto y comerciales

  • Descripción general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Criterios de evaluación para la selección de una plataforma AIOps
  • Demostración y práctica con un conjunto seleccionado de herramientas

Resumen y siguientes pasos

Requerimientos

  • Comprensión de los conceptos de operaciones de TI y monitoreo de sistemas
  • Experiencia con herramientas o paneles de control de monitoreo
  • Familiaridad con formatos básicos de registros y métricas

Público objetivo

  • Equipos de operaciones responsables de infraestructura y aplicaciones
  • Ingenieros de Confiabilidad del Sitio (SRE)
  • Equipos de monitoreo y observabilidad de TI
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas