Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Fundamentos de la clasificación de audio
- Tipos de eventos sonosos: ambientales, mecánicos, generados por humanos
- Visión general de casos de uso: vigilancia, monitoreo, automatización
- Clasificación vs. detección vs. segmentación de audio
Datos de audio y extracción de características
- Tipos de archivos de audio y formatos
- Tasa de muestreo, ventana, consideraciones del tamaño de cuadro
- Extracción de MFCCs, características cromáticas, espectrogramas mel
Preparación de datos y anotación
- UrbanSound8K, ESC-50 y conjuntos de datos personalizados
- Etiquetado de eventos sonosos y límites temporales
- Balanceo de conjuntos de datos y aumento de audio
Construcción de modelos de clasificación de audio
- Uso de redes neuronales convolucionales (CNN) para audio
- Entrada del modelo: forma de onda cruda vs. características
- Funciones de pérdida, métricas de evaluación y sobreajuste
Detección de eventos y localización temporal
- Estrategias de detección basadas en cuadros y segmentos
- Post-procesamiento de detecciones usando umbrales y suavizado
- Visualización de predicciones en líneas temporales de audio
Temas avanzados y procesamiento en tiempo real
- Aprendizaje por transferencia para escenarios con pocos datos
- Implementación de modelos con TensorFlow Lite o ONNX
- Procesamiento de audio en streaming y consideraciones de latencia
Desarrollo del proyecto y escenarios de aplicación
- Diseño de un pipeline completo: ingesta hasta clasificación
- Desarrollo de una prueba de concepto para vigilancia, control de calidad o monitoreo
- Registro, alertas e integración con paneles de control o APIs
Resumen y próximos pasos
Requerimientos
- Comprensión de conceptos de aprendizaje automático y entrenamiento de modelos
- Experiencia con programación en Python y preprocesamiento de datos
- Familiaridad con fundamentos del audio digital
Público objetivo
- Científicos de datos
- Ingenieros de aprendizaje automático
- Investigadores y desarrolladores en procesamiento de señales de audio
21 Horas