Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Panorama de las tecnologías de reconocimiento de voz
- Historia y evolución del reconocimiento de voz
- Modelos acústicos, modelos de lenguaje y decodificación
- Arquitecturas modernas: RNNs, transformers y Whisper
Preprocesamiento de audio y fundamentos de transcripción
- Manejo de formatos de audio y tasas de muestreo
- Limpieza, recorte y segmentación de audio
- Generación de texto a partir del audio: en tiempo real vs por lotes
Práctica con Whisper y otras APIs
- Instalación y uso de OpenAI Whisper
- Llamadas a APIs en la nube (Google, Azure) para transcripción
- Comparación de rendimiento, latencia y costo
Idiomas, acentos y adaptación al dominio
- Trabajo con múltiples idiomas y acentos
- Vocabularios personalizados y tolerancia al ruido
- Manejo de lenguaje legal, médico o técnico
Formateo de salida e integración
- Adición de marcas de tiempo, puntuación y etiquetas de orador
- Exportación a formatos de texto, SRT o JSON
- Integración de transcripciones en aplicaciones o bases de datos
Laboratorios de implementación de casos de uso
- Transcripción de reuniones, entrevistas o podcasts
- Sistemas de comandos voz a texto
- Subtítulos en tiempo real para transmisiones de video/audio
Evaluación, limitaciones y ética
- Métricas de precisión y benchmarking de modelos
- Sesgo y equidad en los modelos de voz
- Consideraciones de privacidad y cumplimiento normativo
Resumen y próximos pasos
Requerimientos
- Un conocimiento de conceptos generales de IA y aprendizaje automático
- Familiaridad con formatos y herramientas de archivos de audio o multimedia
Público objetivo
- Científicos de datos e ingenieros de IA que trabajan con datos de voz
- Desarrolladores de software que construyen aplicaciones basadas en transcripción
- Organizaciones que exploran el reconocimiento de voz para la automatización
14 Horas