Programa del Curso

Introducción a los modelos de lenguaje pequeño (SLM)

  • Información general sobre los modelos de lenguaje
  • Evolución de modelos lingüísticos grandes a pequeños
  • Arquitectura y diseño de SLMs
  • Ventajas y limitaciones de los SLM

Fundamentos Técnicos

  • Comprensión de las redes neuronales y los parámetros
  • Procesos de formación para MST
  • Requisitos de datos y optimización de modelos
  • Métricas de evaluación para modelos de lenguaje

SLMs en el Procesamiento del Lenguaje Natural

  • Generación de texto con SLM
  • Traducción y localización de idiomas
  • Análisis de sentimiento y clasificación de texto
  • Respuesta a preguntas y chatbots

Aplicaciones de SLM en el mundo real

  • Aplicaciones móviles: procesamiento de lenguaje en el dispositivo
  • Sistemas embebidos: SLMs en dispositivos IoT
  • IA que preserva la privacidad: procesamiento local de datos
  • Edge computing: SLM en entornos de baja latencia

Casos de estudio

  • Análisis de implementaciones correctas de SLM
  • Aplicaciones específicas de la industria (atención médica, Finance, etc.)
  • Estudio comparativo: SLMs vs. grandes modelos en producción

Direcciones futuras

  • Tendencias de la investigación en MST
  • Desafíos en el escalado y la implementación
  • Consideraciones éticas e IA responsable
  • El camino a seguir: SLM de próxima generación

Talleres prácticos

  • Creación de un SLM sencillo para la generación de texto
  • Integración de SLM en aplicaciones móviles
  • Ajuste fino de SLM para tareas específicas
  • Análisis de rendimiento e interpretabilidad del modelo

Proyecto final

  • Identificación de un espacio problemático para la aplicación de SLM
  • Diseño e implementación de una solución de SLM
  • Probar e iterar en el modelo
  • Presentación del proyecto y resultados

Resumen y próximos pasos

Requerimientos

  • Comprensión básica de los conceptos de aprendizaje automático
  • Familiaridad con Python programación
  • Conocimiento de redes neuronales y aprendizaje profundo

Audiencia

  • Científicos de datos
  • Desarrolladores de software
  • Entusiastas de la IA
 14 horas

Número de participantes


Precio por participante

Próximos cursos