Contacta con nosotros

Temario del curso

Introducción al aprendizaje por refuerzo con retroalimentación humana (RLHF)

  • ¿Qué es RLHF y por qué importa?
  • Comparación con métodos de ajuste fino supervisado
  • Aplicaciones de RLHF en sistemas modernos de inteligencia artificial

Modelado de recompensas con retroalimentación humana

  • Recopilación y estructuración de la retroalimentación humana
  • Construcción y entrenamiento de modelos de recompensa
  • Evaluación de la efectividad de los modelos de recompensa

Entrenamiento con Optimización de Política Próxima (PPO)

  • Visión general de los algoritmos PPO para RLHF
  • Implementación de PPO con modelos de recompensa
  • Ajustes finos iterativos y seguros de los modelos

Ajuste fino práctico de modelos de lenguaje

  • Preparación de conjuntos de datos para flujos de trabajo de RLHF
  • Ajuste fino práctico de un LLM pequeño mediante RLHF
  • Desafíos y estrategias de mitigación

Escala de RLHF hacia sistemas en producción

  • Consideraciones de infraestructura y potencia de cómputo
  • Aseguramiento de la calidad y bucles de retroalimentación continua
  • Mejores prácticas para el despliegue y mantenimiento

Consideraciones éticas y mitigación del sesgo

  • Abordaje de riesgos éticos en la retroalimentación humana
  • Estrategias de detección y corrección de sesgos
  • Aseguramiento de la alineación y salidas seguras

Casos de estudio y ejemplos del mundo real

  • Caso de estudio: Ajuste fino de ChatGPT con RLHF
  • Otras implementaciones exitosas de RLHF
  • Lecciones aprendidas e perspectivas de la industria

Resumen y próximos pasos

Requerimientos

  • Comprensión de los fundamentos del aprendizaje supervisado y del aprendizaje por refuerzo.
  • Experiencia con ajustes finos de modelos y arquitecturas de redes neuronales.
  • Habilidades en programación Python y marcos de aprendizaje profundo (por ejemplo, TensorFlow, PyTorch).

Público objetivo

  • Ingenieros de aprendizaje automático.
  • Investigadores de inteligencia artificial.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas