Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción
- ¿Qué es ROCm?
- ¿Qué es HIP?
- ROCm frente a CUDA frente a OpenCL
- Visión general de las características y arquitectura de ROCm e HIP
- Configuración del entorno de desarrollo
Primeros pasos
- Creación de un nuevo proyecto ROCm utilizando Visual Studio Code
- Exploración de la estructura y los archivos del proyecto
- Compilación y ejecución del programa
- Visualización de la salida mediante printf y fprintf
API de ROCm
- Comprensión del papel de la API de ROCm en el programa host
- Uso de la API de ROCm para consultar información y capacidades del dispositivo
- Uso de la API de ROCm para asignar y liberar memoria del dispositivo
- Uso de la API de ROCm para copiar datos entre el host y el dispositivo
- Uso de la API de ROCm para lanzar kernels y sincronizar hilos
- Uso de la API de ROCm para gestionar errores y excepciones
Lenguaje HIP
- Comprensión del papel del lenguaje HIP en el programa del dispositivo
- Uso del lenguaje HIP para escribir kernels que se ejecuten en la GPU y manipulen datos
- Uso de tipos de datos, calificadores, operadores y expresiones de HIP
- Uso de funciones, variables y bibliotecas integradas de HIP para realizar tareas y operaciones comunes
Modelo de memoria de ROCm e HIP
- Comprensión de las diferencias entre los modelos de memoria del host y del dispositivo
- Uso de espacios de memoria de ROCm e HIP, como global, compartido, constante y local
- Uso de objetos de memoria de ROCm e HIP, como punteros, matrices, texturas y superficies
- Uso de modos de acceso a la memoria de ROCm e HIP, como solo lectura, solo escritura, lectura-escritura, etc.
- Uso del modelo de consistencia de memoria y mecanismos de sincronización de ROCm e HIP
Modelo de ejecución de ROCm e HIP
- Comprensión de las diferencias entre los modelos de ejecución del host y del dispositivo
- Uso de hilos, bloques y cuadrículas de ROCm e HIP para definir el paralelismo
- Uso de funciones de hilo de ROCm e HIP, como hipThreadIdx_x, hipBlockIdx_x, hipBlockDim_x, etc.
- Uso de funciones de bloque de ROCm e HIP, como __syncthreads, __threadfence_block, etc.
- Uso de funciones de cuadrícula de ROCm e HIP, como hipGridDim_x, hipGridSync, grupos cooperativos, etc.
Depuración
- Comprensión de los errores y errores comunes en los programas de ROCm e HIP
- Uso del depurador de Visual Studio Code para inspeccionar variables, puntos de ruptura, pila de llamadas, etc.
- Uso del depurador ROCm para depurar programas de ROCm e HIP en dispositivos AMD
- Uso del perfilador ROCm para analizar programas de ROCm e HIP en dispositivos AMD
Optimización
- Comprensión de los factores que afectan el rendimiento de los programas de ROCm e HIP
- Uso de técnicas de coalescencia de ROCm e HIP para mejorar el rendimiento de la memoria
- Uso de técnicas de almacenamiento en caché y precarga de datos de ROCm e HIP para reducir la latencia de memoria
- Uso de técnicas de memoria compartida y memoria local de ROCm e HIP para optimizar los accesos a la memoria y el ancho de banda
- Uso de herramientas de perfilado de ROCm e HIP para medir y mejorar el tiempo de ejecución y la utilización de recursos
Resumen y próximos pasos
Requerimientos
- Comprensión del lenguaje C/C++ y de los conceptos de programación paralela.
- Conocimientos básicos de arquitectura de computadoras y jerarquía de memoria.
- Experiencia con herramientas de línea de comandos y editores de código.
Audiencia objetivo
- Desarrolladores que desean aprender a utilizar ROCm e HIP para programar GPUs AMD y explotar su paralelismo.
- Desarrolladores que desean escribir código de alto rendimiento y escalable que pueda ejecutarse en diferentes dispositivos AMD.
- Programadores que desean explorar los aspectos de bajo nivel de la programación de GPUs y optimizar el rendimiento de su código.
28 Horas