Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción
- ¿Qué es CUDA?
- CUDA frente a OpenCL frente a SYCL
- Vista general de las características y arquitectura de CUDA
- Configuración del entorno de desarrollo
Primeros pasos
- Creación de un nuevo proyecto de CUDA utilizando Visual Studio Code
- Exploración de la estructura y los archivos del proyecto
- Compilación y ejecución del programa
- Muestra de la salida mediante printf y fprintf
API de CUDA
- Comprensión del papel de la API de CUDA en el programa del host
- Uso de la API de CUDA para consultar información y capacidades del dispositivo
- Uso de la API de CUDA para asignar y liberar memoria del dispositivo
- Uso de la API de CUDA para copiar datos entre el host y el dispositivo
- Uso de la API de CUDA para lanzar kernels y sincronizar hilos
- Uso de la API de CUDA para manejar errores y excepciones
CUDA C/C++
- Comprensión del papel de CUDA C/C++ en el programa del dispositivo
- Uso de CUDA C/C++ para escribir kernels que se ejecuten en la GPU y manipulen datos
- Uso de tipos de datos, calificadores, operadores y expresiones de CUDA C/C++
- Uso de funciones integradas de CUDA C/C++, como matemáticas, atómicas, warps, etc.
- Uso de variables integradas de CUDA C/C++, como threadIdx, blockIdx, blockDim, etc.
- Uso de bibliotecas de CUDA C/C++, como cuBLAS, cuFFT, cuRAND, etc.
Modelo de memoria de CUDA
- Comprensión de la diferencia entre los modelos de memoria del host y del dispositivo
- Uso de espacios de memoria de CUDA, como global, compartido, constante y local
- Uso de objetos de memoria de CUDA, como punteros, matrices, texturas y superficies
- Uso de modos de acceso a la memoria de CUDA, como solo lectura, solo escritura, lectura-escritura, etc.
- Uso del modelo de consistencia de memoria de CUDA y mecanismos de sincronización
Modelo de ejecución de CUDA
- Comprensión de la diferencia entre los modelos de ejecución del host y del dispositivo
- Uso de hilos, bloques y cuadrículas de CUDA para definir el paralelismo
- Uso de funciones de hilo de CUDA, como threadIdx, blockIdx, blockDim, etc.
- Uso de funciones de bloque de CUDA, como __syncthreads, __threadfence_block, etc.
- Uso de funciones de cuadrícula de CUDA, como gridDim, gridSync, grupos cooperativos, etc.
Depuración
- Comprensión de los errores y errores comunes en programas de CUDA
- Uso del depurador de Visual Studio Code para inspeccionar variables, puntos de interrupción, pila de llamadas, etc.
- Uso de CUDA-GDB para depurar programas de CUDA en Linux
- Uso de CUDA-MEMCHECK para detectar errores y fugas de memoria
- Uso de NVIDIA Nsight para depurar y analizar programas de CUDA en Windows
Optimización
- Comprensión de los factores que afectan el rendimiento de los programas de CUDA
- Uso de técnicas de coalescencia de CUDA para mejorar el throughput de memoria
- Uso de técnicas de almacenamiento en caché y anticipación de CUDA para reducir la latencia de memoria
- Uso de técnicas de memoria compartida y local de CUDA para optimizar los accesos a la memoria y el ancho de banda
- Uso de perfilización de CUDA y herramientas de perfilización para medir y mejorar el tiempo de ejecución y la utilización de recursos
Resumen y próximos pasos
Requerimientos
- Comprensión del lenguaje C/C++ y conceptos de programación paralela
- Conocimientos básicos de arquitectura informática y jerarquía de memoria
- Experiencia con herramientas de línea de comandos y editores de código
Público objetivo
- Desarrolladores que desean aprender a utilizar CUDA para programar GPUs NVIDIA y explotar su paralelismo
- Desarrolladores que desean escribir código de alto rendimiento y escalable que pueda ejecutarse en diferentes dispositivos CUDA
- Programadores que desean explorar los aspectos de bajo nivel de la programación de GPUs y optimizar el rendimiento de su código
28 Horas