Programación NVIDIA GPU - Extended
Este curso en vivo con instrucción presencial aborda cómo programar GPUs para computación paralela, cómo usar diversas plataformas, cómo trabajar con la plataforma CUDA y sus características, y cómo realizar varias técnicas de optimización utilizando CUDA. Algunas de las aplicaciones incluyen aprendizaje profundo, análisis de datos, procesamiento de imágenes y aplicaciones de ingeniería.
Temario del curso
Introducción
Comprensión de los fundamentos de la metodología de computación heterogénea
¿Por qué computación paralela? Comprensión de la necesidad de la computación paralela
Procesadores multinúcleo: arquitectura y diseño
Introducción a los hilos, conceptos básicos de hilos y fundamentos de la programación en paralelo
Comprensión de los procesos fundamentales de optimización del software de GPU
OpenMP: un estándar para la programación paralela basada en directivas
Ejercicios prácticos/Demostración de diversos programas en máquinas multinúcleo
Introducción a la computación con GPU
Gpus para computación paralela
Modelo de programación de GPUs
Ejercicios prácticos/Demostración de diversos programas en GPU
SDK, toolkit e instalación del entorno para GPU
Trabajo con diversas bibliotecas
Demostración de GPU y herramientas con programas de ejemplo y OpenACC
Comprensión del modelo de programación de CUDA
Aprendizaje de la arquitectura de CUDA
Exploración y configuración de los entornos de desarrollo de CUDA
Trabajo con la API de tiempo de ejecución de CUDA
Comprensión del modelo de memoria de CUDA
Exploración de características adicionales de la API de CUDA
Acceso eficiente a la memoria global en CUDA: optimización de la memoria global
Optimización de transferencias de datos en CUDA utilizando flujos de CUDA
Uso de memoria compartida en CUDA
Comprensión y uso de operaciones atómicas e instrucciones en CUDA
Caso de estudio: procesamiento básico de imágenes digitales con CUDA
Trabajo con programación multi-GPU
Perfilado y muestreo avanzado de hardware en NVIDIA/CUDA
Uso de la API de paralelismo dinámico de CUDA para el lanzamiento dinámico de núcleos
Resumen y conclusión
Requerimientos
- Programación en C
- Linux GCC
Los cursos públicos requieren más de 5 participantes.
Programación NVIDIA GPU - Extended - Reserva
Programación NVIDIA GPU - Extended - Consulta
Programación NVIDIA GPU - Extended - Solicitud de consultoría
Testimonios (1)
La energía y el humor del formador.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Curso - NVIDIA GPU Programming - Extended
Traducción Automática
Próximos cursos
Cursos Relacionados
Desarrollo de aplicaciones de IA con Huawei Ascend y CANN
21 HorasHuawei Ascend es una familia de procesadores de IA diseñada para inferencia y entrenamiento de alto rendimiento.
Esta formación impartida por un instructor, disponible en línea o en las instalaciones, está dirigida a ingenieros de IA y científicos de datos de nivel intermedio que deseen desarrollar y optimizar modelos de redes neuronales utilizando la plataforma Ascend de Huawei y el kit de herramientas CANN.
Al finalizar esta formación, los participantes podrán:
- Configurar el entorno de desarrollo de CANN.
- Desarrollar aplicaciones de IA utilizando MindSpore y CloudMatrix.
- Optimizar el rendimiento en NPUs de Ascend mediante operadores personalizados y técnicas de división (tiling).
- Desplegar modelos en entornos edge o en la nube.
Formato del curso
- Conferencias interactivas y discusiones.
- Práctica directa con Huawei Ascend y el kit de herramientas CANN en aplicaciones de ejemplo.
- Ejercicios guiados centrados en la construcción, entrenamiento y despliegue de modelos.
Opciones de personalización del curso
- Para solicitar una formación personalizada basada en su infraestructura o conjuntos de datos, contáctenos para coordinarla.
Despliegue de Modelos de IA con CANN y Procesadores AI Ascend
14 HorasCANN (Compute Architecture for Neural Networks) es la pila de computación para IA de Huawei, diseñada para desplegar y optimizar modelos de IA en procesadores AI Ascend.
Esta formación práctica con instructor (en línea o presencial) está dirigida a desarrolladores e ingenieros de IA de nivel intermedio que deseen desplegar eficientemente modelos de IA entrenados en hardware Huawei Ascend, utilizando el kit de herramientas CANN y herramientas como MindSpore, TensorFlow o PyTorch.
Al finalizar esta formación, los participantes serán capaces de:
- Comprender la arquitectura de CANN y su papel en el flujo de despliegue de IA.
- Convertir y adaptar modelos desde frameworks populares a formatos compatibles con Ascend.
- Utilizar herramientas como ATC, conversión de modelos OM y MindSpore para inferencia en bordes y en la nube.
- Diagnosticar problemas de despliegue y optimizar el rendimiento en hardware Ascend.
Formato del Curso
- Lección interactiva y demostraciones prácticas.
- Trabajo práctico de laboratorio utilizando herramientas CANN y simuladores o dispositivos Ascend.
- Escenarios de despliegue prácticos basados en modelos de IA del mundo real.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar los detalles.
Inferencia y despliegue de IA con CloudMatrix
21 HorasCloudMatrix es la plataforma unificada de desarrollo e implementación de IA de Huawei, diseñada para soportar pipelines de inferencia escalables y aptos para producción.
Esta formación en vivo impartida por instructores (en línea o presencial) está dirigida a profesionales de la IA con niveles de conocimiento inicial a intermedio que deseen implementar y monitorear modelos de IA utilizando la plataforma CloudMatrix con integración de CANN y MindSpore.
Al finalizar esta formación, los participantes podrán:
- Utilizar CloudMatrix para el empaquetado, despliegue y servicio de modelos.
- Convertir y optimizar modelos para conjuntos de chips Ascend.
- Configurar pipelines para tareas de inferencia en tiempo real y por lotes.
- Monitorear implementaciones y ajustar el rendimiento en entornos de producción.
Formato del curso
- Conferencias interactivas y debates.
- Uso práctico de CloudMatrix con escenarios reales de despliegue.
- Ejercicios guiados centrados en la conversión, optimización y escalado.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su infraestructura de IA o entorno en la nube, por favor contáctenos para coordinar.
Programación de GPU en Aceleradores Biren AI
21 HorasLos aceleradores GPU Biren son GPUs de alto rendimiento diseñadas para cargas de trabajo de IA y HPC, con soporte para entrenamiento e inferencia a gran escala.
Esta capacitación en vivo impartida por un instructor (en línea o en sus instalaciones) está dirigida a desarrolladores de nivel intermedio a avanzado que desean programar y optimizar aplicaciones utilizando la pila de GPU propietaria de Biren, con comparaciones prácticas frente a entornos basados en CUDA.
Al finalizar esta capacitación, los participantes serán capaces de:
- Comprender la arquitectura y jerarquía de memoria de la GPU Biren.
- Configurar el entorno de desarrollo y utilizar el modelo de programación de Biren.
- Traducir y optimizar código estilo CUDA para plataformas Biren.
- Aplicar técnicas de ajuste de rendimiento y depuración.
Formato del curso
- Conferencia interactiva y discusión.
- Uso práctico de la SDK de Biren en cargas de trabajo GPU de ejemplo.
- Ejercicios guiados centrados en la migración y el ajuste de rendimiento.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso basada en su pila de aplicaciones o necesidades de integración, por favor contáctenos para coordinar.
Desarrollo de MLU con Cambricon usando BANGPy y Neuware
21 HorasLas Unidades de Aprendizaje Profundo (MLU) de Cambricon son chips de IA especializados, optimizados para tareas de inferencia y entrenamiento en entornos de borde y centros de datos.
Esta formación impartida por un instructor (en línea o presencial) está dirigida a desarrolladores con nivel intermedio que desean crear e implementar modelos de IA utilizando el marco de trabajo BANGPy y el SDK Neuware en hardware Cambricon MLU.
Al finalizar esta formación, los participantes podrán:
- Configurar y preparar los entornos de desarrollo de BANGPy y Neuware.
- Desarrollar y optimizar modelos basados en Python y C++ para MLU de Cambricon.
- Implementar modelos en dispositivos de borde y centros de datos que ejecuten el entorno de ejecución Neuware.
- Integrar flujos de trabajo de aprendizaje automático con funciones de aceleración específicas para MLU.
Formato del curso
- Clase magistral interactiva y debate.
- Uso práctico de BANGPy y Neuware para desarrollo e implementación.
- Ejercicios guiados centrados en la optimización, integración y pruebas.
Opciones de personalización del curso
- Para solicitar una formación personalizada basada en su modelo de dispositivo Cambricon o caso de uso, contáctenos para coordinarlo.
Introducción a CANN para Desarrolladores de Frameworks de IA
7 HorasCANN (Compute Architecture for Neural Networks) es el conjunto de herramientas de computación inteligente de Huawei, utilizado para compilar, optimizar e implementar modelos de IA en procesadores de IA Ascend.
Esta formación en vivo impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de IA de nivel principiante que desean comprender cómo CANN se integra en el ciclo de vida del modelo, desde el entrenamiento hasta la implementación, y su funcionamiento con frameworks como MindSpore, TensorFlow y PyTorch.
Al finalizar esta formación, los participantes podrán:
- Comprender el propósito y la arquitectura del toolkit CANN.
- Configurar un entorno de desarrollo con CANN y MindSpore.
- Convertir e implementar un modelo de IA simple en hardware Ascend.
- Adquirir conocimientos fundamentales para futuros proyectos de optimización o integración con CANN.
Formato del curso
- Conferencia interactiva y discusión.
- Prácticas con implementación de modelos simples.
- Guía paso a paso del toolchain CANN y los puntos de integración.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizarlo.
CANN para el despliegue de IA en el borde
14 HorasEl kit de herramientas Ascend CANN de Huawei habilita una potente inferencia de IA en dispositivos del borde, como el Ascend 310. CANN proporciona las herramientas esenciales para compilar, optimizar y desplegar modelos en entornos con recursos computacionales y de memoria limitados.
Esta formación presencial impartida por un instructor (en línea o en sitio) está dirigida a desarrolladores e integradores de IA de nivel intermedio que deseen desplegar y optimizar modelos en dispositivos del borde Ascend utilizando la cadena de herramientas CANN.
Al final de esta formación, los participantes podrán:
- Preparar y convertir modelos de IA para el Ascend 310 utilizando las herramientas CANN.
- Construir pipelines de inferencia ligeros utilizando MindSpore Lite y AscendCL.
- Optimizar el rendimiento de los modelos para entornos con limitaciones computacionales y de memoria.
- Desplegar y supervisar aplicaciones de IA en casos de uso reales del borde.
Formato del curso
- Clase interactiva y demostración práctica.
- Trabajo práctico de laboratorio con modelos y escenarios específicos para el borde.
- Ejemplos de despliegue en tiempo real sobre hardware del borde virtual o físico.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para organizarla.
Comprendiendo la Pila de Cómputo con IA de Huawei: Desde CANN hasta MindSpore
14 HorasLa pila de IA de Huawei, desde el SDK de bajo nivel CANN hasta el marco de trabajo de alto nivel MindSpore, ofrece un entorno de desarrollo e implementación de IA estrechamente integrado, optimizado para hardware Ascend.
Esta formación en vivo y guiada por instructores (en línea o presencial) está dirigida a profesionales técnicos de nivel principiante a intermedio que desean comprender cómo los componentes CANN y MindSpore trabajan juntos para respaldar la gestión del ciclo de vida de la IA y las decisiones de infraestructura.
Al finalizar esta formación, los participantes podrán:
- Comprender la arquitectura en capas de la pila de cómputo con IA de Huawei.
- Identificar cómo CANN respalda la optimización de modelos y el despliegue a nivel de hardware.
- Evaluar el marco de trabajo MindSpore y su cadena de herramientas en relación con las alternativas del sector.
- Ubicar la pila de IA de Huawei dentro de entornos empresariales o de nube/servidores propios (on-prem).
Formato del Curso
- Conferencia interactiva y discusión.
- Demostraciones en vivo de sistemas y recorridos basados en casos prácticos.
- Laboratorios guiados opcionales sobre el flujo de modelos desde MindSpore hasta CANN.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizarla.
Optimización del rendimiento de redes neuronales con el SDK CANN
14 HorasEl SDK CANN (Compute Architecture for Neural Networks) es la base de cómputo de IA de Huawei que permite a los desarrolladores ajustar y optimizar el rendimiento de las redes neuronales implementadas en los procesadores de IA Ascend.
Esta formación impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de IA y ingenieros de sistemas de nivel avanzado que desean optimizar el rendimiento de inferencia utilizando el conjunto avanzado de herramientas de CANN, incluyendo el Motor de Grafos, TIK y el desarrollo de operadores personalizados.
Al finalizar esta formación, los participantes serán capaces de:
- Comprender la arquitectura en tiempo de ejecución del SDK CANN y su ciclo de vida de rendimiento.
- Utilizar herramientas de perfilado y el Motor de Grafos para el análisis y la optimización del rendimiento.
- Crear y optimizar operadores personalizados utilizando TIK y TVM.
- Resolver cuellos de botella de memoria y mejorar el rendimiento del modelo.
Formato del curso
- Clase interactiva y discusión.
- Laboratorios prácticos con perfilado en tiempo real y ajuste de operadores.
- Ejercicios de optimización utilizando ejemplos de implementación en casos límite.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinarla.
SDK CANN para Pipelines de Visión por Computadora y PLN
14 HorasEl SDK CANN (Compute Architecture for Neural Networks) proporciona potentes herramientas de implementación y optimización para aplicaciones de IA en tiempo real en visión por computadora y PLN, especialmente en hardware Huawei Ascend.
Esta formación en vivo con instrucción presencial (en línea o en las instalaciones) está dirigida a profesionales de IA de nivel intermedio que deseen construir, implementar y optimizar modelos de visión y lenguaje utilizando el SDK CANN para casos de uso de producción.
Al finalizar esta capacitación, los participantes podrán:
- Implementar y optimizar modelos CV y PLN utilizando CANN y AscendCL.
- Utilizar las herramientas CANN para convertir modelos e integrarlos en flujos de trabajo en tiempo real.
- Optimizar el rendimiento de inferencia para tareas como detección, clasificación y análisis de sentimiento.
- Construir pipelines CV/PLN en tiempo real para escenarios de implementación en edge o en la nube.
Formato del Curso
- Conferencia interactiva y demostración.
- Laboratorio práctico con implementación de modelos y perfilamiento de rendimiento.
- Diseño de pipelines en vivo utilizando casos de uso reales de CV y PLN.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinar.
Construcción de Operadores de IA Personalizados con CANN TIK y TVM
14 HorasCANN TIK (Núcleo de Instrucciones Tensoriales) y Apache TVM permiten una optimización avanzada y la personalización de operadores de modelos de IA para el hardware Huawei Ascend.
Esta formación en vivo impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de sistemas de nivel avanzado que deseen construir, implementar y ajustar operadores personalizados para modelos de IA utilizando el modelo de programación TIK de CANN y la integración del compilador TVM.
Al finalizar esta formación, los participantes serán capaces de:
- Escribir y probar operadores de IA personalizados utilizando el DSL TIK para procesadores Ascend.
- Integrar operadores personalizados en el tiempo de ejecución (runtime) y el gráfico de ejecución de CANN.
- Utilizar TVM para la planificación (scheduling), ajuste automático y medición comparativa (benchmarking) de operadores.
- Depurar y optimizar el rendimiento a nivel de instrucciones para patrones de cálculo personalizados.
Formato del Curso
- Conferencia interactiva y demostración práctica.
- Práctica de codificación de operadores utilizando los flujos de trabajo TIK y TVM.
- Pruebas y ajustes en hardware Ascend o simuladores.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizarla.
Migración de aplicaciones CUDA a arquitecturas de GPU chinas
21 HorasLas arquitecturas de GPU chinas, como Huawei Ascend, Biren y los MLU de Cambricon, ofrecen alternativas a CUDA adaptadas para los mercados locales de inteligencia artificial (IA) y computación de alto rendimiento (HPC).
Esta formación presencial en vivo (en línea o in situ) está dirigida a programadores de GPU avanzados y especialistas en infraestructura que deseen migrar y optimizar sus aplicaciones CUDA existentes para su implementación en plataformas de hardware chinas.
Al finalizar esta formación, los participantes serán capaces de:
- Evaluar la compatibilidad de las cargas de trabajo CUDA existentes con alternativas de chips chinos.
- Portar bases de código CUDA a los entornos CANN de Huawei, Biren SDK y BANGPy de Cambricon.
- Comparar el rendimiento e identificar puntos de optimización entre plataformas.
- Afrontar desafíos prácticos en la compatibilidad y despliegue multiarquitectura.
Formato del curso
- Conferencias interactivas y debates.
- Talleres prácticos de traducción de código y comparación de rendimiento.
- Ejercicios guiados centrados en estrategias de adaptación multi-GPU.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su plataforma o proyecto CUDA, póngase en contacto con nosotros para coordinarlo.
Optimización del rendimiento en Ascend, Biren y Cambricon
21 HorasAscend, Biren y Cambricon son las principales plataformas de hardware de IA en China, cada una ofreciendo herramientas únicas de aceleración y perfilado para cargas de trabajo de IA a escala de producción.
Esta formación presencial impartida por un instructor (en línea o in situ) está dirigida a ingenieros de infraestructura de IA y rendimiento de nivel avanzado que desean optimizar los flujos de trabajo de inferencia y entrenamiento de modelos en varias plataformas de chips de IA chinos.
Al final de esta formación, los participantes serán capaces de:
- Realizar pruebas de referencia (benchmarking) de modelos en las plataformas Ascend, Biren y Cambricon.
- Identificar cuellos de botella del sistema e ineficiencias de memoria/cómputo.
- Aplicar optimizaciones a nivel de grafo, núcleo (kernel) y operador.
- Ajustar los flujos de implementación para mejorar el rendimiento y la latencia.
Formato del curso
- Clases magistrales interactivas y discusión.
- Uso práctico de herramientas de perfilado y optimización en cada plataforma.
- Ejercicios guiados centrados en escenarios de ajuste prácticos.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su entorno de rendimiento o tipo de modelo, por favor contáctenos para organizarlo.