Programa del Curso

Arquitectura de Greenplum

  • Procesamiento paralelo y multiprocesamiento simétrico
  • Roles de segmentos y configuración del clúster
  • Escala y movimiento de datos
  • Arquitectura de Greenplum Data Warehouse

Estructuras de Tablas en Greenplum

  • Tablas distribuidas vs. asignadas aleatoriamente
  • Tablas heap vs. tablas solo de apendizaje
  • Formatos de almacenamiento por fila vs. por columna
  • Tablas particionadas y agrupadas

Distribución de Datos y Hashing

  • Lógica de hashing y claves de distribución
  • Gestionar sesgo y su impacto en el rendimiento
  • Mapas hash y estrategias de ubicación de filas

Índices y Optimización del Rendimiento

  • Índices agrupados vs. no agrupados
  • Casos de uso de índices B-tree y bitmap
  • Escanear índices y comportamiento de almacenamiento

Diseño Físico Database

  • Normalización y diseño del modelo lógico
  • Estrategias de acceso al usuario y análisis de distribución
  • Demografía de datos e indicaciones de indexación

Técnicas de Denormalización

  • Datos derivados, tablas resumidas y pre-joins
  • Tablas columnar como particionamiento vertical
  • Data marts y vistas materializadas

Avanzado SQL y Ejecución de Consultas

  • Estrategias de unión y redistribución
  • Funciones OLAP y de ventana
  • Tablas temporales, subconsultas y tablas derivadas

Planificación EXPLAIN y Afinación de Consultas

  • Lectura e interpretación de la salida EXPLAIN
  • Análisis de costos y optimización del plan
  • Movimiento de uniones y operaciones locales en segmentos

Herramientas y Mejores Prácticas de Greenplum

  • ANALYZE y VACUUM
  • Carga y movimiento de datos con Nexus
  • Seguridad, permisos y consejos de rendimiento

Resumen y Próximos Pasos

Requerimientos

  • Comprensión de bases de datos relacionales y SQL
  • Experiencia con almacenes de datos o sistemas analíticos
  • Familiaridad con operaciones de línea de comandos Linux

Público objetivo

  • Arquitectos y ingenieros de datos
  • Administradores y líderes técnicos de Database
  • Desarrolladores BI y especialistas en análisis que trabajan con Greenplum
 21 Horas

Número de participantes


Precio por Participante​

Testimonios (4)

Próximos cursos

Categorías Relacionadas