Programa del Curso

  1. Fundamentos de big data
  2. El Big Data y su papel en el mundo corporativo
  3. Las fases de desarrollo de una estrategia de Big Data dentro de una corporación
  4. Explicar la lógica que subyace a un enfoque holístico de Big Data
  5. Componentes necesarios en una plataforma de Big Data
  6. Solución de almacenamiento de big data
  7. Límites de las tecnologías tradicionales
  8. Información general sobre los tipos de bases de datos
  9. Las cuatro dimensiones del Big Data
  10. Impacto del big data en el negocio
  11. Importancia empresarial del Big Data
  12. Desafíos de la extracción de datos útiles
  13. Integración de Big Data con datos tradicionales
  14. Tecnologías de almacenamiento de big data
  15. Visión general de las tecnologías de big data
  16. Modelos de almacenamiento de datos
  17. Hadoop
  18. Colmena
  19. Casandra
  20. MongoDB
  21. Elegir la tecnología de big data adecuada
  22. Procesamiento de big data
  23. Conexión y extracción de datos de la base de datos
  24. Transformación y preparación de datos para su procesamiento
  25. Uso de Hadoop MapReduce para procesar datos distribuidos
  26. Supervisión y ejecución de trabajos de Hadoop MapReduce
  27. Bloques de creación del sistema de archivos distribuido de Hadoop
  28. Mapreduce y Yarn
  29. Control de datos de streaming con Spark
  30. Herramientas y tecnologías de análisis de big data
  31. Programación de Hadoop con el lenguaje Pig Latin
  32. Consulta de macrodatos con Hive
  33. Minería de datos con Mahout
  34. Herramientas de visualización y generación de informes
  35. Big data en los negocios
  36. Gestión y establecimiento de necesidades de Big Data
  37. Importancia empresarial del Big Data
  38. Selección de las herramientas de big data adecuadas para el problema

 

Conceptos de almacenamiento de datos

  • ¿Qué es Data Ware House?
  • Diferencia entre OLTP y Data Ware Housing
  • Adquisición de datos
  • Extracción de datos
  • Transformación de datos.
  • Carga de datos
  • Mercados de datos
  • Data Mart dependiente vs independiente
  • Diseño de bases de datos

Conceptos de prueba ETL:

  • Introducción.
  • Ciclo de vida del desarrollo de software.
  • Metodologías de ensayo.
  • Proceso de flujo de trabajo de pruebas ETL.
  • Responsabilidades de las pruebas ETL en la etapa de datos.

Fundamentos de Big Data

  • Big Data y su papel en el mundo corporativo
  • Las fases de desarrollo de una Big Data estrategia dentro de una corporación
  • Explique la lógica que subyace a un enfoque holístico de Big Data
  • Componentes necesarios en una Big Data plataforma
  • Solución de almacenamiento de big data
  • Límites de las tecnologías tradicionales
  • Información general sobre los tipos de bases de datos

NoSQL Bases de datos

Hadoop

Reducción de mapas

Apache Spark

 

Requerimientos

Los delegados deben tener un conocimiento y cierta experiencia de las herramientas de storgage y un conocimiento del manejo de grandes conjuntos de datos

  14 horas
 

Número de participantes


Comienza

Termina


Dates are subject to availability and take place between 09:30 and 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (4)

Cursos Relacionados

Unified Batch and Stream Processing with Apache Beam

  14 horas

Categorías Relacionadas