BigData Hadoop. Administración. Código BGD-1001

Horas:

25

Fecha:

CBD

Precio asistente:

1.100 €

Precio grupo:

Consultar

Objetivos

  • Aprender los conceptos de Hadoop y Map/Reduce
  • Aprender a instalar y configurar Haddop
  • Configuración de hardware óptima para un clúster de Hadoop
  • Consideraciones a tener en cuenta para construir tu clúster

Dirigido a

  • Personas que necesiten administrar un entorno Hadoop

Requisitos

  • Conocimientos de Sistema Operativo Linux
  • Conocimientos de Java

Índice de contenidos

  • Big Data
  • Introducción
    • Un poco de historia
    • ¿Qué es Big Data?
    • Tecnologías Big Data
    • Entornos noSQL
  • Introducción a Hadoop y HDFS
    • Conceptos de Hadoop
    • Conceptos de  HDFS
    • Introducción a Map/Reduce
      • MapReduce V1
      • MapReduce V2. Yarn
    • Otras herramientas asociadas: Hive, Pig, HBase, etc…
  • Clúster Hadoop
    • Como se debería montar un cluster hadoop
    • Hardware y software necesario
    • Características de la red
    • Tipos de nodos.
  • Instalación y configuración
    • Tipos de implantaciones.
      • Versión clásica
      • Versión Yarn
    • Instalación de  Hadoop
    • Parámetros habituales
    • Herramientas disponibles para la configuración
  • Jobs
    • ¿Qué son los Jobs
    • Lanzamientos de Jobs
    • Control de Jobs
    • Tipos de planificador
    •  FairScheduler
  • Mantenimiento del clúster
    • Como podemos comprobar el estado del cluster
    • Copiar datos entre clústeres
    • Añadir y quitar nodos del clúster
    • Como hacer un rebalancing del cluster
    • Copias de seguridad de los metadatos
    • NameNode
    • Actualización un clúster
  • Monitorización y rendimiento
    • Como monitorizar un cluster hadoop
    • Ficheros de Log
    • Herramientas web disponibles
    • Problemáticas  más habituales
    • Posibilidades para hacer un benchmarking
  • Instalación y configuración de otros productos adicionales
    • Hive
    • Ping
    • Etc