BigData Cloudera. Administración. Código BGD-1002

Horas:

25

Fecha:

CBD

Precio asistente:

1.100 €

Precio grupo:

Consultar

Objetivos

  • Aprender los conceptos de Hadoop y Map/Reduce
  • Aprender a instalar y configurar Hadoop
  • Instalar y configurar un entorno Hadoop con distribución Cloudera
  • Consideraciones a tener en cuenta para construir tu clúster

Dirigido a

  • Personas que necesiten administrar un entorno Hadoop

Requisitos

  • Conocimientos de Sistema Operativo Linux
  • Conocimientos básicos de Java

Índice de contenidos

  • Big Data
    • Introducción
    • Un poco de historia
    • ¿Qué es Big Data?
    • Tecnologías Big Data
    • Entornos noSQL
  • Introducción a Hadoop y HDFS
    • Conceptos de Hadoop
    • Conceptos de  HDFS
    • Introducción a Map/Reduce
    • Otras herramientas asociadas: Hive, Pig, HBase, etc…
  • Clúster Hadoop. Requisitos
    • Como se debería montar un cluster hadoop
    • Hardware y software necesario
    • Características de la red
  • Distribuciones
    • Introducción a las distribuciones Hadoop
    • Cloudera
    • HortonWorks
    • Otras
  • Instalación y configuración de Hadoop básico
    • Tipos de instalaciones
      • Versión Clásica.
      • Versión YARN
      • Diferencias
    • Instalación y configuración de HDFS
    • Instalación de Hadoop con YARN
  • HDFS
    • Creación de sistema de ficheros HDFS
    • Configuración y parámetros más importantes
    • Arranque y parada
    • Subida y gestión de ficheros
  • YARN
    • Configuración del cluster con YARN
    • Arranque y parada
    • Gestión de nodos
    • Adición y eliminación de nodos
  • Cloudera
    • Introducción y conceptos
    • Descarga y uso de la distribución
    • Componentes incluidos
  • Herramienta de administración Cloudera Manager
    • Introducción y caraterísticas
    • Versiones
    • Topologia
    • Instalación de un cluster hadoop con Cloudera Manager
    • Tareas de aministración
  • Jobs
    • ¿Qué son los Jobs
    • Lanzamientos de Jobs
    • Control de Jobs
    • Tipos de planificador
    •  FairScheduler
  • Mantenimiento del clúster
    • Como podemos comprobar el estado del cluster
    • Copiar datos entre clústeres
    • Añadir y quitar nodos del clúster
    • Como hacer un rebalancing del cluster
    • Copias de seguridad de los metadatos
    • Actualización un clúster
  • Monitorización y rendimiento
    • Como monitorizar un cluster hadoop
    • Ficheros de Log
    • Herramientas web disponibles
    • Problemáticas  más habituales
    • Posibilidades para hacer un benchmarking
  • Instalación y configuración de otros productos adicionales
    • Hive
    • Impala
    • Pig
    • Sqoop
    • Flume
    • Kafka