BigData Hadoop Spark Código BGD-1005

Horas:

20

Fecha:

22/02/2018

Precio asistente:

935 €

Precio grupo:

Consultar

Objetivos

  • Aprender los componentes de Spark y su integración con Hadoop
  • Aprender a instalar y configurar Spark
  •  Configuración adecuada

Dirigido a

  • Personas que necesiten administrar un Spark en un entorno Hadoop

Requisitos

  • Conocimientos de Sistema Operativo Linux
  • Conocimientos de Java o Scala
  • Conocimientos básicos de  Hadoop

Índice de contenidos

  • Introducción a Spark
    • Características
    • Componentes
  • Conceptos de Spark.
    • Lenguajes usados: Java, Scala, R, Python
    • Spark Shell
    • ¿Qué es RDD?
  • Procesamiento de datos con RDDs
    • Operaciones RDD
    • Key-Value pairs
    • Integración con mapReduce
  • HDFS
    • Repaso de HDFs y su arquitectura
  • Instalación y configuración
    • Montar un cluster standalone
    • Acceso a la consola
    • Otras configuraciones
  • Programación paralela
    • Particiones RDD
    • Trabajar con particiones
    • Realizar operaciones en paralelo
  • Caché y persistencia de datos
    • Introducción a la caché con Spark
    • Persistencia del dato en un ámbito distribuido
  • Aplicaciones con Spark
    • Aplicaciones Spark. Diferencias con spark Shell
    • Spark context
    • Propiedades
    • Construir y ejecutar una aplicación Spark
    • Gestión de logs
  • Spark Streaming
    • Introducción a Spark Streaming
    • Operaciones con Streaming
    • Como desarrollar aplicaciones con Spark Streaming