Desarrollador Cloudera para Apache Hadoop Código BGD-1004

Horas:

25

Fecha:

CBD

Precio asistente:

1.100 €

Precio grupo:

Consultar

Objetivos

  • Desarrollar aplicaciones MapReduce.
  • Crear unidades de testeo (unit tests) para aplicaciones MapReduce,.
  • Utilizar los combiners, partitioners y la caché distribuida de un MapReduce.
  • Implementar la entrada y salida de datos en aplicaciones MapReduce.
  • Unir un conjunto de datos en MapReduce.
  • Usar los algoritmos Machine Learning de Mahout.
  • Utilizar Hive y Pig para el desarrollo de aplicaciones

Dirigido a

  • Desarrolladores y analistas que requieran de la tecnología y realicen desarrollos de aplicaciones con BIG DATA

Requisitos

  • Conocimientos de Sistema Operativo Linux
  • Conocimientos básicos de Java

Índice de contenidos

  • Fundamentos y HDFS de Hadoop
  • Introducción a MapReduce
  • Hadoop Clusters y el Ecosistema Hadoop
  • Codificación de un programa MapReduce en Java
  • Codificación de un programa MapReduce empleando Streaming
  • Programas MapReduce de Testing Unitario
  • Profundización en la API Hadoop
  • Trucos y Técnicas prácticos de desarrollo
  • Partitioners y Reducers
  • Data Input y Output
  • Algoritmos Compunes de MapReduce
  • Unión de conjuntos de datos en Jobs MapReduce
  • Integración de Hadoop en el Workflow corporativo
  • Introducción a Hive, Impala y Pig
  • Introducción a Oozie