Big Data Analytics con Hadoop

  • Nivel del curso: Experto
  • Categorías Big Data y BI
  • Duración 40h
  • Última actualización 7 junio, 2022

Acerca de este curso

Identifique y corrija las causas del bajo rendimiento. Aprenderá sobre el Almacén de consultas, los planes de ejecución adaptativos y la optimización automatizada de una base de datos SQL. Cualquier persona responsable de escribir o crear consultas T-SQL encontrará valiosa la información sobre los cuellos de botella, incluida la forma de reconocerlos y eliminarlos. Este curso cubre las últimas características y técnicas de optimización del rendimiento y está actualizado con la última versión de SQL Server. Si sus consultas no se ejecutan lo suficientemente rápido y está cansado de las llamadas telefónicas de usuarios frustrados, entonces este curso es la respuesta a sus problemas de rendimiento.

Descripción

> Módulo 1. Introducción a Hadoop

Sistema de archivos distribuidos de Hadoop

Marco MapReduce

HILO

Otros cambios

Instalar Hadoop 3

 

> Módulo 2. Descripción general de Big Data Analytics

Introducción a la analítica de datos.

Introducción a big data

Computación distribuida usando Apache Hadoop

El framework de MapReduce

Hive

Apache Spark

Visualización usando Tableau

 

> Módulo 3. Gran procesamiento de datos con MapReduce

El marco de MapReduce

Tipos de trabajo de MapReduce

Patrones de MapReduce

 

> Módulo 4. Informática científica y análisis de Big Data con Python y/ó R y Hadoop

Instalación

Análisis de los datos

Métodos de integración de R y Hadoop

Análisis de datos

 

> Módulo 5. Análisis por lotes con Apache Spark

SparkSQL y DataFrames

API de DataFrame y la API de SQL

Esquema – estructura de datos

Cargando conjuntos de datos

Guardar conjuntos de datos

Agregaciones

Uniones

 

> Módulo 6. Análisis por lotes con Apache Flink

Introducción a Apache Flink

Instalar Flink

Uso de la interfaz de usuario del clúster Flink

Análisis de lotes

Procesamiento continuo con Apache Flink

 

> Módulo 7. Visualización de Big Data

Introducción

Cuadro

Tipos de carta

Usando Python para visualizar datos

Usando R para visualizar datos

Herramientas de visualización de big data

 

> Módulo 8. Uso de los servicios web de Amazon

Amazon Elastic Compute Cloud

Lanzar múltiples instancias de una AMI

¿Qué es AWS Lambda?

Introducción a Amazon S3

Amazon DynamoDB

Secuencias de datos de Amazon Kinesis

¿Qué aprenderé?

  • Explorar las nuevas características de Hadoop junto con HDFS, YARN y MapReduce
  • Conocer bien las capacidades analíticas del ecosistema Hadoop utilizando ejemplos prácticos
  • Integrar Hadoop con R ó Python para un procesamiento de big data más eficiente
  • Aprender a usar Hadoop con Apache Spark y Apache Flink para análisis de datos en tiempo real
  • Configurar un clúster de Hadoop en la nube de AWS
  • Realizar análisis de big data en AWS con Elastic Map Reduce
$10,846.00

Materiales incluidos

  • Material de apoyo digital
  • Certificado de finalización
  • Grabación de las clases en vivo
  • NFT de finalización del curso (próximamente)

Requisitos

  • Computadora con sistema operativo Windows, Mac o Linux
  • Conexión estable a internet
  • Cámara y micrófono
  • Actitud de participación

Audiencia objetivo

  • Analistas de datos, Administradores de Bases de Datos, Estadísticos, Matemáticos, Actuarios, Ingenieros de Datos y Desarrolladores, con interés en versarse en las capacidades analíticas del ecosistema Hadoop para crear soluciones potentes para realizar análisis de Big Data y obtener información.
  • ¿AÚN TE QUEDAN DUDAS? CONSULTA NUESTRA SECCIÓN DE PREGUNTAS FRECUENTES .
  • ¿BUSCAS COTIZAR ESTE CURSO PARA CAPACITAR A TU EMPRESA U ORGANIZACIÓN? CONTÁCTANOS .