Big Data Analytics con Hadoop
Acerca de este curso
Identifique y corrija las causas del bajo rendimiento. Aprenderá sobre el Almacén de consultas, los planes de ejecución adaptativos y la optimización automatizada de una base de datos SQL. Cualquier persona responsable de escribir o crear consultas T-SQL encontrará valiosa la información sobre los cuellos de botella, incluida la forma de reconocerlos y eliminarlos. Este curso cubre las últimas características y técnicas de optimización del rendimiento y está actualizado con la última versión de SQL Server. Si sus consultas no se ejecutan lo suficientemente rápido y está cansado de las llamadas telefónicas de usuarios frustrados, entonces este curso es la respuesta a sus problemas de rendimiento.Descripción
> Módulo 1. Introducción a Hadoop
Sistema de archivos distribuidos de Hadoop
Marco MapReduce
HILO
Otros cambios
Instalar Hadoop 3
> Módulo 2. Descripción general de Big Data Analytics
Introducción a la analítica de datos.
Introducción a big data
Computación distribuida usando Apache Hadoop
El framework de MapReduce
Hive
Apache Spark
Visualización usando Tableau
> Módulo 3. Gran procesamiento de datos con MapReduce
El marco de MapReduce
Tipos de trabajo de MapReduce
Patrones de MapReduce
> Módulo 4. Informática científica y análisis de Big Data con Python y/ó R y Hadoop
Instalación
Análisis de los datos
Métodos de integración de R y Hadoop
Análisis de datos
> Módulo 5. Análisis por lotes con Apache Spark
SparkSQL y DataFrames
API de DataFrame y la API de SQL
Esquema – estructura de datos
Cargando conjuntos de datos
Guardar conjuntos de datos
Agregaciones
Uniones
> Módulo 6. Análisis por lotes con Apache Flink
Introducción a Apache Flink
Instalar Flink
Uso de la interfaz de usuario del clúster Flink
Análisis de lotes
Procesamiento continuo con Apache Flink
> Módulo 7. Visualización de Big Data
Introducción
Cuadro
Tipos de carta
Usando Python para visualizar datos
Usando R para visualizar datos
Herramientas de visualización de big data
> Módulo 8. Uso de los servicios web de Amazon
Amazon Elastic Compute Cloud
Lanzar múltiples instancias de una AMI
¿Qué es AWS Lambda?
Introducción a Amazon S3
Amazon DynamoDB
Secuencias de datos de Amazon Kinesis
¿Qué aprenderé?
- Explorar las nuevas características de Hadoop junto con HDFS, YARN y MapReduce
- Conocer bien las capacidades analíticas del ecosistema Hadoop utilizando ejemplos prácticos
- Integrar Hadoop con R ó Python para un procesamiento de big data más eficiente
- Aprender a usar Hadoop con Apache Spark y Apache Flink para análisis de datos en tiempo real
- Configurar un clúster de Hadoop en la nube de AWS
- Realizar análisis de big data en AWS con Elastic Map Reduce