Curso de Big Data Analytics con Hadoop
Acerca de este curso
> Módulo 1. Introducción a Hadoop
Sistema de archivos distribuidos de Hadoop
Marco MapReduce
HILO
Otros cambios
Instalar Hadoop 3
> Módulo 2. Descripción general de Big Data Analytics
Introducción a la analítica de datos.
Introducción a big data
Computación distribuida usando Apache Hadoop
El framework de MapReduce
Hive
Apache Spark
Visualización usando Tableau
> Módulo 3. Gran procesamiento de datos con MapReduce
El marco de MapReduce
Tipos de trabajo de MapReduce
Patrones de MapReduce
> Módulo 4. Informática científica y análisis de Big Data con Python y/ó R y Hadoop
Instalación
Análisis de los datos
Métodos de integración de R y Hadoop
Análisis de datos
> Módulo 5. Análisis por lotes con Apache Spark
SparkSQL y DataFrames
API de DataFrame y la API de SQL
Esquema – estructura de datos
Cargando conjuntos de datos
Guardar conjuntos de datos
Agregaciones
Uniones
> Módulo 6. Análisis por lotes con Apache Flink
Introducción a Apache Flink
Instalar Flink
Uso de la interfaz de usuario del clúster Flink
Análisis de lotes
Procesamiento continuo con Apache Flink
> Módulo 7. Visualización de Big Data
Introducción
Cuadro
Tipos de carta
Usando Python para visualizar datos
Usando R para visualizar datos
Herramientas de visualización de big data
> Módulo 8. Uso de los servicios web de Amazon
Amazon Elastic Compute Cloud
Lanzar múltiples instancias de una AMI
¿Qué es AWS Lambda?
Introducción a Amazon S3
Amazon DynamoDB
Secuencias de datos de Amazon Kinesis