Curso Trabajando Big Data con RStudio
Acerca de este curso
> Módulo 1: La era de los grandes datos
Big Data: el monstruo redefinido
Caja de herramientas Big Data: tratar con el gigante
R – El héroe anónimo de Big Data
> Módulo 2: Introducción al Lenguaje de Programación R y el Entorno Estadístico
Aprendiendo R
Revisando los conceptos básicos de R
Ciencia de datos aplicada con R
> Módulo 3: Liberar el poder de R desde adentro
Limitaciones tradicionales de R
Los límites de la memoria y más allá
Paralell R
Impulsar el rendimiento de R con el paquete data.table y otras herramientas
> Módulo 4: Hadoop y MapReduce para R
Arquitectura hadoop
Un Hadoop de un solo nodo en la nube
HDInsight: un clúster Hadoop de varios nodos en Azure
> Módulo 5: R con sistemas de gestión de bases de datos relacionales (RDBMS)
Sistemas de gestión de bases de datos relacionales (RDBMS)
SQLite con R
MariaDB con R en una instancia de Amazon EC2
PostgreSQL con R en Amazon RDS
> Módulo 6: R con bases de datos no relacionales (NoSQL)
Introducción a las bases de datos NoSQL
MongoDB con R
HBase con R
> Módulo 7: Más rápido que Hadoop – Spark con R
Spark para análisis de Big Data
Spark con R en un clúster de HDInsight de varios nodos
> Módulo 8: Métodos de Machine Learning para Big Data en R
¿Qué es Machine Learning?
Ejemplo de GLM con Spark y R en el clúster de HDInsight
Naive Bayes con H2O en Hadoop con R
Redes Neuronales con H2O en Hadoop con R
> Módulo 9: El futuro de R: datos grandes, rápidos e inteligentes
El estado actual de la analítica de Big Data con R
El futuro de R.
Dónde ir después