Curso

Instructores

Fechas

Horario

Carga horaria

Descripción

Este curso surge de la necesidad de agilizar las investigaciones y optimizar los recursos computacionales para el procesamiento de algoritmos altamente demandantes y grandes volúmenes de datos. En este contexto, R ofrece herramientas de alto nivel para interactuar con la computación de alto rendimiento (HPC - High Performance Computing). El curso está dirigido a investigadores que desean acelerar y ampliar sus scripts a plataformas de procesamientos más grandes, como es el caso de Clústers. El curso introducirá los conceptos básicos de HPC y su arquitectura computacional, se revisarán rápidamente las estructuras básicas de programación en R y se continuará con paquetes relevantes de R para ciencia de datos destinados a la utilización de recursos informáticos de alto rendimiento. Primero se aplicará paralelización en computadoras personales, para luego continuar con la paralelización y distribución de procesos en el Clúster. Los participantes aprenderán estrategias para hacer que los scripts de R sean más rápidos, al establecer conexión con el Clúster a través de RStudio Server y al utilizar múltiples núcleos y nodos para la aceleración paralela y distribuida de procesos.

Dirigido a

Investigadores en áreas de ingeniería, ciencias naturales, de la tierra, ambientales, biológicas, de la computación, estadísticas, sociales, entre otros.

Requisitos

No se requiere previo conocimiento en HPC, sin embargo, si se requiere experiencia previa en R. Por ello se recomienda la preparación anticipada con recursos introductorios sobre R. Considere, por ejemplo, los cursos disponibles en DataCamp y Coursera. Se debe traer computadora personal con R y RStudio instalados.

Temario

B. Código R eficiente en computadoras personales (13h)