9 de julio de 2018

Planteamiento inicial para este curso

Tengo un script de R, pero el volumen de datos está aumentando demasiado (o tengo que hacer muchas iteraciones) –> R tarda varios días en procesar (o no finaliza porque se queda sin memoria).

  • Estrategias
  • Dividir datos e iniciar multiples procesamientos (de forma manual)
  • Usar librarias de paralelizacion que hacen lo anterior de manera automatica

Procesamiento secuencial vs paralelo

Procesamiento secuencial vs paralelo

¿Por qué usar HPC?

1. Retos - Procesamientos que requieren mucho tiempo (1) - Grandes volúmnes de información (2)

2. Alternativas - Podríamos esperar mas tiempo para (1) o reducir datos para (2)

3. Soluciones HPC - Ejecutar tareas similares en paralelo en procesadores independientes (1) - Cargar datos en multiples computadoras que trabajan en paralelo (2)

¿Cómo luce un HPC?

¿Cómo luce un HPC?

Definiciones HPC 1

  • High performance computing (HPC) Computación de altas prestaciones. Área de ciencias de la computacion que desarrolla software y computadoras para el procesamiento de altas prestaciones.
  • Parallel computing Computación en paralelo. Desarrollo de algoritmos que se ejecutan en paralelo en diferentes procesadores.
  • Parallelism Paralelismo. Procesamiento simultáneo de múltiples hilos o procesos para aumentar el rendimiento.
  • Distributed computing Computación distribuida. Desarrollo de algoritmos que se ejecutan en paralelo en diferentes computadores.

Definiciones HPC 2

Ejemplo HPC

Sobre este curso