R: Técnicas y herramientas para investigadores

Introducción

En tres sesiones vamos a aprender las técnicas que han revolucionado R en los últimos años y que permiten un aumento importante de la productividad en la investigación. No es necesario que conozcáis R, y os proporcionaré referencias para que podáis seguir aprendiendo por vuestra cuenta.

Los grandes cambios que han dado la vuelta a cómo se trabaja en R en los últimos años son:

  • La aparición de Rstudio, un entorno de trabajo sencillo y potente, que permite trabajar de forma interactiva, y generar documentos finales en el formato deseado.
  • Un cambio aparentemente menor, el operador después o entonces, %>% que cambia cómo escribimos en R: en vez de largas expresiones con paréntesis ilegibles, le ordenamos hacer tareas de manera secuencial.
  • La familia de paquetes conocida como tidyverse, que aporta dos elementos:
    • Un tipo de datos, las tiablas tibbles, evolución de las data.frames: una matríz de datos que puede tener columnas de variables de cualquier tipo.
    • Una filosofía común que aprovecha el operador después: para hacer un trabajo grande concatenar tareas pequeñas, pero bien definidas.
  • La proliferación de paquetes, más de 11000, contribuidos por sus creadores, y que permiten llevar a cabo cualquier tarea que imaginemos: desde la lectura de datos en cualquier formato y desde cualquier fuente, en general remota, a cualquier tipo de análisis especializado. Muchos de los paquetes recientes siguen también la filosofía de concatenar operaciones sencillas.

La estructura del curso es la siguiente:

  • Primer día: Introducción a Rstudio y el tidyverse, centrándonos en la manipulación de objeto de datos del tipo tiabla con los paquetes tidyr y dplyr
  • Segundo día: Aplicaciones básicas a la investigación y el análisis de datos: gráficos, con ggplot2 y modelos, con enfásis a herramientas generales como mosaicModel, broom o sjstats.
  • Tercer día: Retomaremos con una perspectiva más avanzada los temas de modelización y de creación de documentos y veremos herramientas más específicas, como las familias de paquetes para trabajar con series temporales y con datos financieros. Dentro de las herramientas disponibles, nos centraremos en las que utilizan la filosofía del tidyverse al permitirnos trabajar de una forma parecida.

Enlaces útiles

Libros y documentos

Chuletas de Rstudio

Disponibles directamente desde Rsudio

chuletas

chuletas

Enlace a encuesta

Encuesta