Introducción
En tres sesiones vamos a aprender las técnicas que han revolucionado R en los últimos años y que permiten un aumento importante de la productividad en la investigación. No es necesario que conozcáis R, y os proporcionaré referencias para que podáis seguir aprendiendo por vuestra cuenta.
Los grandes cambios que han dado la vuelta a cómo se trabaja en R en los últimos años son:
- La aparición de Rstudio, un entorno de trabajo sencillo y potente, que permite trabajar de forma interactiva, y generar documentos finales en el formato deseado.
- Un cambio aparentemente menor, el operador después o entonces,
%>% que cambia cómo escribimos en R: en vez de largas expresiones con paréntesis ilegibles, le ordenamos hacer tareas de manera secuencial.
- La familia de paquetes conocida como tidyverse, que aporta dos elementos:
- Un tipo de datos, las tiablas tibbles, evolución de las
data.frames: una matríz de datos que puede tener columnas de variables de cualquier tipo.
- Una filosofía común que aprovecha el operador después: para hacer un trabajo grande concatenar tareas pequeñas, pero bien definidas.
- La proliferación de paquetes, más de 11000, contribuidos por sus creadores, y que permiten llevar a cabo cualquier tarea que imaginemos: desde la lectura de datos en cualquier formato y desde cualquier fuente, en general remota, a cualquier tipo de análisis especializado. Muchos de los paquetes recientes siguen también la filosofía de concatenar operaciones sencillas.
La estructura del curso es la siguiente:
- Primer día: Introducción a
Rstudio y el tidyverse, centrándonos en la manipulación de objeto de datos del tipo tiabla con los paquetes tidyr y dplyr
- Segundo día: Aplicaciones básicas a la investigación y el análisis de datos: gráficos, con ggplot2 y modelos, con enfásis a herramientas generales como mosaicModel, broom o sjstats.
- Tercer día: Retomaremos con una perspectiva más avanzada los temas de modelización y de creación de documentos y veremos herramientas más específicas, como las familias de paquetes para trabajar con series temporales y con datos financieros. Dentro de las herramientas disponibles, nos centraremos en las que utilizan la filosofía del
tidyverse al permitirnos trabajar de una forma parecida.