Para la presente sesión es necesario contar con el siguiente software instalado:
- R programming language (versión 4.0.0 o superior)
- RStudio IDE (versión 1.4.0 o superior)
También se necesitan los siguientes paquetes de R:
- tidyverse
- rmarkdown
Para la presente sesión es necesario contar con el siguiente software instalado:
También se necesitan los siguientes paquetes de R:
R es un lenguaje de programación. Como todo lo que ocurre en una computadora, puede ejecutarse en una ventana de terminal. En Windows la conocemos como la ventana de comandos.
Es posible acceder a la consola de R desde una terminal.
RGeneralmente, no será necesario acceder a R a través de una terminal porque lo haremos utilizando el entorno de programación RStudio, que nos brinda una consola de R automáticamente (aunque tras bambalinas realiza previamente el procedimiento explicado).
El directorio de trabajo general es la carpeta en la que guardamos nuestros trabajos realizados con R. Por defecto, es la carpeta de “Documentos” del usuario de la computadora.
RStudio cuenta con un explorador de archivos para revisar el contenido de nuestros directorios.
Mi recomendación personal es utilizar como directorio general la carpeta llamada “R” dentro de “Documentos”.
El directorio de trabajo es donde R busca los archivos que le pides cargar, y donde pondrá los archivos que le pidas guardar. RStudio muestra el directorio de trabajo en la parte superior de la consola.
En muchas ocasiones existe la tentación de trabajar con archivos que están fuera de nuestro directorio de trabajo. Es recomendable evitar este comportamiento porque suele ser la raíz de muchos problemas.
Para ello, RStudio cuenta con los Proyectos, una manera sencilla de organizar nuestro trabajo. Mi mayor recomendación para usuarios de RStudio iniciantes y especialistas es trabajar siempre con proyectos dentro de RStudio.
Puedes crear un proyecto siguiendo la siguiente ruta:
Si estás usando el servicio https://www.rstudio.cloud puedes crear nuevos proyectos en tu espacio de trabajo (Your workspace).
Al crear un nuevo proyecto, RStudio crea para ti una carpeta con un archivo que lleva un nombre tipo “*.Rproj”. Cuando estés fuera del proyecto bastará con hacer doble click en ese archivo para que RStudio abra una sesión de trabajo usando la ubicación del proyecto.
Si deseas cerrar el proyecto actual para trabajar en otro, peudes hacerlo desde el menú “File” haciendo click en “Close Project”.
R Markdown nos provee de un marco de trabajo unificado para la ciencia de datos y el análisis de datos, combinando código, sus resultados, y los comentarios escritos por el autor. Los documentos R Markdown son totalmente reproducibles y soportan docentas de formatos de salida como PDFs, archivos Word, diapositivas, y más.
Uno de los objetivos de este taller es que los participantes aprendan a usar R Markdown y puedan encontrar la forma en que puede ayudarles a potenciar su trabajo.
Esta sección hace uso de la traducción al español del capítulo R Markdown de “R for Data Science”.
Los archivos R Markdown están diseñados para ser usados de tres maneras:
Instrucción: Abrir el archivo “ejemplo01.Rmd” y guardarlo en el proyecto actual.
Típicamente, un archivo R Markdown contiene tres tipos de contenido importantes
Cuando abres un archivo .Rmd, se te muestra una interfaz de bloc de notas donde el código y sus resultados se intercalan. Puedes ejecutar cada bloque de código haciendo click en el botón “Run” (luce como un botón de play en la parte superior del bloque), o presionando Cmd/Ctrl + Shift + Enter. RStudio ejecuta el código y muestra los resultados seguidamente.
Para producir un reporte completo conteniendo todo el texto, código y resultados, haz click en “Knit” o presiona Cmd/Ctrl + Shift + K. Esto mostrará el reporte en un panel de Vista previa, y creará un archivo HTML que puedes compartir con otras personas.
Cuando haces knit el documento (knit significa tejer en inglés), R Markdown envía el .Rmd a knitr (http://yihui.name/knitr/) que ejecuta todos los bloques de código y crea un nuevo documento markdown (.md) que incluye el código y su output.
El archivo markdown generado por knitr es procesado entonces por pandoc (http://pandoc.org/) que es el responsable de crear el archivo terminado. La ventaja de este flujo de trabajo en dos pasos es que puedes crear un muy amplio rango de formatos de salida, que conocerás más adelante.
Para comenzar con tu propio archivo .Rmd, selecciona File > New File > R Markdown… en la barra de menú. RStudio iniciará un asistente que puedes usar para pre-rellenar tu archivo con contenido útil que te recuerda cómo funcionan las principales características de R Markdown.