Una vez que ya están instalados R y RStudio hay que abrir un nuevo script, es decir, un espacio que será guardado como archivo de texto donde escribes instrucciones al software sobre lo que quieres que haga. En este sentido, R es también un lenguaje de programación, así que tu script guardará código que se puede ejecutar. Si no tienes práctica programando, no hay problema; las primeras líneas son muy simples.
Para empezar un nuevo script busca en la esquina superior izquierda
Se abrirá esta sección en RStudio. Ahí escribes tus funciones y asignas nombres a los objetos que manejes.
En los softwares de estadística se recopilan datos de un mismo tipo en una variable. La forma de guardar pocos datos en una variable es unirlas en la función c()
, que indica concatenar. Digamos que tienes 3 datos que quieres guardar en una variable. El nombre de la variable no debe usar símbolos que pudieran usarse para operaciones matemáticas ni pueden empezar por número:
x <- c(5, 8, 3)
Es decir, que asignes la pequeña secuencia de c(5, 8, 3)
a la variable x
. Notarás que no pasa nada al brincar a otra línea. El script es sólo texto hasta que no corres la línea. Esto se puede hacer con el botón:
O bien, desde el teclado con Control + Enter (o Command + Enter), siempre y cuando el cursor del script esté sobre la línea que quieres ejecutar. Después de esto ya podrás ver tu variable en la sección de la consola, abajo del script:
Y también en la pestaña del ambiente, arriba a la derecha:
Tus variables también pueden guardar datos no numéricos, sólo que deben ir entre comillas:
y <- c("vainilla", "fresa", "chocolate")
Después te darás cuenta que no puedes introducir muchos datos directo al script, así que tendrás que cargarlos desde un archivo en tu equipo, desde internet o de una base de datos. En nuestro curso estaremos usando archivos .csv, que son archivos de texto que se pueden abrir desde un programa de hoja de cálculo, pero RStudio puede abrir también archivos de otros formatos.
En este enlace de Google Drive de la U-ERRE encontrarás el archivo Housing.csv, donde lo podrás descargar. El arreglo rectangular de filas y columnas es lo que típicamente se conoce como un conjunto de datos al que más familiarmente estaremos llamando dataset.
Una de las formas de cargar a RStudio un archivo de un dataset guardado en tu equipo es en la pestaña de Environment desde Import Dataset > From Text en cualquiera de las dos opciones de (base)… o (readr)…. Tal vez te pida instalar un agregado automáticamente antes de poder tener las dos opciones. Te recomiendo que sí lo aceptes; puedes permitirlo sin riesgo.
Otra forma de cargar archivos es desde una instrucción del script, pero esto lo veremos después. Si se logró cargar exitosamente, también lo podrás ver junto con las otras variables, aunque éste especifica que es un arreglo con 546 observaciones (registros, renglones) y 11 variables (atributos, columnas).
Si le das clic sobre su nombre podrás ver una vista del dataset en otra pestaña, junto al script. Representan una muestra de casas vendidas en la ciudad de Windsor, Ontario (en Canadá), donde cada variable significa:
Además de la instalación base de R, existen otras funciones que se pueden agregar por medio de paquetes (también llamados librerías), que son funciones extra para usos específicos que se pueden bajar desde la pestaña de Packages > Install. Al menos para efectos de lo que desarrollaremos en el curso necesitaremos descargar los paquetes dplyr
, ggplot2
, plotly
.
Esto puede tomar unos minutos dependiendo de tu conexión a la red. Después de descargarlos, se habilitan cuando los necesites cada vez que abras RStudio corriendo una instrucción en el script, como por ejemplo:
library(ggplot2)
Además de las funciones extra, algunos paquetes también contienen datasets que se pueden hacer visibles por medio de la función data
:
data("mpg")
mpg
Este también debe aparecer en la pestaña del ambiente y a partir de ahora se puede manipular de la misma forma que el dataset cargado desde archivo; mpg
es otro dataset que estaremos utilizando y refiere a una muestra de autos con algunas características cuyo significado puedes hallar en la ayuda (intenta buscando mpg
en la pestaña de Help).
Este documento fue hecho con RMarkdown.