Programación Básica en R Studio

Operaciones entre variables

Con diferentes tipos de datos podemos hacer diferentes tipos de operaciones. Así, dependiendo del tipo de dato, depende las operaciones que se pueden realizar. Existen distintos tipos de operaciones:

  • Arimética

  • Relacionales

  • Asignación

  • Lógicas

Las Ariméticas

R admite as operaciones ariméticas básicas, como las descritas en el siguiente cuadro

Operaciones Operador
Suma +
Resta -
Multiplicación *
División /
Exponencial ** o ^

Cabe resaltar que existen mas operadores ariméticos, pero por el momento esto nos será útil. Repliquemos lo anterior en la consola del R

Relacionales

Las operaciones relacionales son utilizadas para comparar dos valores y devolver un resultado boolenao en función de la relación entre ello. Las operaciones relacionales mas comunes y utilizadas son las siguientes

Operaciones Operador
Igual ==
Distinto !=
Mayor, Menor >, <
Mayor/Menor igual >= , <=
y, o & , |
Negación !

Practiquemos lo anterior en la consola de R

Vectores

Un vector es un conjunto de datos que con más de un elemento relacionado a una misma cosa. Solo pueden ser de un solo tipo de dato.

Hay diversas maneras de crear vectores de otras longitudes, que, como se ha dicho antes, son secuencias de objetos de la misma clase atómica. En las siguientes secciones se verán algunos casos

El uso de la función c() para crear vectores

La primer manera de crear vectores es a partir de los elementos individuales que compondrán el vector. Para esto se utiliza la función c() como se muestra a continuación.

#c(4,2,-8) # Creación de un vector sin asignarlo a una variable

## Diversidad de asignación

altura <- c(170, 172, 168) # Usando el operador <-
c("H", "H", "M") -> sexo # Usando el operador ->
assign("peso", c(75, 88, 62)) # Usando la función assign
horas = c(4, 2, 5) # Usando el operador =

print(altura); print(sexo); print(peso); print(horas)
## [1] 170 172 168
## [1] "H" "H" "M"
## [1] 75 88 62
## [1] 4 2 5

Otra forma de realizar vectores aleatorios o con secuencias sería de la siguiente forma

set.seed(123) # semilla para reproducibilidad


vector_aleatorio <- sample(1:100, 10, replace = TRUE) # Crear un vector aleatorio de longitud 10 con valores entre 1 y 100

# vaya al R y practiquelo con una semilla diferente y tome el promedio con la funcion mean

Data frames

Un data frame es una lista, cuyos componentes pueden ser vectores, matrices o factores, con la única salvedad de que las longitudes, o número de renglones, en el caso de matrices, deben coincidir en todos los componentes.

La apariencia de un data frame es la de una tabla y una forma de crearlos es mediante la función data.frame() . Veamos un ejemplo:

df <- data.frame(altura, horas, peso, sexo)
print(df)
##   altura horas peso sexo
## 1    170     4   75    H
## 2    172     2   88    H
## 3    168     5   62    M

Usamos aquí el término anglosajón, “data frames”, y no su traducción al castellano, “marco o estructura de datos”, dado que estos nombres sólo introducirían confusión, pues ninguno de ellos da una pista de lo que es. Probablemente un término apropiado sería algo como “tabla de datos

Carga e inspección de datos

al ser R studio un IDE versatil y poderoso, este nor permite trabajar con distinto tipos de archivos, entre ellos se encuentran

  • hojas de excel
  • archivos delimitados
  • archivos con extensión Rdata

los archivos RData son nativos de R para cargalos solo es necesario en darle click en el archivo de la barra superior y elegir el archivo que queramos. Otra forma sería la siguiente load("dirección donde se encuentra el archivo")

Para cargar datos en excel es necesario instalar el paquete readxl para ellos instalamos y llamamos el paque de la siguiente manera

if(!require(readxl)) install.packages('readxl')
require(readxl)

Realicemos un ejemplo de la función anterior para ello es necesario descargar el df aquí

Una vez descargada, vaya al RStudio y digite las siguientes lineas de código

población <- read_excel("poblacion.xlsx")

Nota: asegurese de estar trabajando en la carpeta donde se encuentra su archivo, para ello utilice getwd() y luego setwd("C:/ tu direeción")

Inspección de los datos

Función Descripción
view abre la base de datos en otra pestaña
head abre la base de datos en la consola
glimpse abre la base de datos en la consola con mas información
summary arroja algunos conteos y resumen de estadísticos descriptivos

Utilice estas funciones en su IDE. Adelante, vayamos al R Studio