¿Qué es R?

R es un lenguaje de programación y entorno de software libre orientado al análisis estadístico y la visualización de datos. Es ampliamente utilizado en ciencia de datos, análisis estadístico, modelado y gráficos. Cuenta con una gran comunidad y miles de paquetes que amplían sus funcionalidades.

¿Qué es RStudio?

RStudio es un Entorno de Desarrollo Integrado (IDE) para R. Facilita la escritura, ejecución y depuración de código R, al ofrecer una interfaz amigable con consola, editor, visor de variables, salida de gráficos y más.

¿Por qué usar R y RStudio?

Instalación de R y RStudio

Comenzando con R: Conceptos Básicos

Variables en R

Una variable almacena un valor. Se asigna con el operador <-:

a <- 10
b <- 5

También es posible usar =, aunque en R se prefiere <-:

c = 3

Uso de variables

Una vez definidas, las variables pueden usarse en operaciones:

# Suma
total <- a + b
print(total)
## [1] 15
# Multiplicación
producto <- a * c
print(producto)
## [1] 30

R distingue entre mayúsculas y minúsculas

valor <- 100
Valor <- 200
print(valor)  # imprime 100
## [1] 100
print(Valor)  # imprime 200
## [1] 200

Tipo de variable

R maneja distintos tipos de datos:

# Numérico
x <- 42
is.numeric(x)  # TRUE
## [1] TRUE
# Texto
nombre <- "Ana"
is.character(nombre)  # TRUE
## [1] TRUE
# Lógico
bandera <- TRUE
is.logical(bandera)  # TRUE
## [1] TRUE

Ejercicios

  1. Asigna el valor 20 a una variable llamada edad y muestra su contenido.
  2. Crea dos variables numéricas y muestra su suma, resta, multiplicación y división.
  3. Crea una variable con tu nombre y verifica si es de tipo carácter.
  4. Prueba definir dos variables con el mismo nombre pero con diferente capitalización. ¿Qué observas?
  5. Escribe una línea de código que determine si un número es lógico.

Características de R

Una de las características principales de R es su versatilidad, tanto para crear conjuntos de datos como para trabajar con ellos.

Crear una secuencia

secuencia <- 1:10
print(secuencia)
##  [1]  1  2  3  4  5  6  7  8  9 10

Crear un vector numérico

notas <- c(3.5, 4.0, 2.8, 5.0, 4.5)
print(notas)
## [1] 3.5 4.0 2.8 5.0 4.5

Calcular estadísticas básicas de un vector

mean(notas)       # Promedio
## [1] 3.96
sd(notas)         # Desviación estándar
## [1] 0.8561542
summary(notas)    # Resumen estadístico
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.80    3.50    4.00    3.96    4.50    5.00

Crear un vector de texto

nombres <- c("Ana", "Luis", "Carlos")
print(nombres)
## [1] "Ana"    "Luis"   "Carlos"

Combinar vectores en un data frame

edades <- c(23, 25, 30)
personas <- data.frame(Nombre = nombres, Edad = edades)
print(personas)
##   Nombre Edad
## 1    Ana   23
## 2   Luis   25
## 3 Carlos   30

Acceder a columnas de un data frame

personas$Nombre
## [1] "Ana"    "Luis"   "Carlos"
personas$Edad
## [1] 23 25 30

Ejercicios

  1. Crea un vector de 5 números decimales y calcula su media.
  2. Construye un data.frame con dos columnas: una de nombres y otra de edades.
  3. Accede a cada columna de ese data.frame usando $.
  4. Utiliza la función summary() sobre el vector de edades y analiza el resultado.
  5. Crea un vector lógico que indique si cada persona del data.frame tiene más de 24 años.

Gráficos básicos en R

Una de las capacidades más potentes de R es su capacidad para generar gráficos de forma sencilla.

Gráfico de dispersión

x <- 1:10
y <- x^2
plot(x, y, type = "b", col = "blue", main = "Gráfico de x vs x^2", xlab = "x", ylab = "x^2")

Histograma

notas <- c(3.5, 4.0, 2.8, 5.0, 4.5, 3.7, 4.1)
hist(notas, col = "lightblue", main = "Histograma de notas", xlab = "Nota")

Diagrama de cajas (boxplot)

boxplot(notas, main = "Diagrama de cajas de notas", ylab = "Nota")

Ejercicios

  1. Crea un gráfico de dispersión de x contra x^2 usando la función plot().
  2. A partir de un vector con al menos 7 notas, crea un histograma.
  3. Utiliza boxplot() para visualizar la distribución de ese vector de notas.