2 Uso de la función c() para crear vectores

La función c() (concatenar) se usa para crear vectores en R.

# Crear un vector numérico
mi_vector <- c(10, 20, 30, 40, 50)

# Mostrar el vector
print(mi_vector)

3 Creación de vectores aleatorios

# Generar un vector de 5 números aleatorios entre 0 y 100
vector_aleatorio <- runif(5, min = 0, max = 100)
print(vector_aleatorio)

4 Creación de una matriz con matrix()

# Crear una matriz de 3x3
mi_matriz <- matrix(1:9, nrow = 3, ncol = 3)
print(mi_matriz)

5 Creación de matrices aleatorias

# Crear una matriz de 3x3 con números aleatorios normales
matriz_aleatoria <- matrix(rnorm(9), nrow = 3)
print(matriz_aleatoria)

6 Creación de una lista con list()

mi_lista <- list(
  numeros = c(1, 2, 3, 4, 5),
  nombres = c("Ana", "Luis", "Carlos"),
  matriz = matrix(1:9, nrow = 3)
)
print(mi_lista)

7 Uso del paquete dplyr

install.packages("dplyr")
library(dplyr)

df <- data.frame(Nombre = c("Ana", "Luis", "Carlos"), Edad = c(25, 30, 22))
df_filtrado <- df %>% filter(Edad > 24)
print(df_filtrado)

8 Manejo de valores faltantes

df <- data.frame(Nombre = c("Ana", "Luis", "Carlos"), Edad = c(25, NA, 22))
df$Edad[is.na(df$Edad)] <- mean(df$Edad, na.rm = TRUE)
print(df)

9 Limpieza de datos

# Eliminar filas con valores faltantes
df <- na.omit(df)

# Reemplazar valores NA con la mediana
df$Edad[is.na(df$Edad)] <- median(df$Edad, na.rm = TRUE)

# Convertir caracteres a minúsculas
df$Nombre <- tolower(df$Nombre)
print(df)

10 Funciones útiles en R

x <- c(1, 2, NA, 4, NA, 6)
print(is.na(x))
print(na.omit(x))
print(na.exclude(x))

11 Conversión de datos

fact <- factor(c("bajo", "medio", "alto"))
num <- as.numeric(fact)
num_factor <- as.factor(num)
print(num)
print(num_factor)

12 Estadística descriptiva

La estadística descriptiva permite resumir y visualizar datos de manera efectiva. Se pueden calcular medidas de tendencia central como la media, mediana y moda, así como medidas de dispersión como la desviación estándar y varianza.

12.1 Cargar una base de datos de ejemplo

# Cargar el dataset 'mtcars' incorporado en R
data(mtcars)
head(mtcars)

12.2 Medidas de tendencia central y dispersión

# Calcular la media, mediana y desviación estándar de la variable 'mpg'
mean(mtcars$mpg)
median(mtcars$mpg)
sd(mtcars$mpg)

# Calcular la varianza y rango
var(mtcars$mpg)
range(mtcars$mpg)

12.3 Visualización de datos

# Histograma de la variable 'mpg'
hist(mtcars$mpg, main="Distribución de MPG", xlab="MPG", col="blue")

# Boxplot de la variable 'mpg'
boxplot(mtcars$mpg, main="Boxplot de MPG", ylab="MPG", col="red")

# Gráfico de dispersión entre 'mpg' y 'hp'
plot(mtcars$hp, mtcars$mpg, main="MPG vs HP", xlab="Caballos de fuerza (HP)", ylab="Millas por galón (MPG)", col="green", pch=16)