c()
para crear vectoresmatrix()
list()
dplyr
c()
para crear vectoresLa función c()
(concatenar) se usa para crear vectores
en R.
# Crear un vector numérico
mi_vector <- c(10, 20, 30, 40, 50)
# Mostrar el vector
print(mi_vector)
# Generar un vector de 5 números aleatorios entre 0 y 100
vector_aleatorio <- runif(5, min = 0, max = 100)
print(vector_aleatorio)
matrix()
# Crear una matriz de 3x3
mi_matriz <- matrix(1:9, nrow = 3, ncol = 3)
print(mi_matriz)
# Crear una matriz de 3x3 con números aleatorios normales
matriz_aleatoria <- matrix(rnorm(9), nrow = 3)
print(matriz_aleatoria)
list()
mi_lista <- list(
numeros = c(1, 2, 3, 4, 5),
nombres = c("Ana", "Luis", "Carlos"),
matriz = matrix(1:9, nrow = 3)
)
print(mi_lista)
dplyr
install.packages("dplyr")
library(dplyr)
df <- data.frame(Nombre = c("Ana", "Luis", "Carlos"), Edad = c(25, 30, 22))
df_filtrado <- df %>% filter(Edad > 24)
print(df_filtrado)
df <- data.frame(Nombre = c("Ana", "Luis", "Carlos"), Edad = c(25, NA, 22))
df$Edad[is.na(df$Edad)] <- mean(df$Edad, na.rm = TRUE)
print(df)
# Eliminar filas con valores faltantes
df <- na.omit(df)
# Reemplazar valores NA con la mediana
df$Edad[is.na(df$Edad)] <- median(df$Edad, na.rm = TRUE)
# Convertir caracteres a minúsculas
df$Nombre <- tolower(df$Nombre)
print(df)
x <- c(1, 2, NA, 4, NA, 6)
print(is.na(x))
print(na.omit(x))
print(na.exclude(x))
fact <- factor(c("bajo", "medio", "alto"))
num <- as.numeric(fact)
num_factor <- as.factor(num)
print(num)
print(num_factor)
La estadística descriptiva permite resumir y visualizar datos de manera efectiva. Se pueden calcular medidas de tendencia central como la media, mediana y moda, así como medidas de dispersión como la desviación estándar y varianza.
# Cargar el dataset 'mtcars' incorporado en R
data(mtcars)
head(mtcars)
# Calcular la media, mediana y desviación estándar de la variable 'mpg'
mean(mtcars$mpg)
median(mtcars$mpg)
sd(mtcars$mpg)
# Calcular la varianza y rango
var(mtcars$mpg)
range(mtcars$mpg)
# Histograma de la variable 'mpg'
hist(mtcars$mpg, main="Distribución de MPG", xlab="MPG", col="blue")
# Boxplot de la variable 'mpg'
boxplot(mtcars$mpg, main="Boxplot de MPG", ylab="MPG", col="red")
# Gráfico de dispersión entre 'mpg' y 'hp'
plot(mtcars$hp, mtcars$mpg, main="MPG vs HP", xlab="Caballos de fuerza (HP)", ylab="Millas por galón (MPG)", col="green", pch=16)