- Crear un documento Rmarkdown. 2) Resumir escalas de medición.
- Cargar paquete datos. 4) Fijar semilla.
- Tomar muestra aleatoria de 120 de
datos_credito
.
- Gráfico de barras para Vivienda. 7) Gráfico de torta para Trabajo.
- Conclusiones. 9) Publicar en RPubs y entregar
.Rmd
+ enlace.
# Instalar solo si hace falta
if (!requireNamespace("datos", quietly = TRUE)) install.packages("datos")
if (!requireNamespace("ggplot2", quietly = TRUE)) install.packages("ggplot2")
library(datos)
library(ggplot2)
# Semilla solicitada
set.seed(356)
# Cargar base de datos
data("datos_credito", package = "datos")
## Warning in data("datos_credito", package = "datos"): data set 'datos_credito'
## not found
# Verificar columnas esperadas
cols <- names(datos_credito)
if (!all(c("Vivienda", "Trabajo") %in% cols)) {
stop("No se encontraron las columnas 'Vivienda' y/o 'Trabajo' en 'datos_credito'.\nRevise los nombres reales con names(datos_credito) y ajústelos en el código.")
}
# Tomar una muestra aleatoria de 120 registros (sin reemplazo)
n <- min(120, nrow(datos_credito))
muestra_credito <- datos_credito[sample(seq_len(nrow(datos_credito)), n), , drop = FALSE]
# Comprobación rápida
dim(muestra_credito)
## [1] 120 14
ggplot(muestra_credito, aes(x = Vivienda)) +
geom_bar() +
labs(title = paste0("Distribución de Vivienda en la muestra (n = ", n, ")"),
x = "Tipo de vivienda",
y = "Frecuencia") +
theme_minimal()
Interpretación (completar por el grupo): describa qué tipo de vivienda predomina y cualquier patrón relevante.
# Renombrar categorías de la variable Trabajo si existen
niveles_originales <- levels(factor(muestra_credito$Trabajo))
niveles_corregidos <- c("fijo" = "Empleo fijo",
"freelance" = "Independiente",
"tiempo parcial" = "Medio tiempo",
"otros" = "Otros")
# Solo cambia los nombres que existan en la muestra
niveles_finales <- ifelse(niveles_originales %in% names(niveles_corregidos),
niveles_corregidos[niveles_originales],
niveles_originales)
muestra_credito$Trabajo <- factor(muestra_credito$Trabajo,
levels = niveles_originales,
labels = niveles_finales)
# Crear tabla de frecuencias
trabajo_counts <- as.data.frame(table(muestra_credito$Trabajo), stringsAsFactors = FALSE)
colnames(trabajo_counts) <- c("Trabajo", "Frecuencia")
# Gráfico de pastel (torta)
ggplot(trabajo_counts, aes(x = "", y = Frecuencia, fill = Trabajo)) +
geom_col(width = 1) +
coord_polar(theta = "y") +
labs(title = "Proporción de categorías en Trabajo") +
theme_void() +
guides(fill = guide_legend(title = "Trabajo"))