Tarea 1

  1. Crear un documento Rmarkdown. 2) Resumir escalas de medición.
  2. Cargar paquete datos. 4) Fijar semilla.
  3. Tomar muestra aleatoria de 120 de datos_credito.
  4. Gráfico de barras para Vivienda. 7) Gráfico de torta para Trabajo.
  5. Conclusiones. 9) Publicar en RPubs y entregar .Rmd + enlace.

1) Escalas de medición en estadística

  • Nominal: categorías sin orden (p. ej., tipo de vivienda).
  • Ordinal: categorías con orden pero sin distancias iguales (p. ej., nivel educativo).
  • Intervalo: orden y distancias iguales; sin cero absoluto (p. ej., temperatura °C).
  • Razón: como intervalo, pero con cero absoluto (p. ej., ingresos, peso).

2) Preparación: cargar paquetes y fijar semilla

# Instalar solo si hace falta
if (!requireNamespace("datos", quietly = TRUE)) install.packages("datos")
if (!requireNamespace("ggplot2", quietly = TRUE)) install.packages("ggplot2")

library(datos)
library(ggplot2)

# Semilla solicitada
set.seed(356)

3) Cargar base y tomar muestra aleatoria de 120

# Cargar base de datos
data("datos_credito", package = "datos")
## Warning in data("datos_credito", package = "datos"): data set 'datos_credito'
## not found
# Verificar columnas esperadas
cols <- names(datos_credito)
if (!all(c("Vivienda", "Trabajo") %in% cols)) {
  stop("No se encontraron las columnas 'Vivienda' y/o 'Trabajo' en 'datos_credito'.\nRevise los nombres reales con names(datos_credito) y ajústelos en el código.")
}

# Tomar una muestra aleatoria de 120 registros (sin reemplazo)
n <- min(120, nrow(datos_credito))
muestra_credito <- datos_credito[sample(seq_len(nrow(datos_credito)), n), , drop = FALSE]

# Comprobación rápida
dim(muestra_credito)
## [1] 120  14

4) Diagrama de barras — Variable Vivienda

ggplot(muestra_credito, aes(x = Vivienda)) +
  geom_bar() +
  labs(title = paste0("Distribución de Vivienda en la muestra (n = ", n, ")"),
       x = "Tipo de vivienda",
       y = "Frecuencia") +
  theme_minimal()

Interpretación (completar por el grupo): describa qué tipo de vivienda predomina y cualquier patrón relevante.

5) Diagrama de torta — Variable Trabajo

# Renombrar categorías de la variable Trabajo si existen
niveles_originales <- levels(factor(muestra_credito$Trabajo))
niveles_corregidos <- c("fijo" = "Empleo fijo",
                        "freelance" = "Independiente",
                        "tiempo parcial" = "Medio tiempo",
                        "otros" = "Otros")

# Solo cambia los nombres que existan en la muestra
niveles_finales <- ifelse(niveles_originales %in% names(niveles_corregidos),
                          niveles_corregidos[niveles_originales],
                          niveles_originales)

muestra_credito$Trabajo <- factor(muestra_credito$Trabajo,
                                  levels = niveles_originales,
                                  labels = niveles_finales)

# Crear tabla de frecuencias
trabajo_counts <- as.data.frame(table(muestra_credito$Trabajo), stringsAsFactors = FALSE)
colnames(trabajo_counts) <- c("Trabajo", "Frecuencia")

# Gráfico de pastel (torta)
ggplot(trabajo_counts, aes(x = "", y = Frecuencia, fill = Trabajo)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
  labs(title = "Proporción de categorías en Trabajo") +
  theme_void() +
  guides(fill = guide_legend(title = "Trabajo"))

6) Conclusiones

  • La mayoría de las personas en la muestra viven en una vivienda de su propiedad, lo que sugiere una tendencia hacia la estabilidad residencial.
  • También es común que algunas personas vivan en viviendas alquiladas o con sus padres, lo que indica diversidad en las condiciones de vivienda.
  • En cuanto al empleo, la mayor parte de los encuestados tiene un trabajo fijo, lo que refleja una situación laboral estable para una buena parte de la muestra.
  • El trabajo freelance representa una proporción importante, lo cual muestra una presencia notable de formas de empleo independientes.
  • En conjunto, los datos reflejan un grupo con estabilidad económica general, aunque con variedad en las formas de vivir y trabajar. ```