Tarea 1

Crear un documento Rmarkdown. 2) Resumir escalas de medición.

Cargar paquete datos. 4) Fijar semilla.

Tomar muestra aleatoria de 120 de datos_credito.

Gráfico de barras para Vivienda. 7) Gráfico de torta para Trabajo.

Conclusiones. 9) Publicar en RPubs y entregar .Rmd + enlace.

1) Escalas de medición en estadística

Nominal: categorías sin orden (p. ej., tipo de vivienda).
Ordinal: categorías con orden pero sin distancias iguales (p. ej., nivel educativo).
Intervalo: orden y distancias iguales; sin cero absoluto (p. ej., temperatura °C).
Razón: como intervalo, pero con cero absoluto (p. ej., ingresos, peso).

2) Preparación: cargar paquetes y fijar semilla

# Instalar solo si hace falta
if (!requireNamespace("datos", quietly = TRUE)) install.packages("datos")
if (!requireNamespace("ggplot2", quietly = TRUE)) install.packages("ggplot2")

library(datos)
library(ggplot2)

# Semilla solicitada
set.seed(356)

3) Cargar base y tomar muestra aleatoria de 120

# Cargar base de datos
data("datos_credito", package = "datos")

## Warning in data("datos_credito", package = "datos"): data set 'datos_credito'
## not found

# Verificar columnas esperadas
cols <- names(datos_credito)
if (!all(c("Vivienda", "Trabajo") %in% cols)) {
  stop("No se encontraron las columnas 'Vivienda' y/o 'Trabajo' en 'datos_credito'.\nRevise los nombres reales con names(datos_credito) y ajústelos en el código.")
}

# Tomar una muestra aleatoria de 120 registros (sin reemplazo)
n <- min(120, nrow(datos_credito))
muestra_credito <- datos_credito[sample(seq_len(nrow(datos_credito)), n), , drop = FALSE]

# Comprobación rápida
dim(muestra_credito)

## [1] 120  14

4) Diagrama de barras — Variable Vivienda

ggplot(muestra_credito, aes(x = Vivienda)) +
  geom_bar() +
  labs(title = paste0("Distribución de Vivienda en la muestra (n = ", n, ")"),
       x = "Tipo de vivienda",
       y = "Frecuencia") +
  theme_minimal()

Interpretación (completar por el grupo): describa qué tipo de vivienda predomina y cualquier patrón relevante.

5) Diagrama de torta — Variable Trabajo

# Renombrar categorías de la variable Trabajo si existen
niveles_originales <- levels(factor(muestra_credito$Trabajo))
niveles_corregidos <- c("fijo" = "Empleo fijo",
                        "freelance" = "Independiente",
                        "tiempo parcial" = "Medio tiempo",
                        "otros" = "Otros")

# Solo cambia los nombres que existan en la muestra
niveles_finales <- ifelse(niveles_originales %in% names(niveles_corregidos),
                          niveles_corregidos[niveles_originales],
                          niveles_originales)

muestra_credito$Trabajo <- factor(muestra_credito$Trabajo,
                                  levels = niveles_originales,
                                  labels = niveles_finales)

# Crear tabla de frecuencias
trabajo_counts <- as.data.frame(table(muestra_credito$Trabajo), stringsAsFactors = FALSE)
colnames(trabajo_counts) <- c("Trabajo", "Frecuencia")

# Gráfico de pastel (torta)
ggplot(trabajo_counts, aes(x = "", y = Frecuencia, fill = Trabajo)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
  labs(title = "Proporción de categorías en Trabajo") +
  theme_void() +
  guides(fill = guide_legend(title = "Trabajo"))

6) Conclusiones

La mayoría de las personas en la muestra viven en una vivienda de su propiedad, lo que sugiere una tendencia hacia la estabilidad residencial.
También es común que algunas personas vivan en viviendas alquiladas o con sus padres, lo que indica diversidad en las condiciones de vivienda.
En cuanto al empleo, la mayor parte de los encuestados tiene un trabajo fijo, lo que refleja una situación laboral estable para una buena parte de la muestra.
El trabajo freelance representa una proporción importante, lo cual muestra una presencia notable de formas de empleo independientes.
En conjunto, los datos reflejan un grupo con estabilidad económica general, aunque con variedad en las formas de vivir y trabajar. ```

tarea 1 proba

Integrantes:Jose Garcia, Nicolas MOra, David Rodriguez

Tarea 1

1) Escalas de medición en estadística

2) Preparación: cargar paquetes y fijar semilla

3) Cargar base y tomar muestra aleatoria de 120

4) Diagrama de barras — Variable Vivienda

5) Diagrama de torta — Variable Trabajo

6) Conclusiones