Marthina Rayén Miranda Oses & Antonia Muñoz
library(haven)
base_identidades_2 <- read_dta("uchile/2do/primer semestre/Estadística/Solemne I/base_identidades_2.dta")
library(summarytools)
library(ggplot2)
library(knitr)
library(haven)
view(dfSummary(base_identidades_2))
## Switching method to 'browser'
## Output file written: /var/folders/dj/lh7pvlhj15d8nj4cjspmvd980000gn/T//Rtmp7SEDZJ/file245d526dbfa8.html
A lo largo de los años el ingreso a la educación superior específicamente, ya sea profesional o técnica, ha evidenciado una alza independiente del contexto socioeconómico (Corradi,B & et-al, 2022), pero esto no siempre fue así, antes el mero hecho de terminar cuarto medio ya generaba complicaciones para algunos, ni hablar del privilegio de aplicar a la educación superior, muy pocos podían acceder a esta última, ya que influían diversos factores como la ubicación, la economía, entre otros (Ministerio de Educación, 1999). Esto generó un problema público laboral, ya que al pasar los años cada vez se ameritan más los estudios, es decir se prioriza un título profesional o hasta un cuarto medio, y se deja de lado a aquella personas que por diversas razones sociales, económicas, familiares, etc, no pudieron acceder a un nivel educativo igual o superior a cuarto medio, generando una dificultad a la hora de conseguir un empleo formal y una estabilidad económica.
El nivel educativo influye y a la vez excluyente en la obtención de empleo, ya que actualmente gran parte de la industria solicita algún título técnico y/o profesional o bien cierto nivel educacional, aumentando así las exigencias para obtener un empleo. Es por esta razón que las personas que no tienen un nivel educativo alto se ven afectadas en el ingreso mensual a su hogar, ya que al no tener estudios superiores o por ejemplo cuarto medio no tienen la misma valoración económica (Urzúa, 2024).
Ambas temáticas nos abren a la siguiente pregunta ¿Existe una relación entre el nivel educacional de la jefatura de hogar y la condición socioeconómica de los hogares?
Objetivo General:
Objetivos Especificos:
La presente investigación utiliza una base de datos que proviene de la Encuesta de Caracterización Socioeconómica Nacional (CASEN) 2022, ejecutada por el Ministerio de Desarrollo Social y Familia. Si bien los datos base son de 2022, el archivo cuenta con variables actualizadas al año 2023. La unidad de análisis son las personas residentes en Chile y su población objetivo corresponde a los hogares de las 16 regiones del país. El propósito general de esta base es caracterizar la situación socioeconómica de la población para orientar la creación y diseño de políticas públicas.
Analizar la relación entre el nivel educacional de la jefatura de hogar y la situación de pobreza de los hogares en Chile, utilizando herramientas de estadística descriptiva para identificar patrones de vulnerabilidad socioeconómica basados en el capital del principal sostenedor del hogar.
-Unidad de análisis: El hogar, definido como el grupo de personas que residen en una misma vivienda y comparten presupuesto alimentario.
-Población objetivo: Los hogares residentes en Chile que se encuentran representados en la base de datos asignada, cubriendo la diversidad socioeconómica de las regiones del país.
## Variable Descripcion Tipo Escala
## 1 edad Edad del jefe de hogar Cuantitativa Razón
## 2 esc Años de escolaridad Cuantitativa Razón
## 3 yautcorh Ingreso autónomo corregido del hogar Cuantitativa Razón
## 4 pobreza Categoría de pobreza Cualitativa Ordinal
## 5 pobreza_multi Pobreza multidimensional Cualitativa Nominal
## 6 activ Condición de actividad Cualitativa Nominal
## 7 r7k Red con educación universitaria Cualitativa Nominal
## 8 r8g Sintió hambre por falta de dinero Cualitativa Nominal
## Naturaleza
## 1 Discreta
## 2 Discreta
## 3 Continua
## 4 —
## 5 —
## 6 —
## 7 —
## 8 —
Para el análisis de datos en R, se aplicarán los siguientes procedimientos:
Variables cualitativas: Tablas de frecuencia absoluta y relativa para identificar la categoría predominante en pobreza y actividad.
Variables cuantitativas: Medidas de tendencia central (media, mediana), de dispersión (desviación estándar, rango intercuartílico) y de posición (percentiles) para caracterizar la escolaridad y edad.
Análisis gráfico: Histogramas para observar la distribución de los datos y diagramas de caja (box plots) para comparar los años de escolaridad según el nivel de pobreza de los hogares.
Las variables que guardan relación con la problemática expuesta, son:
Cuantitativas:
edad: Edad;
esc: Años de escolaridad (edad >= 15);
yautcorh: Ingreso autónomo corregido del hogar.
Cualitativa:
r7d: Pueda prestar dinero al hogar en caso de emergencia;
r7k: Tenga educación profesional universitaria;
r8g: ¿Sintió hambre y no comió por falta de dinero?;
activ: Condición de actividad. (CUALI);
pobreza: Categoría de pobreza (Pobreza extrema = 1, Pobreza no extrema = 2, No pobreza = 3);
pobreza multidimensional: situación de pobreza multidimensional con entorno y redes (No pobreza = 0, Pobreza = 1).
names(base_identidades_2)
## [1] "folio" "sexo" "edad"
## [4] "ecivil" "pco1" "numper"
## [7] "esc" "pobreza" "pobreza_multi_5d"
## [10] "activ" "ysub" "ysubh"
## [13] "yautcor" "yautcorh" "r3"
## [16] "r4" "r7b" "r7d"
## [19] "r1b_comuna_esp_cod" "r7i" "r6"
## [22] "r7k" "r2_pais_esp" "r2"
## [25] "r7f" "r1a_esp" "r1b_pais_esp_cod"
## [28] "r7e" "r7c" "r2_comuna_esp_cod"
## [31] "r1c" "r2_comuna_esp" "r8b"
## [34] "r1a_esp_cod" "r1b_comuna_esp" "r1b_pais_esp"
## [37] "r1b" "r7a" "r8a"
## [40] "r9d" "r8g" "r9t"
## [43] "r13b" "r14"
library(summarytools)
# Variable pobreza (1=extrema, 2=no extrema, 3=no pobreza)
freq(as.character(base_identidades_2$pobreza))
## Frequencies
## as.character(base_identidades_2$pobreza)
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 203 2.465 2.465 2.464 2.464
## 2 443 5.380 7.846 5.377 7.841
## 3 7588 92.154 100.000 92.099 99.939
## <NA> 5 0.061 100.000
## Total 8239 100.000 100.000 100.000 100.000
# Variable pobreza_multidimensional (0=no pobre, 1=pobre)
freq(as.character(base_identidades_2$pobreza_multi_5d))
## Frequencies
## as.character(base_identidades_2$pobreza_multi_5d)
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 6690 82.75 82.75 81.20 81.20
## 1 1395 17.25 100.00 16.93 98.13
## <NA> 154 1.87 100.00
## Total 8239 100.00 100.00 100.00 100.00
# Variable activ (condición de actividad laboral)
freq(as.character(base_identidades_2$activ))
## Frequencies
## as.character(base_identidades_2$activ)
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 3659 53.38 53.38 44.41 44.41
## 2 384 5.60 58.99 4.66 49.07
## 3 2811 41.01 100.00 34.12 83.19
## <NA> 1385 16.81 100.00
## Total 8239 100.00 100.00 100.00 100.00
# Variable r7k (¿tiene red con educación universitaria?)
freq(as.character(base_identidades_2$r7k))
## Frequencies
## as.character(base_identidades_2$r7k)
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## -88 71 0.86 0.86 0.86 0.86
## 1 3539 42.95 43.82 42.95 43.82
## 2 1043 12.66 56.48 12.66 56.48
## 3 1235 14.99 71.46 14.99 71.46
## 4 2351 28.54 100.00 28.54 100.00
## <NA> 0 0.00 100.00
## Total 8239 100.00 100.00 100.00 100.00
# Variable r8g (¿sintió hambre por falta de dinero?)
freq(as.character(base_identidades_2$r8g))
## Frequencies
## as.character(base_identidades_2$r8g)
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 723 19.91 19.91 8.78 8.78
## 2 2908 80.09 100.00 35.30 44.07
## <NA> 4608 55.93 100.00
## Total 8239 100.00 100.00 100.00 100.00
library(summarytools)
#Calcular todas las medidas estadísticas; descr()
descr(base_identidades_2[, c("edad", "esc", "yautcorh")])
## Descriptive Statistics
## base_identidades_2
## N: 8239
##
## edad esc yautcorh
## ----------------- --------- --------- -------------
## Mean 39.60 11.23 1538948.52
## Std.Dev 22.72 4.19 3570223.77
## Min 0.00 0.00 0.00
## Q1 21.00 9.00 420000.00
## Median 38.00 12.00 825000.00
## Q3 58.00 14.00 1417500.00
## Max 120.00 29.00 52583334.00
## MAD 28.17 4.45 644931.00
## IQR 37.00 5.00 997500.00
## CV 0.57 0.37 2.32
## Skewness 0.15 -0.49 7.00
## SE.Skewness 0.03 0.03 0.03
## Kurtosis -0.94 0.22 55.26
## N.Valid 8239.00 6808.00 8239.00
## N 8239.00 8239.00 8239.00
## Pct.Valid 100.00 82.63 100.00
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Construir Histograma de escolaridad; ggplot() y geom_histogram()
ggplot(base_identidades_2, aes(x = esc)) +
geom_histogram(bins = 15, fill = "#7FFFD4", color = "#76EEC6") +
labs(
title = "Distribución de Años de Escolaridad",
x = "Años de escolaridad",
y = "Frecuencia"
) +
theme_minimal()
## Warning: Removed 1431 rows containing non-finite outside the scale range
## (`stat_bin()`).
#Construir Histograma de escolaridad específico
base_esc <- base_identidades_2 |>
filter(!is.na(esc), edad >= 18)
# Ahora graficamos con los datos específicos
ggplot(base_esc, aes(x = esc)) +
geom_histogram(bins = 15, fill = "#66CDAA", color = "#458B74") +
labs(
title = "Distribución de Años de Escolaridad Específica (mayores de edad)",
x = "Años de escolaridad",
y = "Frecuencia"
) +
theme_minimal()
# Histograma del ingreso autónomo corregido
options(scipen = 999)
ggplot(base_identidades_2, aes(x = yautcorh)) +
geom_histogram(bins = 12, fill = "#FF6EB4", color = "#EE6AA7") +
labs(
title = "Distribución del Ingreso Autónomo Corregido del Hogar",
x = "Ingreso ($)",
y = "Frecuencia"
) +
theme_minimal()
#Construir Histograma de ingreso autónomo específico
base_yautcorh <- base_identidades_2 |>
filter(!is.na(yautcorh), edad >= 18)
# Ahora graficamos con los datos específicos (mayores de edad)
ggplot(base_yautcorh, aes(x = yautcorh)) +
geom_histogram(bins = 12, fill = "#CD6090", color = "#8B3A62") +
labs(
title = "Distribución del Ingreso Autónomo Corregido del Hogar Específico",
x = "Ingreso ($)",
y = "Frecuencia"
) +
theme_minimal()
#Crear un bloxplot; geom_bloxplot()
ggplot(base_identidades_2,
aes(x = as.factor(pobreza), y = esc,
fill = as.factor(pobreza))) +
geom_boxplot() +
scale_x_discrete(
labels = c("1" = "Pobreza extrema",
"2" = "Pobreza no extrema",
"3" = "No pobreza")
) +
scale_fill_manual(
values = c("1" = "red", # Rojo = pobreza extrema
"2" = "orange", # naranjo = pobreza no extrema
"3" = "green") # verde = no pobreza
) +
labs(
title = "Años de Escolaridad según Categoría de Pobreza",
x = "Categoría de pobreza",
y = "Años de escolaridad",
fill = "Categoría"
) +
theme_minimal()
## Warning: Removed 1431 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
#Calcular los percentiles; quantile()
quantile(base_identidades_2$esc,
probs = c(0.25, 0.50, 0.75, 0.90),
na.rm = TRUE)
## 25% 50% 75% 90%
## 9 12 14 17
#Sacar el Rango Intercuartil; IQR()
iqr_esc <- IQR(base_identidades_2$esc, na.rm = TRUE)
cat("IQR de escolaridad:", iqr_esc, "años\n")
## IQR de escolaridad: 5 años
#Calcular la Varianza y Desviación estándar; var() y sd()
var_esc <- var(base_identidades_2$esc, na.rm = TRUE)
sd_esc <- sd(base_identidades_2$esc, na.rm = TRUE)
cat("Varianza de escolaridad:", round(var_esc, 2), "\n")
## Varianza de escolaridad: 17.55
cat("Desviación estándar:", round(sd_esc, 2), "años\n")
## Desviación estándar: 4.19 años
# Sacar el Coeficiente de variación
media_esc <- mean(base_identidades_2$esc, na.rm = TRUE)
cv_esc <- (sd_esc / media_esc) * 100
cat("Media de escolaridad:", round(media_esc, 2), "años\n")
## Media de escolaridad: 11.23 años
cat("Coeficiente de variación (CV):", round(cv_esc, 2), "%\n")
## Coeficiente de variación (CV): 37.32 %
#Utilizar ctable() para generar una tabla de contigencia
ctable(
as.character(base_identidades_2$pobreza),
as.character(base_identidades_2$r7k)
)
## Cross-Tabulation, Row Proportions
## as.character(base_identidades_2$pobreza) * as.character(base_identidades_2$r7k)
##
## ------------------------------------------ -------------------------------------- ----------- -------------- -------------- -------------- -------------- ---------------
## as.character(base_identidades_2$r7k) -88 1 2 3 4 Total
## as.character(base_identidades_2$pobreza)
## 1 6 (3.0%) 68 (33.5%) 11 ( 5.4%) 10 ( 4.9%) 108 (53.2%) 203 (100.0%)
## 2 9 (2.0%) 166 (37.5%) 44 ( 9.9%) 12 ( 2.7%) 212 (47.9%) 443 (100.0%)
## 3 56 (0.7%) 3302 (43.5%) 988 (13.0%) 1211 (16.0%) 2031 (26.8%) 7588 (100.0%)
## <NA> 0 (0.0%) 3 (60.0%) 0 ( 0.0%) 2 (40.0%) 0 ( 0.0%) 5 (100.0%)
## Total 71 (0.9%) 3539 (43.0%) 1043 (12.7%) 1235 (15.0%) 2351 (28.5%) 8239 (100.0%)
## ------------------------------------------ -------------------------------------- ----------- -------------- -------------- -------------- -------------- ---------------
Corradi, B. Espinoza, Ó. Gozález, L. Larrando, Y. Maldonado, K. & Sandoval, L. (Diciembre 2022). ¿Contribuye la gratuidad a la permanencia en la educación superior? Percepciónes de estudiantes acerca de su experiencia universidad. Calidad en la Educación. Recuperado el 22 de abril de 2026. https://www.scielo.cl/pdf/caledu/n57/0718-4565-caledu-57-67.pdf
Diario UChile. ( Enero 2025). Chile alcanza el segundo puesto en esperanza de vida en América. Diario UChile. Recuperado el 3 de mayo de 2026. https://radio.uchile.cl/2025/01/12/chile-alcanza-el-segundo-puesto-en-esperanza-de-vida-en-america/
Ministerio de Educación. (Octubre 1999). Educación para todos: Evaluación en el año 2000 Informe de Chile. Ministerio de Educación. Recuperado el 22 de abril de 2026. https://www.google.com/url?sa=t&source=web&rct=j&opi=89978449&url=https://bibliotecadigital.mineduc.cl/bitstream/handle/20.500.12365/14791/EPT1999.pdf%3Fsequence%3D1%26isAllowed%3Dy&ved=2ahUKEwj_24D7goSUAxUQppUCHUDHG5MQFnoECBgQAQ&usg=AOvVaw2qi8Sqa4rcjc1rQpotnJxH
Urzúa, S. (Enero 2024). La elite endogámica de Chile: La desigualdad, pobreza y catástrofe social que impone la clase alta a través del sistema educacional. Centro Latinoamericano de Políticas Económicas y Sociales UC. Recuperado el 22 de abril de 2026. https://clapesuc.cl/en-los-medios/la-elite-endogamica-de-chile-la-desigualdad-pobreza-y-catastrofe-social-que-impone-la-clase-alta-a-traves-del-sistema-educacional