Pobreza y Educación: La Gran Insolvencia Laboral

Marthina Rayén Miranda Oses & Antonia Muñoz

library(haven)

base_identidades_2 <- read_dta("uchile/2do/primer semestre/Estadística/Solemne I/base_identidades_2.dta")
library(summarytools)
library(ggplot2)
library(knitr)
library(haven)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.2.1     ✔ readr     2.2.0
## ✔ forcats   1.0.1     ✔ stringr   1.6.0
## ✔ lubridate 1.9.5     ✔ tibble    3.3.1
## ✔ purrr     1.2.2     ✔ tidyr     1.3.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ✖ tibble::view()  masks summarytools::view()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(dplyr)
print(dfSummary(base_identidades_2))
## Data Frame Summary  
## base_identidades_2  
## Dimensions: 8239 x 44  
## Duplicates: 12  
## 
## ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
## No   Variable             Label                                      Stats / Values                      Freqs (% of Valid)     Graph                  Valid      Missing  
## ---- -------------------- ------------------------------------------ ----------------------------------- ---------------------- ---------------------- ---------- ---------
## 1    folio                Identificación hogar (id_vivienda hogar)   Mean (sd) : 279009409 (103225801)   3000 distinct values     : : : . . . . . .    8239       0        
##      [numeric]                                                       min < med < max:                                           : : : : : : : : : :    (100.0%)   (0.0%)   
##                                                                      100340201 < 278850801 < 458440601                          : : : : : : : : : :                        
##                                                                      IQR (CV) : 178204650 (0.4)                                 : : : : : : : : : :                        
##                                                                                                                                 : : : : : : : : : :                        
## 
## 2    sexo                 Sexo                                       1. [1] 1. Hombre                    3921 (47.6%)           IIIIIIIII              8239       0        
##      [haven_labelled,                                                2. [2] 2. Mujer                     4318 (52.4%)           IIIIIIIIII             (100.0%)   (0.0%)   
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## 
## 3    edad                 Edad                                       Mean (sd) : 39.6 (22.7)             101 distinct values      . :   :              8239       0        
##      [numeric]                                                       min < med < max:                                           : : : : : .            (100.0%)   (0.0%)   
##                                                                      0 < 38 < 120                                               : : : : : :                                
##                                                                      IQR (CV) : 37 (0.6)                                        : : : : : : :                              
##                                                                                                                                 : : : : : : : .                            
## 
## 4    ecivil               ecivil. ¿Cuál es el estado conyugal o      1. [1] 1. Casado(a)                 2146 (30.9%)           IIIIII                 6949       1290     
##      [haven_labelled,     civil actual?                              2. [2] 2. Conviviente o pare        1311 (18.9%)           III                    (84.3%)    (15.7%)  
##      vctrs_vctr,                                                     3. [3] 3. Conviviente civil           26 ( 0.4%)                                                      
##      double]                                                         4. [4] 4. Anulado(a)                  12 ( 0.2%)                                                      
##                                                                      5. [5] 5. Separado(a)                306 ( 4.4%)                                                      
##                                                                      6. [6] 6. Divorciado(a)              174 ( 2.5%)                                                      
##                                                                      7. [7] 7. Viudo(a)                   391 ( 5.6%)           I                                          
##                                                                      8. [8] 8. Soltero(a)                2583 (37.2%)           IIIIIII                                    
## 
## 5    pco1                 pco1. Jefatura de hogar y relación con     1. [1] 1. Jefatura de Hogar         3000 (36.4%)           IIIIIII                8239       0        
##      [haven_labelled,     jefatura de hogar                          2. [2] 2. Esposo(a) o pareja        1548 (18.8%)           III                    (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [3] 3. Esposo(a) o pareja          16 ( 0.2%)                                                      
##      double]                                                         4. [4] 4. Hijo(a) de ambos          1471 (17.9%)           III                                        
##                                                                      5. [5] 5. Hijo(a) sólo de la        1144 (13.9%)           II                                         
##                                                                      6. [6] 6. Hijo(a) sólo del e          78 ( 0.9%)                                                      
##                                                                      7. [7] 7. Padre o madre              122 ( 1.5%)                                                      
##                                                                      8. [8] 8. Suegro(a)                   31 ( 0.4%)                                                      
##                                                                      9. [9] 9. Yerno o nuera               93 ( 1.1%)                                                      
##                                                                      10. [10] 10. Nieto(a)                399 ( 4.8%)                                                      
##                                                                      [ 5 others ]                         337 ( 4.1%)                                                      
## 
## 6    numper               Número de personas en el hogar (excluye    Mean (sd) : 3.5 (1.5)               11 distinct values     : . .                  8239       0        
##      [numeric]            SDPA)                                      min < med < max:                                           : : :                  (100.0%)   (0.0%)   
##                                                                      1 < 3 < 11                                                 : : : .                                    
##                                                                      IQR (CV) : 2 (0.4)                                         : : : :                                    
##                                                                                                                                 : : : : : .                                
## 
## 7    esc                  Años de escolaridad (edad >= 15)           Mean (sd) : 11.2 (4.2)              27 distinct values             :              6808       1431     
##      [numeric]                                                       min < med < max:                                                   :              (82.6%)    (17.4%)  
##                                                                      0 < 12 < 29                                                        : .                                
##                                                                      IQR (CV) : 5 (0.4)                                             : : : :                                
##                                                                                                                                 . : : : : : .                              
## 
## 8    pobreza              Categoría de pobreza                       1. [1] Pobreza extrema               203 ( 2.5%)                                  8234       5        
##      [haven_labelled,                                                2. [2] Pobreza no extrema            443 ( 5.4%)           I                      (99.9%)    (0.1%)   
##      vctrs_vctr,                                                     3. [3] No pobreza                   7588 (92.2%)           IIIIIIIIIIIIIIIIII                         
##      double]                                                                                                                                                               
## 
## 9    pobreza_multi_5d     situación de pobreza multidimensional      1. [0] No pobreza                   6690 (82.7%)           IIIIIIIIIIIIIIII       8085       154      
##      [haven_labelled,     con entorno y redes (5 dimensiones)        2. [1] Pobreza                      1395 (17.3%)           III                    (98.1%)    (1.9%)   
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## 
## 10   activ                Condición de actividad                     1. [1] Ocupados                     3659 (53.4%)           IIIIIIIIII             6854       1385     
##      [haven_labelled,                                                2. [2] Desocupados                   384 ( 5.6%)           I                      (83.2%)    (16.8%)  
##      vctrs_vctr,                                                     3. [3] Inactivos                    2811 (41.0%)           IIIIIIII                                   
##      double]                                                                                                                                                               
## 
## 11   ysub                 Subsidios monetarios                       Mean (sd) : 29261 (63407.8)         911 distinct values    :                      8239       0        
##      [numeric]                                                       min < med < max:                                           :                      (100.0%)   (0.0%)   
##                                                                      0 < 0 < 504912                                             :                                          
##                                                                      IQR (CV) : 23917 (2.2)                                     :                                          
##                                                                                                                                 :     . .                                  
## 
## 12   ysubh                Subsidios monetarios del hogar             Mean (sd) : 85865.7 (121057.6)      1059 distinct values   :                      8239       0        
##      [numeric]                                                       min < med < max:                                           :                      (100.0%)   (0.0%)   
##                                                                      0 < 29184 < 686960                                         :                                          
##                                                                      IQR (CV) : 132860.5 (1.4)                                  :                                          
##                                                                                                                                 : : : .                                    
## 
## 13   yautcor              Ingreso autónomo corregido                 Mean (sd) : 621440.1 (1114525)      1465 distinct values   :                      4852       3387     
##      [numeric]                                                       min < med < max:                                           :                      (58.9%)    (41.1%)  
##                                                                      667 < 420000 < 50966667                                    :                                          
##                                                                      IQR (CV) : 480000 (1.8)                                    :                                          
##                                                                                                                                 :                                          
## 
## 14   yautcorh             Ingreso autónomo corregido del hogar       Mean (sd) : 1538948 (3570224)       1473 distinct values   :                      8239       0        
##      [numeric]                                                       min < med < max:                                           :                      (100.0%)   (0.0%)   
##                                                                      0 < 825000 < 52583334                                      :                                          
##                                                                      IQR (CV) : 997500 (2.3)                                    :                                          
##                                                                                                                                 :                                          
## 
## 15   r3                   r3. La ley reconoce diez pueblos           1. [1] 1. Aimara                     159 ( 1.9%)                                  8239       0        
##      [haven_labelled,     indígenas, ¿pertenece a alguno de ellos?   2. [2] 2. Rapa-Nui o Pascuen           0 ( 0.0%)                                  (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [3] 3. Quechua                     38 ( 0.5%)                                                      
##      double]                                                         4. [4] 4. Mapuche                    838 (10.2%)           II                                         
##                                                                      5. [5] 5. Atacameño (Likan-A          38 ( 0.5%)                                                      
##                                                                      6. [6] 6. Collas                      18 ( 0.2%)                                                      
##                                                                      7. [7] 7. Kawashkar o Alacal           0 ( 0.0%)                                                      
##                                                                      8. [8] 8. Yámana o Yagán               0 ( 0.0%)                                                      
##                                                                      9. [9] 9. Diaguita                   108 ( 1.3%)                                                      
##                                                                      10. [10] 10. Chango                    9 ( 0.1%)                                                      
##                                                                      11. [11] 11. No pertenece a n       7031 (85.3%)           IIIIIIIIIIIIIIIII                          
## 
## 16   r4                   r4. ¿Habla o entiende algunas de las       1. [1] 1. Habla y entiende           124 ( 1.5%)                                  8239       0        
##      [haven_labelled,     siguientes lenguas: Aimara, Rapa-Nui,…?    2. [2] 2. Solo entiende              188 ( 2.3%)                                  (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [3] 3. No habla ni entien        7927 (96.2%)           IIIIIIIIIIIIIIIIIII                        
##      double]                                                                                                                                                               
## 
## 17   r7b                  r7b. Pueda ayudar en cuidado de niños o    1. [-88] No sabe                      56 ( 0.7%)                                  8239       0        
##      [haven_labelled,     personas con discapacidad o dependientes   2. [1] 1. Sí, alguien fuera         2794 (33.9%)           IIIIII                 (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        1949 (23.7%)           IIII                                       
##      double]                                                         4. [3] 3. Ambas                     1980 (24.0%)           IIII                                       
##                                                                      5. [4] 4. No conoce                 1460 (17.7%)           III                                        
## 
## 18   r7d                  r7d. Pueda prestar dinero al hogar en      1. [-88] No sabe                      72 ( 0.9%)                                  8239       0        
##      [haven_labelled,     caso de emergencia                         2. [1] 1. Sí, alguien fuera         3603 (43.7%)           IIIIIIII               (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        1110 (13.5%)           II                                         
##      double]                                                         4. [3] 3. Ambas                     1406 (17.1%)           III                                        
##                                                                      5. [4] 4. No conoce                 2048 (24.9%)           IIII                                       
## 
## 19   r1b_comuna_esp_cod   r1b_comuna_esp_cod. Código comuna donde    1. [1101] Iquique                     67 ( 2.2%)                                  2995       5244     
##      [haven_labelled,     vivía su madre                             2. [1107] Alto Hospicio                1 ( 0.0%)                                  (36.4%)    (63.6%)  
##      vctrs_vctr,                                                     3. [1401] Pozo Almonte                 7 ( 0.2%)                                                      
##      double]                                                         4. [1402] Camiña                       1 ( 0.0%)                                                      
##                                                                      5. [1403] Colchane                     2 ( 0.1%)                                                      
##                                                                      6. [1404] Huara                        6 ( 0.2%)                                                      
##                                                                      7. [1405] Pica                         0 ( 0.0%)                                                      
##                                                                      8. [2101] Antofagasta                 44 ( 1.5%)                                                      
##                                                                      9. [2102] Mejillones                   0 ( 0.0%)                                                      
##                                                                      10. [2103] Sierra Gorda                0 ( 0.0%)                                                      
##                                                                      [ 338 others ]                      2867 (95.7%)           IIIIIIIIIIIIIIIIIII                        
## 
## 20   r7i                  r7i. Pueda aconsejar a los miembros del    1. [-88] No sabe                      17 ( 0.2%)                                  8239       0        
##      [haven_labelled,     hogar en caso de problemas personales…     2. [1] 1. Sí, alguien fuera         2980 (36.2%)           IIIIIII                (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        1743 (21.2%)           IIII                                       
##      double]                                                         4. [3] 3. Ambas                     1694 (20.6%)           IIII                                       
##                                                                      5. [4] 4. No conoce                 1805 (21.9%)           IIII                                       
## 
## 21   r6                   r6. Últ. 12 meses, ¿ha participado en      1. [1] 1. Juntas de vecinos          642 ( 8.7%)           I                      7382       857      
##      [haven_labelled,     alguna de las siguientes                   2. [2] 2. Club deportivo o r         362 ( 4.9%)                                  (89.6%)    (10.4%)  
##      vctrs_vctr,          organizaciones?..                          3. [3] 3. Organización relig         531 ( 7.2%)           I                                          
##      double]                                                         4. [4] 4. Agrupaciones cultu         102 ( 1.4%)                                                      
##                                                                      5. [5] 5. Grupos de identida          70 ( 0.9%)                                                      
##                                                                      6. [6] 6. Agrupaciones juven          43 ( 0.6%)                                                      
##                                                                      7. [7] 7. Agrupaciones de mu          48 ( 0.7%)                                                      
##                                                                      8. [8] 8. Agrupaciones de ad         111 ( 1.5%)                                                      
##                                                                      9. [9] 9. Grupos de voluntar          38 ( 0.5%)                                                      
##                                                                      10. [10] 10. Grupos de autoay          9 ( 0.1%)                                                      
##                                                                      [ 5 others ]                        5426 (73.5%)           IIIIIIIIIIIIII                             
## 
## 22   r7k                  r7k. Tenga educación profesional           1. [-88] No sabe                      71 ( 0.9%)                                  8239       0        
##      [haven_labelled,     universitaria                              2. [1] 1. Sí, alguien fuera         3539 (43.0%)           IIIIIIII               (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        1043 (12.7%)           II                                         
##      double]                                                         4. [3] 3. Ambas                     1235 (15.0%)           II                                         
##                                                                      5. [4] 4. No conoce                 2351 (28.5%)           IIIII                                      
## 
## 23   r2_pais_esp          r2_pais_esp. Especifique país donde        1. (Empty string)                   8037 (97.5%)           IIIIIIIIIIIIIIIIIII    8239       0        
##      [character]          vivía hace 5 años (2017)                   2. Venezuela                          95 ( 1.2%)                                  (100.0%)   (0.0%)   
##                                                                      3. Colombia                           40 ( 0.5%)                                                      
##                                                                      4. Perú                               19 ( 0.2%)                                                      
##                                                                      5. Bolivia                            17 ( 0.2%)                                                      
##                                                                      6. Haití                               8 ( 0.1%)                                                      
##                                                                      7. Argentina                           7 ( 0.1%)                                                      
##                                                                      8. Estados Unidos                      4 ( 0.0%)                                                      
##                                                                      9. Brasil                              3 ( 0.0%)                                                      
##                                                                      10. Ecuador                            3 ( 0.0%)                                                      
##                                                                      [ 4 others ]                           6 ( 0.1%)                                                      
## 
## 24   r2                   r2. ¿En qué comuna o país vivía hace 5     1. [-88] No sabe                      13 ( 0.2%)                                  7784       455      
##      [haven_labelled,     años (2017)?                               2. [1] 1. En esta comuna            6854 (88.1%)           IIIIIIIIIIIIIIIII      (94.5%)    (5.5%)   
##      vctrs_vctr,                                                     3. [2] 2. En otra comuna de          715 ( 9.2%)           I                                          
##      double]                                                         4. [3] 3. En otro país               202 ( 2.6%)                                                      
## 
## 25   r7f                  r7f. Pueda ayudar en el uso de             1. [-88] No sabe                      31 ( 0.4%)                                  8239       0        
##      [haven_labelled,     tecnologías (computador, internet, etc.)   2. [1] 1. Sí, alguien fuera         2318 (28.1%)           IIIII                  (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        2947 (35.8%)           IIIIIII                                    
##      double]                                                         4. [3] 3. Ambas                     1642 (19.9%)           III                                        
##                                                                      5. [4] 4. No conoce                 1301 (15.8%)           III                                        
## 
## 26   r1a_esp              r1a_esp. ¿Cuál país?                       1. (Empty string)                   7834 (95.1%)           IIIIIIIIIIIIIIIIIII    8239       0        
##      [character]                                                     2. Venezuela                         149 ( 1.8%)                                  (100.0%)   (0.0%)   
##                                                                      3. Colombia                           71 ( 0.9%)                                                      
##                                                                      4. Bolivia                            59 ( 0.7%)                                                      
##                                                                      5. Perú                               40 ( 0.5%)                                                      
##                                                                      6. Haití                              32 ( 0.4%)                                                      
##                                                                      7. Ecuador                            12 ( 0.1%)                                                      
##                                                                      8. Argentina                          10 ( 0.1%)                                                      
##                                                                      9. Brasil                              6 ( 0.1%)                                                      
##                                                                      10. Cuba                               6 ( 0.1%)                                                      
##                                                                      [ 10 others ]                         20 ( 0.2%)                                                      
## 
## 27   r1b_pais_esp_cod     r1b_pais_esp_cod. Código país donde        1. [101] Albania                      0 ( 0.0%)                                   456        7783     
##      [haven_labelled,     vivía su madre                             2. [102] Alemania                     1 ( 0.2%)                                   (5.5%)     (94.5%)  
##      vctrs_vctr,                                                     3. [103] Andorra                      0 ( 0.0%)                                                       
##      double]                                                         4. [104] Armenia                      0 ( 0.0%)                                                       
##                                                                      5. [105] Austria                      0 ( 0.0%)                                                       
##                                                                      6. [106] Azerbaiyán                   0 ( 0.0%)                                                       
##                                                                      7. [107] Bélgica                      0 ( 0.0%)                                                       
##                                                                      8. [108] Bielorrusia                  0 ( 0.0%)                                                       
##                                                                      9. [109] Bosnia                       0 ( 0.0%)                                                       
##                                                                      10. [110] Bulgaria                    0 ( 0.0%)                                                       
##                                                                      [ 192 others ]                      455 (99.8%)            IIIIIIIIIIIIIIIIIII                        
## 
## 28   r7e                  r7e. Pueda ayudar a resolver consultas o   1. [-88] No sabe                      27 ( 0.3%)                                  8239       0        
##      [haven_labelled,     realizar trámites legales o financieros    2. [1] 1. Sí, alguien fuera         3124 (37.9%)           IIIIIII                (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        1384 (16.8%)           III                                        
##      double]                                                         4. [3] 3. Ambas                     1203 (14.6%)           II                                         
##                                                                      5. [4] 4. No conoce                 2501 (30.4%)           IIIIII                                     
## 
## 29   r7c                  r7c. Pueda facilitar un vehículo si el     1. [-88] No sabe                      41 ( 0.5%)                                  8239       0        
##      [haven_labelled,     hogar lo necesita                          2. [1] 1. Sí, alguien fuera         3787 (46.0%)           IIIIIIIII              (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        1462 (17.7%)           III                                        
##      double]                                                         4. [3] 3. Ambas                     1594 (19.3%)           III                                        
##                                                                      5. [4] 4. No conoce                 1355 (16.4%)           III                                        
## 
## 30   r2_comuna_esp_cod    r2_comuna_esp_cod. Código comuna donde     1. [1101] Iquique                    24 ( 3.4%)                                   715        7524     
##      [haven_labelled,     vivía hace 5 años (2017)                   2. [1107] Alto Hospicio               2 ( 0.3%)                                   (8.7%)     (91.3%)  
##      vctrs_vctr,                                                     3. [1401] Pozo Almonte                1 ( 0.1%)                                                       
##      double]                                                         4. [1402] Camiña                      0 ( 0.0%)                                                       
##                                                                      5. [1403] Colchane                    0 ( 0.0%)                                                       
##                                                                      6. [1404] Huara                       0 ( 0.0%)                                                       
##                                                                      7. [1405] Pica                        1 ( 0.1%)                                                       
##                                                                      8. [2101] Antofagasta                 8 ( 1.1%)                                                       
##                                                                      9. [2102] Mejillones                  0 ( 0.0%)                                                       
##                                                                      10. [2103] Sierra Gorda               1 ( 0.1%)                                                       
##                                                                      [ 338 others ]                      678 (94.8%)            IIIIIIIIIIIIIIIIII                         
## 
## 31   r1c                  r1c. ¿En qué año llegó al país?            Mean (sd) : 1973 (292.9)            42 distinct values                       :    456        7783     
##      [haven_labelled,                                                min < med < max:                                                             :    (5.5%)     (94.5%)  
##      vctrs_vctr,                                                     -88 < 2017 < 2023                                                            :                        
##      double]                                                         IQR (CV) : 7 (0.1)                                                           :                        
##                                                                                                                                                   :                        
## 
## 32   r2_comuna_esp        r2_comuna_esp. Especifique comuna donde    1. (Empty string)                   7524 (91.3%)           IIIIIIIIIIIIIIIIII     8239       0        
##      [character]          vivía hace 5 años (2017)                   2. Santiago                           85 ( 1.0%)                                  (100.0%)   (0.0%)   
##                                                                      3.  Maipú                              26 ( 0.3%)                                                      
##                                                                      4. Iquique                            24 ( 0.3%)                                                      
##                                                                      5. Concepción                         22 ( 0.3%)                                                      
##                                                                      6. Ñuñoa                              18 ( 0.2%)                                                      
##                                                                      7. Puente Alto                        17 ( 0.2%)                                                      
##                                                                      8. Rancagua                           15 ( 0.2%)                                                      
##                                                                      9.  Peñalolén                          14 ( 0.2%)                                                      
##                                                                      10. Calama                            13 ( 0.2%)                                                      
##                                                                      [ 144 others ]                       481 ( 5.8%)           I                                          
## 
## 33   r8b                  r8b. ¿No pudo comer alimentos saludables   1. [1] 1. Sí                        2243 (27.2%)           IIIII                  8239       0        
##      [haven_labelled,     y nutritivos por falta de dinero?          2. [2] 2. No                        5996 (72.8%)           IIIIIIIIIIIIII         (100.0%)   (0.0%)   
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## 
## 34   r1a_esp_cod          r1a_esp_cod. Código país de otra           1. [102] Alemania                     1 ( 0.2%)                                   405        7834     
##      [haven_labelled,     nacionalidad                               2. [105] Austria                      0 ( 0.0%)                                   (4.9%)     (95.1%)  
##      vctrs_vctr,                                                     3. [107] Bélgica                      0 ( 0.0%)                                                       
##      double]                                                         4. [113] Croacia                      0 ( 0.0%)                                                       
##                                                                      5. [114] Dinamarca                    0 ( 0.0%)                                                       
##                                                                      6. [115] Eslovaquia                   0 ( 0.0%)                                                       
##                                                                      7. [117] España                       1 ( 0.2%)                                                       
##                                                                      8. [119] Finlandia                    0 ( 0.0%)                                                       
##                                                                      9. [120] Francia                      1 ( 0.2%)                                                       
##                                                                      10. [123] Holanda                     0 ( 0.0%)                                                       
##                                                                      [ 52 others ]                       402 (99.3%)            IIIIIIIIIIIIIIIIIII                        
## 
## 35   r1b_comuna_esp       r1b_comuna_esp. Especifique comuna donde   1. (Empty string)                   5244 (63.6%)           IIIIIIIIIIII           8239       0        
##      [character]          vivía su madre                             2. Santiago                          257 ( 3.1%)                                  (100.0%)   (0.0%)   
##                                                                      3. Concepción                        100 ( 1.2%)                                                      
##                                                                      4. Iquique                            67 ( 0.8%)                                                      
##                                                                      5. Valdivia                           48 ( 0.6%)                                                      
##                                                                      6. Chillán                            46 ( 0.6%)                                                      
##                                                                      7. Valparaíso                         46 ( 0.6%)                                                      
##                                                                      8. Antofagasta                        44 ( 0.5%)                                                      
##                                                                      9. Providencia                        43 ( 0.5%)                                                      
##                                                                      10. San Miguel                        43 ( 0.5%)                                                      
##                                                                      [ 412 others ]                      2301 (27.9%)           IIIII                                      
## 
## 36   r1b_pais_esp         r1b_pais_esp. Especifique país donde       1. (Empty string)                   7783 (94.5%)           IIIIIIIIIIIIIIIIII     8239       0        
##      [character]          vivía su madre                             2. Venezuela                         156 ( 1.9%)                                  (100.0%)   (0.0%)   
##                                                                      3. Colombia                           75 ( 0.9%)                                                      
##                                                                      4. Bolivia                            70 ( 0.8%)                                                      
##                                                                      5. Perú                               43 ( 0.5%)                                                      
##                                                                      6. Haití                              34 ( 0.4%)                                                      
##                                                                      7. Argentina                          28 ( 0.3%)                                                      
##                                                                      8. Ecuador                            12 ( 0.1%)                                                      
##                                                                      9. Cuba                                8 ( 0.1%)                                                      
##                                                                      10. Brasil                             6 ( 0.1%)                                                      
##                                                                      [ 11 others ]                         24 ( 0.3%)                                                      
## 
## 37   r1b                  r1b. Cuando nació, ¿en qué comuna o país   1. [-88] No sabe                      67 ( 0.8%)                                  8239       0        
##      [haven_labelled,     vivía su madre?                            2. [1] 1. En esta comuna            4721 (57.3%)           IIIIIIIIIII            (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. En otra comuna de         2995 (36.4%)           IIIIIII                                    
##      double]                                                         4. [3] 3. En otro país               456 ( 5.5%)           I                                          
## 
## 38   r7a                  r7a. Pueda ayudar en el cuidado en caso    1. [-88] No sabe                      26 ( 0.3%)                                  8239       0        
##      [haven_labelled,     de enfermedad de algún miembro del hogar   2. [1] 1. Sí, alguien fuera         2980 (36.2%)           IIIIIII                (100.0%)   (0.0%)   
##      vctrs_vctr,                                                     3. [2] 2. Sí, alguien dentro        2071 (25.1%)           IIIII                                      
##      double]                                                         4. [3] 3. Ambas                     2179 (26.4%)           IIIII                                      
##                                                                      5. [4] 4. No conoce                  983 (11.9%)           II                                         
## 
## 39   r8a                  r8a. ¿Se preocupó por no tener             1. [1] 1. Sí                        3112 (37.8%)           IIIIIII                8239       0        
##      [haven_labelled,     suficientes alimentos por falta de         2. [2] 2. No                        5127 (62.2%)           IIIIIIIIIIII           (100.0%)   (0.0%)   
##      vctrs_vctr,          dinero?                                                                                                                                          
##      double]                                                                                                                                                               
## 
## 40   r9d                  r9d. Últ. 12 meses, discriminado por: Su   1. [0] No                           8199 (99.5%)           IIIIIIIIIIIIIIIIIII    8239       0        
##      [haven_labelled,     estado civil                               2. [1] Sí                             40 ( 0.5%)                                  (100.0%)   (0.0%)   
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## 
## 41   r8g                  r8g. ¿Sintió hambre y no comió por falta   1. [1] 1. Sí                         723 (19.9%)           III                    3631       4608     
##      [haven_labelled,     de dinero?                                 2. [2] 2. No                        2908 (80.1%)           IIIIIIIIIIIIIIII       (44.1%)    (55.9%)  
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## 
## 42   r9t                  r9t. Últ. 12 meses: No ha sido tratado     1. [0] No                           1383 (16.8%)           III                    8239       0        
##      [haven_labelled,     injustamente o discriminado                2. [1] Sí                           6856 (83.2%)           IIIIIIIIIIIIIIII       (100.0%)   (0.0%)   
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## 
## 43   r13b                 r13b. Completitud nivel educacional del    1. [-88] No sabe                     59 ( 3.2%)                                   1821       6418     
##      [haven_labelled,     padre de la jefatura de hogar              2. [1] 1. Sí                        942 (51.7%)            IIIIIIIIII             (22.1%)    (77.9%)  
##      vctrs_vctr,                                                     3. [2] 2. No                        820 (45.0%)            IIIIIIIII                                  
##      double]                                                                                                                                                               
## 
## 44   r14                  r14. ¿Ud. o su hogar es dueño de un        1. [1] 1. Sí                        4706 (57.1%)           IIIIIIIIIII            8239       0        
##      [haven_labelled,     vehículo de uso laboral o particular…?     2. [2] 2. No                        3533 (42.9%)           IIIIIIII               (100.0%)   (0.0%)   
##      vctrs_vctr,                                                                                                                                                           
##      double]                                                                                                                                                               
## ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

1.Conclusión BLUF

A partir del análisis estadístico descriptivo realizado, se concluye que existe una relación estrecha y multidimensional entre el nivel educacional de la jefatura de hogar y su condición socioeconómica en Chile. Si bien el país ha logrado una cobertura masiva de la educación obligatoria (12 años), esta meta se ha transformado en un estándar mínimo que ya no garantiza, por sí solo, la movilidad ascendente o la salida de la pobreza.

2. Problemática

A lo largo de los años el ingreso a la educación superior específicamente, ya sea profesional o técnica, ha evidenciado una alza independiente del contexto socioeconómico (Corradi,B & et-al, 2022), pero esto no siempre fue así, antes el mero hecho de terminar cuarto medio ya generaba complicaciones para algunos, ni hablar del privilegio de aplicar a la educación superior, muy pocos podían acceder a esta última, ya que influían diversos factores como la ubicación, la economía, entre otros (Ministerio de Educación, 1999). Esto generó un problema público laboral, ya que al pasar los años cada vez se ameritan más los estudios, es decir se prioriza un título profesional o hasta un cuarto medio, y se deja de lado a aquella personas que por diversas razones sociales, económicas, familiares, etc, no pudieron acceder a un nivel educativo igual o superior a cuarto medio, generando una dificultad a la hora de conseguir un empleo formal y una estabilidad económica.

El nivel educativo influye y a la vez excluyente en la obtención de empleo, ya que actualmente gran parte de la industria solicita algún título técnico y/o profesional o bien cierto nivel educacional, aumentando así las exigencias para obtener un empleo. Es por esta razón que las personas que no tienen un nivel educativo alto se ven afectadas en el ingreso mensual a su hogar, ya que al no tener estudios superiores o por ejemplo cuarto medio no tienen la misma valoración económica (Urzúa, 2024).

Ambas temáticas nos abren a la siguiente pregunta ¿Existe una relación entre el nivel educacional de la jefatura de hogar y la condición socioeconómica de los hogares?

2.1 Pregunta de Investigación

  • ¿Cuál es la posible relación entre el nivel educacional de el/la jefe/a de hogar, ya sea básica, media o universitaria, y su condición socioeconómica, específicamente sus ingresos mensuales aproximados?

2.2 Objetivos

Objetivo General:

  • Analizar la relación entre las condiciones socioeconómicas, tanto nivel de educación como ingresos, y la vulnerabilidad dimensional de los hogares en Chile, con el fin de caracterizar los perfiles de pobreza y la eficiencia de las redes de apoyo.

Objetivos Especificos:

  1. Describir la distribución de los años de escolaridad de la muestra, identificando las brechas educativas según la condición de actividad.
  2. Explorar la relación entre el ingreso autónomo corregido y los años de escolaridad, utilizando medidas de tendencia central y dispersión.
  3. Comparar la proporción de personas con educación profesional universitaria (r7k) en los distintos estratos de pobreza para observar cómo el nivel educacional influye en la categoría de ingresos del hogar.

3. Metodología

3.1 Descripción de la base de datos

La presente investigación utiliza una base de datos que proviene de la Encuesta de Caracterización Socioeconómica Nacional (CASEN) 2022, ejecutada por el Ministerio de Desarrollo Social y Familia. Si bien los datos base son de 2022, el archivo cuenta con variables actualizadas al año 2023. La unidad de análisis son las personas residentes en Chile y su población objetivo corresponde a los hogares de las 16 regiones del país. El propósito general de esta base es caracterizar la situación socioeconómica de la población para orientar la creación y diseño de políticas públicas.

3.2 Objetivo del estudio (problema planteado)

Analizar la relación entre el nivel educacional de la jefatura de hogar y la situación de pobreza de los hogares en Chile, utilizando herramientas de estadística descriptiva para identificar patrones de vulnerabilidad socioeconómica basados en el capital del principal sostenedor del hogar.

3.3 Unidad de análisis y población

Unidad de análisis:

El hogar, definido como el grupo de personas que residen en una misma vivienda y comparten presupuesto alimentario.

Población objetivo:

Los hogares residentes en Chile que se encuentran representados en la base de datos asignada, cubriendo la diversidad socioeconómica de las regiones del país.

3.4 Clasificación de variables

##        Variable                          Descripcion         Tipo  Escala
## 1          edad               Edad del jefe de hogar Cuantitativa   Razón
## 2           esc                  Años de escolaridad Cuantitativa   Razón
## 3      yautcorh Ingreso autónomo corregido del hogar Cuantitativa   Razón
## 4       pobreza                 Categoría de pobreza  Cualitativa Ordinal
## 5 pobreza_multi             Pobreza multidimensional  Cualitativa Nominal
## 6         activ               Condición de actividad  Cualitativa Nominal
## 7           r7k      Red con educación universitaria  Cualitativa Nominal
## 8           r8g    Sintió hambre por falta de dinero  Cualitativa Nominal
##   Naturaleza
## 1   Discreta
## 2   Discreta
## 3   Continua
## 4          —
## 5          —
## 6          —
## 7          —
## 8          —

3.5 Breve justificación de las medidas estadistica utilizada

Para el análisis de datos en R, se aplicarán los siguientes procedimientos:

Variables cualitativas:

Tablas de frecuencia absoluta y relativa para identificar la categoría predominante en pobreza y actividad.

Variables cuantitativas:

Medidas de tendencia central (media, mediana), de dispersión (desviación estándar, rango intercuartílico) y de posición (percentiles) para caracterizar la escolaridad y edad.

Análisis gráfico:

Histogramas para observar la distribución de los datos y diagramas de caja (box plots) para comparar los años de escolaridad según el nivel de pobreza de los hogares.

4. Herramientas Estadísticas

4.1 Variables según diccionario

Las variables que guardan relación con la problemática expuesta, son:

Cuantitativa:

  1. edad: Edad, de escala razón y naturaleza discreta;

  2. esc: Años de escolaridad (edad >= 15), de escala razón y naturaleza discreta;

  3. yautcorh: Ingreso autónomo corregido del hogar, de escala razón y naturaleza continua.

Cualitativa:

  1. r7d: Pueda prestar dinero al hogar en caso de emergencia, de escala ordinal;

  2. r7k: Tenga educación profesional universitaria, de escala nominal;

  3. r8g: ¿Sintió hambre y no comió por falta de dinero?, de escala nominal;

  4. activ: Condición de actividad. (CUALI), de escala nominal;

  5. pobreza: Categoría de pobreza (Pobreza extrema = 1, Pobreza no extrema = 2, No pobreza = 3), de escala nominal;

  6. pobreza multidimensional: situación de pobreza multidimensional con entorno y redes (No pobreza = 0, Pobreza = 1), de escala nominal.

4.2 Variables Categóricas

names(base_identidades_2)
##  [1] "folio"              "sexo"               "edad"              
##  [4] "ecivil"             "pco1"               "numper"            
##  [7] "esc"                "pobreza"            "pobreza_multi_5d"  
## [10] "activ"              "ysub"               "ysubh"             
## [13] "yautcor"            "yautcorh"           "r3"                
## [16] "r4"                 "r7b"                "r7d"               
## [19] "r1b_comuna_esp_cod" "r7i"                "r6"                
## [22] "r7k"                "r2_pais_esp"        "r2"                
## [25] "r7f"                "r1a_esp"            "r1b_pais_esp_cod"  
## [28] "r7e"                "r7c"                "r2_comuna_esp_cod" 
## [31] "r1c"                "r2_comuna_esp"      "r8b"               
## [34] "r1a_esp_cod"        "r1b_comuna_esp"     "r1b_pais_esp"      
## [37] "r1b"                "r7a"                "r8a"               
## [40] "r9d"                "r8g"                "r9t"               
## [43] "r13b"               "r14"
View(base_identidades_2)
print(base_identidades_2)
## # A tibble: 8,239 × 44
##      folio sexo     edad ecivil   pco1     numper   esc pobreza pobreza_multi_5d
##      <dbl> <dbl+l> <dbl> <dbl+lb> <dbl+lb>  <dbl> <dbl> <dbl+l> <dbl+lbl>       
##  1  1.00e8 2 [2. …    65  4 [4. …  1 [1. …      1    10 3 [No … 0 [No pobreza]  
##  2  1.01e8 2 [2. …    24  8 [8. …  1 [1. …      5    16 3 [No … 1 [Pobreza]     
##  3  1.01e8 2 [2. …    55  1 [1. …  7 [7. …      5     8 3 [No … 1 [Pobreza]     
##  4  1.01e8 1 [1. …    18  8 [8. … 11 [11.…      5    13 3 [No … 1 [Pobreza]     
##  5  1.01e8 1 [1. …    51  1 [1. …  7 [7. …      5    12 3 [No … 1 [Pobreza]     
##  6  1.01e8 2 [2. …     0 NA        5 [5. …      5    NA 3 [No … 1 [Pobreza]     
##  7  1.01e8 2 [2. …    51  1 [1. …  1 [1. …      5    14 3 [No … 0 [No pobreza]  
##  8  1.01e8 1 [1. …    22  8 [8. …  5 [5. …      5    15 3 [No … 0 [No pobreza]  
##  9  1.01e8 1 [1. …    24  8 [8. …  5 [5. …      5    14 3 [No … 0 [No pobreza]  
## 10  1.01e8 1 [1. …    16  8 [8. …  5 [5. …      5    11 3 [No … 0 [No pobreza]  
## # ℹ 8,229 more rows
## # ℹ 35 more variables: activ <dbl+lbl>, ysub <dbl>, ysubh <dbl>, yautcor <dbl>,
## #   yautcorh <dbl>, r3 <dbl+lbl>, r4 <dbl+lbl>, r7b <dbl+lbl>, r7d <dbl+lbl>,
## #   r1b_comuna_esp_cod <dbl+lbl>, r7i <dbl+lbl>, r6 <dbl+lbl>, r7k <dbl+lbl>,
## #   r2_pais_esp <chr>, r2 <dbl+lbl>, r7f <dbl+lbl>, r1a_esp <chr>,
## #   r1b_pais_esp_cod <dbl+lbl>, r7e <dbl+lbl>, r7c <dbl+lbl>,
## #   r2_comuna_esp_cod <dbl+lbl>, r1c <dbl+lbl>, r2_comuna_esp <chr>, …
library(summarytools)

# Variable pobreza (1=extrema, 2=no extrema, 3=no pobreza)
freq(as.character(base_identidades_2$pobreza))
## Frequencies  
## as.character(base_identidades_2$pobreza)  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1    203     2.465          2.465     2.464          2.464
##           2    443     5.380          7.846     5.377          7.841
##           3   7588    92.154        100.000    92.099         99.939
##        <NA>      5                              0.061        100.000
##       Total   8239   100.000        100.000   100.000        100.000
# Variable pobreza_multidimensional (0=no pobre, 1=pobre)
freq(as.character(base_identidades_2$pobreza_multi_5d))
## Frequencies  
## as.character(base_identidades_2$pobreza_multi_5d)  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0   6690     82.75          82.75     81.20          81.20
##           1   1395     17.25         100.00     16.93          98.13
##        <NA>    154                               1.87         100.00
##       Total   8239    100.00         100.00    100.00         100.00
# Variable activ (condición de actividad laboral)
freq(as.character(base_identidades_2$activ))
## Frequencies  
## as.character(base_identidades_2$activ)  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1   3659     53.38          53.38     44.41          44.41
##           2    384      5.60          58.99      4.66          49.07
##           3   2811     41.01         100.00     34.12          83.19
##        <NA>   1385                              16.81         100.00
##       Total   8239    100.00         100.00    100.00         100.00
# Variable r7k (¿tiene red con educación universitaria?)
freq(as.character(base_identidades_2$r7k))
## Frequencies  
## as.character(base_identidades_2$r7k)  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##         -88     71      0.86           0.86      0.86           0.86
##           1   3539     42.95          43.82     42.95          43.82
##           2   1043     12.66          56.48     12.66          56.48
##           3   1235     14.99          71.46     14.99          71.46
##           4   2351     28.54         100.00     28.54         100.00
##        <NA>      0                               0.00         100.00
##       Total   8239    100.00         100.00    100.00         100.00
# Variable r8g (¿sintió hambre por falta de dinero?)
freq(as.character(base_identidades_2$r8g))
## Frequencies  
## as.character(base_identidades_2$r8g)  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1    723     19.91          19.91      8.78           8.78
##           2   2908     80.09         100.00     35.30          44.07
##        <NA>   4608                              55.93         100.00
##       Total   8239    100.00         100.00    100.00         100.00

4. Análisis de Información

library(summarytools)

#Calcular todas las medidas estadísticas; descr()
descr(base_identidades_2[, c("edad", "esc", "yautcorh")])
## Descriptive Statistics  
## base_identidades_2  
## N: 8239  
## 
##                        edad       esc      yautcorh
## ----------------- --------- --------- -------------
##              Mean     39.60     11.23    1538948.52
##           Std.Dev     22.72      4.19    3570223.77
##               Min      0.00      0.00          0.00
##                Q1     21.00      9.00     420000.00
##            Median     38.00     12.00     825000.00
##                Q3     58.00     14.00    1417500.00
##               Max    120.00     29.00   52583334.00
##               MAD     28.17      4.45     644931.00
##               IQR     37.00      5.00     997500.00
##                CV      0.57      0.37          2.32
##          Skewness      0.15     -0.49          7.00
##       SE.Skewness      0.03      0.03          0.03
##          Kurtosis     -0.94      0.22         55.26
##           N.Valid   8239.00   6808.00       8239.00
##                 N   8239.00   8239.00       8239.00
##         Pct.Valid    100.00     82.63        100.00
#Calcular todas las medidas estadísticas específicas (mayores de edad); descr()
base_esc <- base_identidades_2 |>
  filter(!is.na(esc), edad >= 18)
descr(base_esc[, c("edad", "esc", "yautcorh")])
## Descriptive Statistics  
## base_esc  
## N: 6474  
## 
##                        edad       esc      yautcorh
## ----------------- --------- --------- -------------
##              Mean     47.56     11.29    1562556.40
##           Std.Dev     18.38      4.27    3708626.63
##               Min     18.00      0.00          0.00
##                Q1     32.00      8.00     410000.00
##            Median     47.00     12.00     816667.00
##                Q3     62.00     14.00    1420000.00
##               Max    120.00     29.00   52583334.00
##               MAD     22.24      4.45     650120.10
##               IQR     30.00      6.00    1010000.00
##                CV      0.39      0.38          2.37
##          Skewness      0.25     -0.52          6.88
##       SE.Skewness      0.03      0.03          0.03
##          Kurtosis     -0.84      0.13         52.98
##           N.Valid   6474.00   6474.00       6474.00
##                 N   6474.00   6474.00       6474.00
##         Pct.Valid    100.00    100.00        100.00
library(ggplot2)
library(dplyr)

# Construir Histograma de escolaridad; ggplot() y geom_histogram()
ggplot(base_identidades_2, aes(x = esc)) +
  geom_histogram(bins = 15, fill = "#7FFFD4", color = "#76EEC6") +
  labs(
    title = "Distribución de Años de Escolaridad",
    x     = "Años de escolaridad",
    y     = "Frecuencia"
  ) +
  theme_minimal()
## Warning: Removed 1431 rows containing non-finite outside the scale range
## (`stat_bin()`).

#Construir Histograma de escolaridad específico
base_esc <- base_identidades_2 |>
  filter(!is.na(esc), edad >= 18)

# Ahora graficamos con los datos específicos
ggplot(base_esc, aes(x = esc)) +
  geom_histogram(bins = 15, fill = "#66CDAA", color = "#458B74") +
  labs(
    title = "Distribución de Años de Escolaridad Específica (mayores de edad)",
    x     = "Años de escolaridad",
    y     = "Frecuencia"
  ) +
  theme_minimal()

Histograma ‘Distribución de Años de Escolaridad’

Este histograma mide los años de escolaridad de todas las personas encuestadas, esto quiere decir que hay datos que pueden no ser pertinentes para este estudio, ya que esta encuesta pudo haber sido contestada por menores de edad, por otro lado se ve una clara mayoría dentro de la aproximada de 12/13 años de escolaridad, lo cual es común en Chile, ya que desde 2003, posterior a la reforma constitucional (Ley N°19.876) los primeros 8 años de educación básica y 4 de enseñanza media son obligatorios, esta cifra superaría a las 2000 personas. A su vez existe una concentración de datos aproximada entre los 8 y 17 años de escolaridad, lo cual se puede justificar lo primero con la duración de la enseñanza básica y la segunda con la educación superior de pre-grado.

Este gráfico se encuentra con una clara asimetría en el lado derecho, esto quiere decir que hay una cantidad significativa de personas con nivel educativo medio y se ve una brecha en la educación superior, específicamente en los grados académicos de post-grado. Y por el lado izquierdo se pueden sacar dos conclusiones, la primera la inconsecuencia de la base de datos que expresaba a encuestados de 0 años, personas que supuestamente contestaron esta encuesta sin tener niveles educacionales, pero a su vez existe la posibilidad de una brecha escolar y/o deserción temprana educacional por diversas razones, las cuales no son conocidas.

Histograma ‘Distribución de Años de Escolaridad Específica’

Este histograma mide los años de escolaridad de todas las personas encuestadas mayores de 18 años, donde se ve una clara mayoría dentro de la aproximada de 12/13 años de escolaridad, al igual que en el gráfico anterior, lo cual es común en Chile, por lo mencionado en la gráfica anterior, esta cifra superaría a las 2000 personas. A su vez existe una concentración de datos aproximada entre los 8 y 17 años de escolaridad, lo cual se puede justificar lo primero con la duración de la enseñanza básica, pero a diferencia del gráfico anterior se evidencia una baja en los 10/11 años de escolaridad, los años de enseñanza media específicamente, y la segunda con la educación superior de pre-grado.

Este gráfico, al igual que el anterior tiene una clara asimetría en el lado derecho, esto quiere decir que hay una cantidad significativa de personas con nivel educativo medio y se ve una brecha en la educación superior, específicamente en los grados academicos de post-grado. Y por el lado izquierdo se pueden sacar dos conclusiones, la primera la inconsecuencia de la base de datos que expresaba a encuestados de 0 años, personas que por diversas razones ya sean sociales, económicas, familiares, entre otras se vieron perjudicadas por las brechas educacionales, y en consecuencia de esto la generación de deserciones escolares tempranas.

# Histograma del ingreso autónomo corregido
options(scipen = 999)
ggplot(base_identidades_2, aes(x = yautcorh)) +
  geom_histogram(bins = 12, fill = "#FF6EB4", color = "#EE6AA7") +
  labs(
    title = "Distribución del Ingreso Autónomo Corregido del Hogar",
    x     = "Ingreso ($)",
    y     = "Frecuencia"
  ) +
  theme_minimal()

#Construir Histograma de ingreso autónomo específico
base_yautcorh <- base_identidades_2 |>
  filter(!is.na(yautcorh), edad >= 18)

# Ahora graficamos con los datos específicos (mayores de edad)
ggplot(base_yautcorh, aes(x = yautcorh)) +
  geom_histogram(bins = 12, fill = "#CD6090", color = "#8B3A62") +
  labs(
    title = "Distribución del Ingreso Autónomo Corregido del Hogar Específico",
    x     = "Ingreso ($)",
    y     = "Frecuencia"
  ) +
  theme_minimal()

Histograma ‘Distribución del Ingreso Autónomo Corregido del Hogar’

Con respecto a este histograma, se evidencia una clara distribución asimétrica, donde la gran mayoría de los datos se concentran en los valores anuales más bajos, esto quiere decir que más de 7000 personas de la encuesta tiene un ingreso en su hogar muy bajo, todo esto considerando que dentro de nuestra encuesta se encuentran menores de edad que no perciben ingresos.

Este gráfico es una representación de la desigualdad de ingresos existente a nivel nacional. Muestra una base muy alta en la muestra de personas con pocos recursos y una élite económica muy distante del resto.

Histograma ‘Distribución del Ingreso Autónomo Corregido del Hogar Específica’

Con respecto a este histograma, se evidencia una clara distribución asimétrica, donde la gran mayoría de los datos se concentran en los valores anuales más bajos, esto quiere decir que un número cercano a 6000 personas de la encuesta tiene un ingreso en su hogar muy bajo. A su vez se demuestra un parecido al gráfico anterior, la gran diferencia son la cantidad de ingresos bajos/mínimos, los cuales se relacionan a que en esta gráfica solo se encuentran personas mayores de edad.

Este gráfico es una representación de la desigualdad de ingresos existente a nivel nacional. Muestra una base muy alta en la muestra de personas con pocos recursos y una élite económica muy distante del resto.

#Crear un bloxplot; geom_bloxplot()
ggplot(base_identidades_2,
       aes(x = as.factor(pobreza), y = esc, 
           fill = as.factor(pobreza))) +
  geom_boxplot() +
  scale_x_discrete(
    labels = c("1" = "Pobreza extrema",
               "2" = "Pobreza no extrema",
               "3" = "No pobreza")
  ) +
  scale_fill_manual(
    values = c("1" = "red",   # Rojo   = pobreza extrema
               "2" = "orange",   # naranjo = pobreza no extrema
               "3" = "green")   # verde  = no pobreza
  ) +
  labs(
    title = "Años de Escolaridad según Categoría de Pobreza",
    x     = "Categoría de pobreza",
    y     = "Años de escolaridad",
    fill  = "Categoría"
  ) +
  theme_minimal()
## Warning: Removed 1431 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

#Crear un boxplot específico; geom_bloxpot
base_esc <- base_identidades_2 |>
  filter(!is.na(esc), edad >= 18)

# Ahora graficamos con los datos específicos
ggplot(base_esc,
       aes(x = as.factor(pobreza), y = esc, 
           fill = as.factor(pobreza))) +
  geom_boxplot() +
  scale_x_discrete(
    labels = c("1" = "Pobreza extrema",
               "2" = "Pobreza no extrema",
               "3" = "No pobreza")
  ) +
  scale_fill_manual(
    values = c("1" = "#CD0000",   # Rojo   = pobreza extrema
               "2" = "#EE9A00",   # naranjo = pobreza no extrema
               "3" = "#C0FF3E")   # verde  = no pobreza
  ) +
  labs(
    title = "Años de Escolaridad según Categoría de Pobreza Específica (mayores de edad)",
    x     = "Categoría de pobreza",
    y     = "Años de escolaridad",
    fill  = "Categoría"
  ) +
  theme_minimal()

Boxplot ‘Años de Escolaridad según Categoría de Pobreza’

Según este Boxplot, la mediana de la “Pobreza Extrema” corresponde a 10 años, por otro lado la “Pobreza no Extrema” sobre unos 11 años aproximadamente, a su vez ambas tienen un rango parecido y en sí sus cajas son bien parecidas, sugiriendo que el nivel de escolaridad en sectores vulnerables suele estancarse en niveles parecidos, y por último, aquellos que se identifican con la “No Pobreza” se ven con una mediana de 12 años de escolaridad aproximada, a su vez la caja de esta se ve desplazada más arriba del resto de cajas, esto significa una mayor variedad de niveles educativos alcanzados, en este caso existen los datos muy disparejos en sus extremos llegando a un máximo aproximado de 30 años de educación en casos extremos y de una escolaridad de 0 años, esto de igual forma se puede debe a que en este diagrama de caja están considerados toda la muestra, sin especificar edades.

El gráfico confirma una brecha educativa estructural. Mientras que en los hogares en situación de pobreza la escolaridad difícilmente supera los 12-15 años, en los hogares “No pobres” el techo educativo es mucho más alto, llegando incluso a niveles de formación académica avanzada.

Boxplot ‘Años de Escolaridad según Categoría de Pobreza Específica’

Según este Boxplot, la mediana de la “Pobreza Extrema” corresponde a 10 años, por otro lado la mediana de la “Pobreza no Extrema” se encuentra sobre unos 11 años aproximadamente, a su vez ambas tienen un rango parecido y en sí sus cajas son bien parecidas, con la diferencia mayor en sus medianas, es decir su término central, sugiriendo que el nivel de escolaridad en sectores vulnerables suele estancarse en niveles parecidos, y por último, aquellos que se identifican con la “No Pobreza” se ven con una mediana de 12 años de escolaridad aproximada, a su vez la caja de esta se ve desplazada más arriba del resto de cajas, esto significa una mayor variedad de niveles educativos alcanzados, en este caso existen los datos muy disparejos en sus extremos llegando a un máximo aproximado de 30 años de educación en casos extremos y de una escolaridad de 0 años, esto de igual forma se considera fuera de la normalidad, ya que en esta encuesta solo participan mayores de edad.

El gráfico confirma una brecha educativa estructural. Mientras que en los hogares en situación de pobreza la escolaridad difícilmente supera los 12-15 años, en los hogares “No pobres” el techo educativo es mucho más alto, llegando incluso a niveles de formación académica avanzada.

#Calcular los percentiles; quantile()
quantile(base_identidades_2$esc,
         probs = c(0.25, 0.50, 0.75, 0.90),
         na.rm = TRUE)
## 25% 50% 75% 90% 
##   9  12  14  17
#Sacar el Rango Intercuartil; IQR()
iqr_esc <- IQR(base_identidades_2$esc, na.rm = TRUE)
cat("IQR de escolaridad:", iqr_esc, "años\n")
## IQR de escolaridad: 5 años
#Calcular la Varianza y Desviación estándar; var() y sd()
var_esc <- var(base_identidades_2$esc, na.rm = TRUE)
sd_esc  <- sd(base_identidades_2$esc,  na.rm = TRUE)
cat("Varianza de escolaridad:", round(var_esc, 2), "\n")
## Varianza de escolaridad: 17.55
cat("Desviación estándar:",     round(sd_esc, 2), "años\n")
## Desviación estándar: 4.19 años
# Sacar el Coeficiente de variación 
media_esc <- mean(base_identidades_2$esc, na.rm = TRUE)
cv_esc    <- (sd_esc / media_esc) * 100
cat("Media de escolaridad:",          round(media_esc, 2), "años\n")
## Media de escolaridad: 11.23 años
cat("Coeficiente de variación (CV):", round(cv_esc, 2),   "%\n")
## Coeficiente de variación (CV): 37.32 %
#Utilizar ctable() para generar una tabla de contigencia
ctable(
  as.character(base_identidades_2$pobreza),
  as.character(base_identidades_2$r7k)
)
## Cross-Tabulation, Row Proportions  
## as.character(base_identidades_2$pobreza) * as.character(base_identidades_2$r7k)  
## 
## ------------------------------------------ -------------------------------------- ----------- -------------- -------------- -------------- -------------- ---------------
##                                              as.character(base_identidades_2$r7k)         -88              1              2              3              4           Total
##   as.character(base_identidades_2$pobreza)                                                                                                                               
##                                          1                                           6 (3.0%)     68 (33.5%)     11 ( 5.4%)     10 ( 4.9%)    108 (53.2%)    203 (100.0%)
##                                          2                                           9 (2.0%)    166 (37.5%)     44 ( 9.9%)     12 ( 2.7%)    212 (47.9%)    443 (100.0%)
##                                          3                                          56 (0.7%)   3302 (43.5%)    988 (13.0%)   1211 (16.0%)   2031 (26.8%)   7588 (100.0%)
##                                       <NA>                                           0 (0.0%)      3 (60.0%)      0 ( 0.0%)      2 (40.0%)      0 ( 0.0%)      5 (100.0%)
##                                      Total                                          71 (0.9%)   3539 (43.0%)   1043 (12.7%)   1235 (15.0%)   2351 (28.5%)   8239 (100.0%)
## ------------------------------------------ -------------------------------------- ----------- -------------- -------------- -------------- -------------- ---------------

5. Interpretación

Luego de este estudio, según la base de datos entregada, priorizando los datos obtenidos con personas mayores de edad, no existe una relación necesaria entre los niveles de escolaridad y la percepción de pobreza, ya que gran parte de la muestra tiene una escolaridad completa/semicompleta básica y media (12 a 14 años), o hasta educación superior, pero si se visualiza una brecha escolar a la hora de lo laboral, la escolaridad de los hogares en pobreza, ya sea extrema y no extrema, se encuentra estancada aproximadamente entre los 10 y 11 años, existe una mayor dispersión en datos de más años de escolaridad siendo outliers o valores atípicos, que se escapan de la regularidad. Por otro lado se identifica que la no pobreza no solo tiene una mediana superior a 12 años, sino que también una gran dispersión hacia los 17 a 20 años de escolaridad, esto quiere decir que existen estudios superiores, al igual se identifican casos extremos de nulos o bajos estudios de las personas, pero son casos excepcionales.

Chile ha logrado masificar la enseñanza media, pero aun así en el mercado laboral ya no valora como tal el cuarto medio, y es por ello la dispersión y el diferenciador de ingresos. Por esta razón se considera como una “moneda de cambio” para salir de la pobreza un título ya sea técnico y/o profesional

Por el lado de los ingresos, existe una heterogeneidad de datos muy visible, gran parte de la sociedad vive ni con un quinto de una elite económica, y este grupo selecto altera el promedio nacional de ingresos.

6. Referencias:

Corradi, B. Espinoza, Ó. Gozález, L. Larrando, Y. Maldonado, K. & Sandoval, L. (Diciembre 2022). ¿Contribuye la gratuidad a la permanencia en la educación superior? Percepciónes de estudiantes acerca de su experiencia universidad. Calidad en la Educación. Recuperado el 22 de abril de 2026. https://www.scielo.cl/pdf/caledu/n57/0718-4565-caledu-57-67.pdf

Diario UChile. ( Enero 2025). Chile alcanza el segundo puesto en esperanza de vida en América. Diario UChile. Recuperado el 3 de mayo de 2026. https://radio.uchile.cl/2025/01/12/chile-alcanza-el-segundo-puesto-en-esperanza-de-vida-en-america/

Ley N°19.876. (2003). Reforma Constitucional que establece la obligatoriedad y gratuidad de la educación media. Ministerio de Educación. Recuperado el 03 de mayo de 2026. https://www.bcn.cl/leychile/navegar?idNorma=210495https://www.bcn.cl/leychile/navegar?idNorma=210495

Ministerio de Educación. (Octubre 1999). Educación para todos: Evaluación en el año 2000 Informe de Chile. Ministerio de Educación. Recuperado el 22 de abril de 2026. https://www.google.com/url?sa=t&source=web&rct=j&opi=89978449&url=https://bibliotecadigital.mineduc.cl/bitstream/handle/20.500.12365/14791/EPT1999.pdf%3Fsequence%3D1%26isAllowed%3Dy&ved=2ahUKEwj_24D7goSUAxUQppUCHUDHG5MQFnoECBgQAQ&usg=AOvVaw2qi8Sqa4rcjc1rQpotnJxH

Ortega, C. (s.f.). Niveles de Medición: Aprende a Dominarlos. Question Pro. Recuperado el 3 de mayo de 2026. https://www.questionpro.com/blog/es/niveles-de-medicion/

Urzúa, S. (Enero 2024). La elite endogámica de Chile: La desigualdad, pobreza y catástrofe social que impone la clase alta a través del sistema educacional. Centro Latinoamericano de Políticas Económicas y Sociales UC. Recuperado el 22 de abril de 2026. https://clapesuc.cl/en-los-medios/la-elite-endogamica-de-chile-la-desigualdad-pobreza-y-catastrofe-social-que-impone-la-clase-alta-a-traves-del-sistema-educacional

Westreicher, G. (Mayo 2025). Variable Cuantitativa: Qué es, tipos y ejemplos. Economipedia. Recuperado el 3 de mayo de 2026. https://economipedia.com/definiciones/variable-cuantitativa.html