Índice

1. Algunos conceptos sobre el Ingreso.

2. Las variables de ingreso

3. Promedios sobre un conjunto de categorías.

4. Regresión logística sobre la probabilidad de ser pobre según ingreso.




Algunos conceptos sobre el Ingreso.

La distribución del ingreso se analiza considerando dos tipos de ingresos: los autónomos y los monetarios.

Los ingresos autónomos corresponden a aquellos que generan los hogares por sus propios medios (sin incorporar las transferencias del Estado) e incluyen por lo tanto los ingresos del trabajo, los ingresos asociados a la posesión de bienes de capital (arriendos, intereses, rentas), aquellos provenientes de jubilaciones y pensiones contributivas, y otros ingresos de origen privado (transferencias de otros miembros de la familia, donaciones). El ingreso autónomo o ingreso primario, se define como todos los pagos que recibe el hogar como resultado de la posesión de factores productivos. Incluye sueldos y salarios, ganancias del trabajo independiente, la autoprovisión de bienes producidos por el hogar, rentas, intereses, pensiones y jubilaciones.

Los ingresos monetarios suman a los ingresos autónomos los subsidios de carácter monetario que distribuye el Estado a través de sus programas sociales. El ingreso monetario corresponde a la suma de los ingresos autónomos que generan los hogares más el conjunto de subsidios monetarios que el Estado transfiere directamente. Respecto de los subsidios monetarios, la Encuesta CASEN recoge información sobre subsidios focalizados y no focalizados. En los subsidios focalizados se incluyen: Pensiones Asistenciales (PASIS), Subsidio Familiar (SUF), Subsidio de Agua Potable (SAP) y los Bonos Chile Solidario. Por otra parte, dentro de los subsidios no focalizados la encuesta recoge información acerca del Subsidio de Cesantía y la Asignación Familiar. En definitiva, el ingreso monetario se define como la suma del ingreso autónomo del hogar y las transferencias monetarias que recibe el hogar desde el Estado.

Ajuste de ingresos

El ajuste de ingresos es realizado por la División de Estadísticas de CEPAL con el objetivo de evaluar la omisión y la subdeclaración de los ingresos reportados por los encuestados. Para esto, CEPAL utiliza la información de Cuentas Nacionales proporcionada por el Banco Central de Chile. La metodología utilizada es la misma que en las versiones anteriores de la Encuesta, lo que asegura la comparabilidad de las estimaciones.

Las variables que trae la Casen 2006 sobre ingreso. Son todos valores en $.

Módulo de ingresos

Ingresos del trabajo: Corresponden a los ingresos que obtienen las personas en su ocupación por concepto de sueldos y salarios, monetarios y en especies, ganancias provenientes del trabajo independiente y la auto-provisión de bienes producidos por el hogar.

Y0101AJ Asalariados principal - Sueldos y salarios monetarios (ajustados) (pesos por mes)

Y0101HAJ Asalariados principal - Sueldos y salarios monetarios en el hogar (ajustado) (pesos por mes)

Previsión: 15 años y más.

YFAMAJ Ingreso por Asignación familiar en las personas (pesos por mes)

YFAMHAJ Ingreso por Asignación familiar en el hogar (pesos por mes)

YJUBAJ Ingreso por pensión de vejez o jubilación (pesos por mes)

YJUBHAJ Ingreso por pensión de vejez o jubilación, en el hogar (pesos por mes)

YVITAJ Ingreso por renta vitalicia (pesos por mes)

YVITHAJ Ingreso por renta vitalicia, en el hogar (pesos por mes)

YINVAJ Ingreso por pensión de invalidez (pesos por mes)

YINVHAJ Ingreso por pensión de invalidez, en el hogar (pesos por mes)

YMONAJ Ingreso por montepío o pensión de viudez (pesos por mes)

YMONHAJ Ingreso por montepío o pensión de viudez, en el hogar (pesos por mes)

YORFAJ Ingreso por pensión de orfandad (pesos por mes)

YORFHAJ Ingreso por pensión de orfandad, en hogar (pesos por mes)

Variables creadas a partir de la encuesta.

Ingresos del trabajo

YOPRAJ Ingreso Ocupación Principal (ajustado) (pesos por mes) Ingreso que obtienen los ocupados en su ocupación principal, ya sea por concepto de trabajo dependiente en el caso de los asalariados, o por concepto de trabajo independiente en el caso de los patrones o empleadores y trabajadores por cuenta propia.

YOPRHAJ Ingreso Ocupación Principal en el hogar (ajustado) (pesos por mes)

YTRABAJ Ingreso del Trabajo (ajustado) (pesos por mes)

YTRABHAJ Ingreso del Trabajo en el hogar (ajustado) (pesos por mes)

Subsidios monetarios

YPASAJ PASIS, Pensión Asistencial (pesos por mes)

YPASHAJ PASIS, Pensión Asistencial en el hogar (pesos por mes)

YBSPSAJ Bonos del Sistema de Protección Social

YBSPSHAJ Bonos del Sistema de Protección Social en el hogar

YSUFAJ SUF, Subsidio Único Familiar

YSUFHAJ SUF, Subsidio Único Familiar en el hogar (pesos por mes)

YCESAJ Subsidio de Cesantía (pesos por mes)

YCESHAJ Subsidio de Cesantía en el hogar (pesos por mes)

Y1814HAJ Subsidio Agua Potable (pesos por mes)

YOTPAJ Otro Subsidio del Estado (pesos por mes)

YOTPHAJ Otro Subsidio del Estado en el hogar (pesos por mes)

YSUBAJ Subsidios monetarios (pesos por mes)

YSUBHAJ Subsidios monetarios en el hogar (pesos por mes)

Otros ingresos

YAUTAJ Ingreso Autónomo (ajustado) (pesos por mes)

YAUTHAJ Ingreso Autónomo del hogar (ajustado) (pesos por mes) Para cada hogar, es la suma de los ingresos autónomos de todos los miembros del hogar, excluido el servicio doméstico puertas adentro.

YTOTAJ Ingreso total (ajustado) (pesos por mes)

YTOTHAJ Ingreso total en el hogar (ajustado) (pesos por mes)

YMONEHAJ Ingreso Monetario del hogar (ajustado) (pesos por mes)

YAIMHAJ Alquiler imputado (ajustado) (pesos por mes)

Fuentes:

1 Casen 2006 Encuesta de Caracterizacion Socioeconomica Nacional. Manual de usuario. Base de datos.

2 SERIE ANÁLISIS DE RESULTADOS DE LA ENCUESTA DE CARACTERIZACIÓN SOCIOECONÓMICA NACIONAL (CASEN 2006) Nº 2 Distribución del Ingreso e Impacto Distributivo del Gasto Social 2006

http://observatorio.ministeriodesarrollosocial.gob.cl/casen/casen-documentos.php?c=107&m=2&a=2006

3 http://observatorio.ministeriodesarrollosocial.gob.cl/glosario.php


Promedios sobre un conjunto de categorías.

Hemos obtenido las frecuencias con las que aparece cierta combinación de categorías en la población, como por ejemplo, etnia, alfabetismo y sexo por comuna. Por nuestro trabajo, ya sabemos que en la comuna de Aisén, los hombres que vivían en zonas rurales y que tenían 89 años el año 2006 eran 8.

Ahora, en vez de frecuencias necesitamos obtener promedios.

Cobra relevancia conocer el promedio de los Ingresos totales ajustados en pesos por mes YTOTAJ que obtienen ciertas categorías de nuestras búsquedas. Y así deseamos saber el promedio de Ingresos totales ajustados que posee cada una de las categorías definidas por sexo, etnia y alfabetismo en las comunas de Chile para el 2006.

Se deberían generar éstas tablas para todas las definiciones de ingreso.

1 Leemos la data.

dataset2006  <- readRDS("dataset2009.rds")

2 Filtramos según nuestros requerimientos y obtenemos 33 registros.

iquique_2006 <- dataset2006[dataset2006$comuna == "iquique ",]
iquique_2006 <- iquique_2006[iquique_2006$sexo == "hombre",]
iquique_2006 <- iquique_2006[iquique_2006$t5 == "aymara",]
iquique_2006 <- iquique_2006[iquique_2006$e1 == "sí",]
iquique_2006
##    segmento idviv hogar  o folio region provincia comuna zona estrato expr_p
## NA       NA    NA    NA NA  <NA>   <NA>      <NA>   <NA> <NA>      NA     NA
##    expp_p expc_p expr expp expc   r0 pco1 sexo edad ecivil nucleo pco2 numper
## NA     NA     NA   NA   NA   NA <NA> <NA> <NA>   NA   <NA>     NA <NA>     NA
##      r7   r8   r9 r10a r10b r11a r11b r11c r11d r11e r12 r13a r13b  r14  r15
## NA <NA> <NA> <NA>   NA   NA <NA> <NA> <NA> <NA> <NA>  NA <NA> <NA> <NA> <NA>
##    r16a r16b  r17 r18a r18b r18c r18d r18e r18f r18g r18h   e1   e2   e3   e4
## NA <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
##      e5   e6 e7c  e7t depen e8_rbd e8_dv e8_te   e9  e10 e11pbu e11pbt e11pda
## NA <NA> <NA>  NA <NA>  <NA>     NA    NA  <NA> <NA> <NA>   <NA>   <NA>   <NA>
##    e11bu e11bt e11bd e11bm e11bda e11mu e11mt e11mda e12a e12b e13t1 e13mb1
## NA  <NA>  <NA>  <NA>  <NA>   <NA>  <NA>  <NA>   <NA> <NA> <NA>  <NA>     NA
##    e13t2 e13mb2  e14 e15c1 e15c2 e16 e17c1 e17c2   o1   o2   o3   o4   o5   o6
## NA  <NA>     NA <NA>  <NA>  <NA>  NA    NA    NA <NA> <NA> <NA> <NA> <NA> <NA>
##    o7   o8   o9  o10 o11 c_o12 c_o13  o14  o15 o16  o17  o18  o19 o20  o21  o22
## NA NA <NA> <NA> <NA>  NA  <NA>  <NA> <NA> <NA>  NA <NA> <NA> <NA>  NA <NA> <NA>
##     o23  o24  o25  o26  o27  o28  o29  o30  o31  o32  o33 y22ta y22tr1 y22tb
## NA <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>  <NA>   <NA>  <NA>
##    y22tr2 y23t1 y23tr1 y23m1 y23t2 y23tr2 y23m2 y23t3 y23tr3 y23m3 y23t4 y23tr4
## NA   <NA>  <NA>   <NA>    NA  <NA>   <NA>    NA  <NA>   <NA>    NA  <NA>   <NA>
##    y23m4   s1  s2a  s2b s3a1 s3a2 s3a3 s3b1 s3b2   s4   s5   s6   s7   s8   s9
## NA    NA <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
##     s10  s11  s12  s13 s14a s14b s14c s14d s15a s15b s15c s15d s16a s16b s16c
## NA <NA> <NA> <NA> <NA>   NA <NA> <NA> <NA>   NA <NA> <NA> <NA>   NA <NA> <NA>
##    s16d s17a s17b s17c s17d s18a s18b s18c s18d s19a s19b s19c s19d s20a s20b
## NA <NA>   NA <NA> <NA> <NA>   NA <NA> <NA> <NA>   NA <NA> <NA> <NA>   NA <NA>
##    s20c s20d s21 s21a s21b s21c s21d  s22 s22a s22b s22c  s23 s24a s24b s24c
## NA <NA> <NA>  NA <NA> <NA> <NA> <NA> <NA>   NA <NA> <NA> <NA> <NA> <NA> <NA>
##     s25  s26  s27  s28 s29a s29b  t1a  t1b  t1c  t2a  t2b  t2c  t3a  t3b  t3c
## NA <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
##     t3d  t3e   t4   t5   t6   t7   t8 t8cod   t9 t9cod  t10 t10cod  t11  t12
## NA <NA> <NA> <NA> <NA> <NA> <NA> <NA>  <NA> <NA>  <NA> <NA>   <NA> <NA> <NA>
##    t13  t14 t15pe t15pa t15me t15ma t16pc t16pt t16mc t16mt t17p t17m t18a t18b
## NA  NA <NA>    NA    NA    NA    NA  <NA>  <NA>  <NA>  <NA> <NA> <NA> <NA> <NA>
##    t19a t19b t19c t19d t19e t19f t19g   v1   v2 v3   v4   v5   v6 v7a v7b v7c
## NA <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> NA <NA> <NA> <NA>  NA  NA  NA
##    v7d v7e v7f v7g v7h   v8   v9  v10  v11 v12a v12b v13a v13b v14a v14b  v15
## NA  NA  NA  NA  NA  NA <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
##     v16  v17  v18 v19 v20  v21  v22 v23a v23b v23c v23d v23e v23f v23g v23h
## NA <NA> <NA> <NA>  NA  NA <NA> <NA>   NA   NA   NA   NA   NA   NA   NA   NA
##     v24 v25 v26e v26p v26u  v27  v28  v29 v30 v31  v32 esc educ asiste activ
## NA <NA>  NA   NA   NA   NA <NA> <NA> <NA>  NA  NA <NA>  NA <NA>   <NA>  <NA>
##    rama oficio corte  dau daur qaut qautr yopraj yoprhaj ytrabaj ytrabhaj
## NA <NA>   <NA>  <NA> <NA> <NA> <NA>  <NA>     NA      NA      NA       NA
##    ypensaj ypenshaj ypresaj ypreshaj ysfamaj ysfamhaj y1813haj ycesaj yceshaj
## NA      NA       NA      NA       NA      NA       NA       NA     NA      NA
##    ybpfeaj ybpfehaj yfamaj yfamhaj ybpfaj ybpfhaj y2003haj yotpaj yotphaj
## NA      NA       NA     NA      NA     NA      NA       NA     NA      NA
##    yjubaj yjubhaj yvitaj yvithaj yinvaj yinvhaj ymonaj ymonhaj yorfaj yorfhaj
## NA     NA      NA     NA      NA     NA      NA     NA      NA     NA      NA
##    ysubaj ysubhaj yautaj yauthaj ytotaj ytothaj ymonehaj ypchmon yaimhaj
## NA     NA      NA     NA      NA     NA      NA       NA      NA      NA
##    yoautaj yoauthaj indmat indsan cviv  iai  iae hacinami1 gradodis
## NA      NA       NA   <NA>   <NA> <NA> <NA> <NA>      <NA>     <NA>
nrow(iquique_2006)
## [1] 1

3 Existen unos NA que debemos eliminar y grabemos el resultado, que será con el que vamos a probar nuestro código al final.

data6 <- filter(iquique_2006, rowSums(is.na(iquique_2006)) != ncol(iquique_2006))  
nrow(data6)
## [1] 0
write_xlsx(data6,'data6.xlsx')
colnames(iquique_2006)
##   [1] "segmento"  "idviv"     "hogar"     "o"         "folio"     "region"   
##   [7] "provincia" "comuna"    "zona"      "estrato"   "expr_p"    "expp_p"   
##  [13] "expc_p"    "expr"      "expp"      "expc"      "r0"        "pco1"     
##  [19] "sexo"      "edad"      "ecivil"    "nucleo"    "pco2"      "numper"   
##  [25] "r7"        "r8"        "r9"        "r10a"      "r10b"      "r11a"     
##  [31] "r11b"      "r11c"      "r11d"      "r11e"      "r12"       "r13a"     
##  [37] "r13b"      "r14"       "r15"       "r16a"      "r16b"      "r17"      
##  [43] "r18a"      "r18b"      "r18c"      "r18d"      "r18e"      "r18f"     
##  [49] "r18g"      "r18h"      "e1"        "e2"        "e3"        "e4"       
##  [55] "e5"        "e6"        "e7c"       "e7t"       "depen"     "e8_rbd"   
##  [61] "e8_dv"     "e8_te"     "e9"        "e10"       "e11pbu"    "e11pbt"   
##  [67] "e11pda"    "e11bu"     "e11bt"     "e11bd"     "e11bm"     "e11bda"   
##  [73] "e11mu"     "e11mt"     "e11mda"    "e12a"      "e12b"      "e13t1"    
##  [79] "e13mb1"    "e13t2"     "e13mb2"    "e14"       "e15c1"     "e15c2"    
##  [85] "e16"       "e17c1"     "e17c2"     "o1"        "o2"        "o3"       
##  [91] "o4"        "o5"        "o6"        "o7"        "o8"        "o9"       
##  [97] "o10"       "o11"       "c_o12"     "c_o13"     "o14"       "o15"      
## [103] "o16"       "o17"       "o18"       "o19"       "o20"       "o21"      
## [109] "o22"       "o23"       "o24"       "o25"       "o26"       "o27"      
## [115] "o28"       "o29"       "o30"       "o31"       "o32"       "o33"      
## [121] "y22ta"     "y22tr1"    "y22tb"     "y22tr2"    "y23t1"     "y23tr1"   
## [127] "y23m1"     "y23t2"     "y23tr2"    "y23m2"     "y23t3"     "y23tr3"   
## [133] "y23m3"     "y23t4"     "y23tr4"    "y23m4"     "s1"        "s2a"      
## [139] "s2b"       "s3a1"      "s3a2"      "s3a3"      "s3b1"      "s3b2"     
## [145] "s4"        "s5"        "s6"        "s7"        "s8"        "s9"       
## [151] "s10"       "s11"       "s12"       "s13"       "s14a"      "s14b"     
## [157] "s14c"      "s14d"      "s15a"      "s15b"      "s15c"      "s15d"     
## [163] "s16a"      "s16b"      "s16c"      "s16d"      "s17a"      "s17b"     
## [169] "s17c"      "s17d"      "s18a"      "s18b"      "s18c"      "s18d"     
## [175] "s19a"      "s19b"      "s19c"      "s19d"      "s20a"      "s20b"     
## [181] "s20c"      "s20d"      "s21"       "s21a"      "s21b"      "s21c"     
## [187] "s21d"      "s22"       "s22a"      "s22b"      "s22c"      "s23"      
## [193] "s24a"      "s24b"      "s24c"      "s25"       "s26"       "s27"      
## [199] "s28"       "s29a"      "s29b"      "t1a"       "t1b"       "t1c"      
## [205] "t2a"       "t2b"       "t2c"       "t3a"       "t3b"       "t3c"      
## [211] "t3d"       "t3e"       "t4"        "t5"        "t6"        "t7"       
## [217] "t8"        "t8cod"     "t9"        "t9cod"     "t10"       "t10cod"   
## [223] "t11"       "t12"       "t13"       "t14"       "t15pe"     "t15pa"    
## [229] "t15me"     "t15ma"     "t16pc"     "t16pt"     "t16mc"     "t16mt"    
## [235] "t17p"      "t17m"      "t18a"      "t18b"      "t19a"      "t19b"     
## [241] "t19c"      "t19d"      "t19e"      "t19f"      "t19g"      "v1"       
## [247] "v2"        "v3"        "v4"        "v5"        "v6"        "v7a"      
## [253] "v7b"       "v7c"       "v7d"       "v7e"       "v7f"       "v7g"      
## [259] "v7h"       "v8"        "v9"        "v10"       "v11"       "v12a"     
## [265] "v12b"      "v13a"      "v13b"      "v14a"      "v14b"      "v15"      
## [271] "v16"       "v17"       "v18"       "v19"       "v20"       "v21"      
## [277] "v22"       "v23a"      "v23b"      "v23c"      "v23d"      "v23e"     
## [283] "v23f"      "v23g"      "v23h"      "v24"       "v25"       "v26e"     
## [289] "v26p"      "v26u"      "v27"       "v28"       "v29"       "v30"      
## [295] "v31"       "v32"       "esc"       "educ"      "asiste"    "activ"    
## [301] "rama"      "oficio"    "corte"     "dau"       "daur"      "qaut"     
## [307] "qautr"     "yopraj"    "yoprhaj"   "ytrabaj"   "ytrabhaj"  "ypensaj"  
## [313] "ypenshaj"  "ypresaj"   "ypreshaj"  "ysfamaj"   "ysfamhaj"  "y1813haj" 
## [319] "ycesaj"    "yceshaj"   "ybpfeaj"   "ybpfehaj"  "yfamaj"    "yfamhaj"  
## [325] "ybpfaj"    "ybpfhaj"   "y2003haj"  "yotpaj"    "yotphaj"   "yjubaj"   
## [331] "yjubhaj"   "yvitaj"    "yvithaj"   "yinvaj"    "yinvhaj"   "ymonaj"   
## [337] "ymonhaj"   "yorfaj"    "yorfhaj"   "ysubaj"    "ysubhaj"   "yautaj"   
## [343] "yauthaj"   "ytotaj"    "ytothaj"   "ymonehaj"  "ypchmon"   "yaimhaj"  
## [349] "yoautaj"   "yoauthaj"  "indmat"    "indsan"    "cviv"      "iai"      
## [355] "iae"       "hacinami1" "gradodis"

4 Por fin obtengamos nuestra media.

mean(iquique_2006$ytotaj, na.rm=TRUE)
## [1] NaN

5 Verificamos el número 23 de observaciones de nuestro data6 lanzando una tabla de contingencia con nuestras categorías. Despleguemos sólo las primeras 10 filas.

dataset2006  <- readRDS("dataset2009.rds")
m <- table(dataset2006$comuna, dataset2006$e1, dataset2006$sexo,dataset2006$t4)
tabla <- as.data.frame(m)
head(tabla,10)
##             Var1 Var2   Var3 Var4 Freq
## 1        iquique   sí hombre   sí    7
## 2  alto hospicio   sí hombre   sí   10
## 3   pozo almonte   sí hombre   sí    7
## 4         camiña   sí hombre   sí   14
## 5       colchane   sí hombre   sí    9
## 6          huara   sí hombre   sí    7
## 7           pica   sí hombre   sí   10
## 8    antofagasta   sí hombre   sí   10
## 9     mejillones   sí hombre   sí   10
## 10  sierra gorda   sí hombre   sí    3

6 Generalizamos. Desplegamos las 10 primeras filas.

dataset2006  <- readRDS("dataset2017.rds")
promedios_grupales <-aggregate(dataset2006$ymonecorh, by=list(dataset2006$comuna,dataset2006$e1,dataset2006$r3,dataset2006$sexo), FUN = mean , na.rm = TRUE)
head(promedios_grupales,10)
##                 Group.1           Group.2 Group.3 Group.4
## 1               Iquique Sí, lee y escribe  Aimara  Hombre
## 2         Alto Hospicio Sí, lee y escribe  Aimara  Hombre
## 3          Pozo Almonte Sí, lee y escribe  Aimara  Hombre
## 4                Camiña Sí, lee y escribe  Aimara  Hombre
## 5                 Huara Sí, lee y escribe  Aimara  Hombre
## 6                  Pica Sí, lee y escribe  Aimara  Hombre
## 7           Antofagasta Sí, lee y escribe  Aimara  Hombre
## 8            Mejillones Sí, lee y escribe  Aimara  Hombre
## 9                Calama Sí, lee y escribe  Aimara  Hombre
## 10 San Pedro de Atacama Sí, lee y escribe  Aimara  Hombre
##    mean.dataset2006$ymonecorh
## 1                   1286252.0
## 2                    821349.5
## 3                    526931.7
## 4                    689979.0
## 5                    750289.4
## 6                    846285.1
## 7                   1187157.3
## 8                   1504625.0
## 9                   1336521.5
## 10                   400000.0

7 Verifiquemos con el excel que guardamos. La prueba Volver

Regresión logística sobre la probabilidad de ser pobre según ingreso.

https://uc-r.github.io/logistic_regression]

dataset2006  <- readRDS("dataset2006.rds")
model1 <- glm(dataset2006$corte ~dataset2006$ytotaj, family = "binomial", data = dataset2006)
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
summary(model1)
## 
## Call:
## glm(formula = dataset2006$corte ~ dataset2006$ytotaj, family = "binomial", 
##     data = dataset2006)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -4.3964   0.0202   0.0963   0.2919   0.5628  
## 
## Coefficients:
##                     Estimate Std. Error z value Pr(>|z|)    
## (Intercept)        1.762e+00  1.790e-02   98.40   <2e-16 ***
## dataset2006$ytotaj 2.666e-05  4.271e-07   62.43   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 46508  on 161924  degrees of freedom
## Residual deviance: 36195  on 161923  degrees of freedom
##   (106948 observations deleted due to missingness)
## AIC: 36199
## 
## Number of Fisher Scoring iterations: 10

Las estimaciones de los coeficientes de la regresión logística caracterizan la relación entre el predictor y la variable de respuesta en una escala log-odds. Entonces, vemos que β1 = -0.00002666, esto indica que una disminución de 1 peso en ytotaj está asociado con un aumento en la probabilidad de ser pobre. Se asocia con un aumento en las probabilidades de ser pobre logarítmico de 0.00002666 unidades.

Podemos interpretar el coeficiente de ytotaj como: por cada aumento de un peso en ytotaj, las probabilidades de no ser pobre aumentan en un factor de 1,00002666.

Podemos medir los intervalos de confianza y la precisión de las estimaciones de los coeficientes calculando sus errores estándar.

β1 tiene un valor p <2e-16, lo que sugiere una relación estadísticamente significativa entre ytotaj y la probabilidad de ser pobre.

dataset2006 %>%
  mutate(prob = ifelse(dataset2006$corte == "no pobre", 1, 0)) %>%
  ggplot(aes(dataset2006$yauthaj, prob)) +
  geom_point(alpha = .15) +
  geom_smooth(method = "glm", method.args = list(family = "binomial")) +
  ggtitle("Ajuste del modelo de regresión logístico.") +
  xlab("ytotaj") +
  ylab("Probability of ser pobre")
## `geom_smooth()` using formula 'y ~ x'
## Warning: Removed 365 rows containing non-finite values (stat_smooth).
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: Removed 365 rows containing missing values (geom_point).