Ejemplo de Regresión con variable discreta

Se utiliza la base de datos del Índice Marginación por Entidad de 2020 calculado por Consejo Nacional de Población

Indicadores sociodemográficos e índice de marginación por entidad federativa, 2020

Variable Descripción
CVE_ENT Clave de entidad federativa
NOM_ENT Nombre de entidad federativa
POB_TOT Población total
ANALF Porcentaje de población analfabeta de 15 años o más
SBASC Porcentaje de población de 15 años o más sin educación básica
OVSDE Porcentaje de ocupantes en viviendas particulares habitadas sin drenaje ni excusado
OVSEE Porcentaje de ocupantes en viviendas particulares habitadas sin energía eléctrica
OVSAE Porcentaje de ocupantes en viviendas particulares habitadas sin agua entubada
OVPT Porcentaje de ocupantes en viviendas particulares habitadas con piso de tierra
VHAC Porcentaje de viviendas particulares con hacinamiento
PL.5000 Porcentaje de población que vive en localidades menores a 5 000 habitantes
PO2SM Porcentaje de población ocupada con ingresos de hasta 2 salarios mínimos
IM_2020 Índice de marginación, 2020
GM_2020 Grado de marginación, 2020
IMN_2020 Índice de marginación normalizado, 2020
ING_TRI_HOG Ingreso total trimestral por hogar 2022, promedio
Consumo_electrico Consumo eléctrico en abril 2015
A/B, C+, C, D+,D,E Porcentaje de niveles socioeconómicos AMAIA

Modelo lineal

CVE_ENT NOM_ENT POB_TOT ANALF SBASC OVSDE OVSEE OVSAE OVPT VHAC PL.5000 PO2SM IM_2020 GM_2020 IMN_2020 Consumo_electrico A/B C_plus C C_minus D_plus D E ING_TRI_HOG
01 Aguascalientes 1425607 2.11 23.58 0.35 0.23 0.55 0.77 13.13 21.27 58.50 22.21 Muy bajo 0.82 1277.39 11.07 15.48 18.94 17.61 14.71 19.08 3.12 58303.33
02 Baja California 3769020 1.83 24.68 0.20 0.58 2.10 1.91 14.59 8.46 73.55 21.38 Bajo 0.79 3162.04 7.37 16.14 19.42 18.75 15.20 19.09 4.03 67820.56
03 Baja California Sur 798447 2.34 23.98 0.42 0.96 5.39 5.06 18.60 10.28 45.49 21.47 Bajo 0.79 3079.73 9.84 15.12 19.14 18.27 14.46 18.66 4.51 64265.86
04 Campeche 928363 5.86 29.78 2.52 1.05 3.98 2.69 29.97 29.92 70.01 17.81 Alto 0.66 2474.38 7.08 8.90 11.27 13.00 14.62 33.45 11.68 47275.79
05 Coahuila de Zaragoza 3146771 1.67 21.49 0.30 0.17 0.94 0.75 13.48 10.04 60.03 22.55 Muy bajo 0.83 2159.91 9.03 13.06 16.19 17.74 16.02 23.41 4.54 55670.65
06 Colima 731391 3.37 27.82 0.27 0.33 0.66 2.62 15.31 13.50 59.73 21.53 Bajo 0.79 1948.70 8.16 12.46 14.82 16.23 15.82 25.06 7.45 56297.28
07 Chiapas 5543828 13.70 48.12 2.46 1.80 10.68 12.39 36.09 57.64 85.57 12.00 Muy alto 0.44 1260.79 2.76 4.63 6.50 8.01 12.52 43.60 21.98 29167.59
08 Chihuahua 3741869 2.63 27.30 1.42 1.66 1.66 2.18 13.60 14.39 66.70 20.02 Medio 0.74 1793.23 9.31 13.34 17.63 17.55 15.24 22.17 4.74 60263.33
09 Ciudad de México 9209944 1.43 17.64 0.05 0.05 1.24 0.63 14.40 1.01 56.13 23.14 Muy bajo 0.85 1054.90 10.48 15.03 15.98 18.18 14.39 19.94 6.00 67356.70
10 Durango 1832650 2.73 27.49 2.84 2.09 2.31 4.26 16.21 32.50 69.26 18.47 Alto 0.68 1203.03 7.75 10.81 14.83 15.92 16.57 28.67 5.46 50361.29
11 Guanajuato 6166934 5.29 33.53 1.93 0.38 2.91 2.42 16.90 33.26 67.09 19.42 Medio 0.71 1226.86 6.85 10.82 13.94 15.78 16.75 27.18 8.67 48387.71
12 Guerrero 3540685 12.47 42.55 9.38 1.41 11.55 15.27 32.86 48.15 80.28 10.99 Muy alto 0.40 1276.80 2.45 5.70 7.20 10.17 13.13 40.38 20.97 32515.69
13 Hidalgo 3082841 6.62 29.91 1.90 0.64 3.87 2.85 18.52 53.83 73.95 18.05 Alto 0.66 911.26 4.45 8.36 11.29 14.96 16.12 32.12 12.70 40090.31
14 Jalisco 8348151 2.90 29.54 0.57 0.30 0.75 1.66 14.02 16.16 55.86 21.82 Bajo 0.80 1307.48 7.48 12.97 16.78 17.60 15.63 23.59 5.96 55746.31
15 México 16992418 2.90 24.96 1.21 0.26 2.78 2.08 20.70 19.15 66.00 20.80 Bajo 0.77 856.56 5.60 10.50 14.01 17.35 16.80 26.62 9.12 49620.10
16 Michoacán de Ocampo 4748846 7.05 42.41 1.37 0.49 2.82 5.59 18.83 37.53 70.62 18.28 Alto 0.67 1290.07 6.81 8.89 14.18 13.51 14.67 29.93 12.00 46410.41
17 Morelos 1971520 4.45 27.53 0.73 0.30 4.22 4.10 19.28 26.13 73.59 19.81 Medio 0.73 1332.00 5.45 9.51 15.62 15.96 15.79 27.56 10.12 42041.24
18 Nayarit 1235456 4.49 29.05 3.97 2.13 3.02 3.99 18.01 36.47 64.82 17.52 Alto 0.64 1748.58 7.02 10.12 14.44 14.23 15.05 29.33 9.80 51964.79
19 Nuevo León 5784442 1.47 19.07 0.10 0.11 0.70 0.79 13.20 5.14 46.79 23.44 Muy bajo 0.86 2967.42 11.27 14.62 18.42 17.35 15.19 19.36 3.79 72930.71
20 Oaxaca 4132148 11.82 45.28 1.94 1.92 10.00 13.99 29.45 59.40 78.85 13.22 Muy alto 0.49 1107.63 3.52 5.10 7.73 10.68 12.34 38.98 21.64 36263.22
21 Puebla 6583278 6.97 36.87 1.13 0.61 4.66 5.34 25.53 36.08 77.30 17.72 Alto 0.65 1033.68 5.48 8.32 11.06 12.90 15.51 33.67 13.06 39616.45
22 Querétaro de Arteaga 2368467 3.48 23.63 1.66 0.47 2.13 2.02 15.13 28.83 57.08 20.84 Bajo 0.77 1269.59 9.81 15.03 17.87 15.78 15.30 20.00 6.20 60435.02
23 Quintana Roo 1857985 3.07 22.53 1.14 0.82 1.66 2.42 26.13 11.47 57.26 20.63 Medio 0.76 2551.62 5.93 10.70 14.02 15.44 17.57 29.10 7.24 46379.61
24 San Luis Potosí 2822255 5.02 29.32 1.52 1.18 7.64 4.97 16.77 36.03 64.88 18.69 Medio 0.69 1344.77 6.47 11.56 14.46 14.30 14.27 28.65 10.29 47819.39
25 Sinaloa 3026943 3.56 28.86 1.37 0.40 1.40 2.26 18.87 29.26 61.77 20.51 Medio 0.75 4412.92 8.30 13.56 15.08 15.60 15.53 25.46 6.48 55834.40
26 Sonora 2944840 1.99 22.41 0.66 0.66 1.30 2.42 16.62 15.16 63.22 21.41 Bajo 0.79 4488.42 9.81 13.60 17.73 15.62 14.73 22.25 6.26 61358.11
27 Tabasco 2402598 5.09 29.17 1.76 0.49 6.18 3.37 26.09 53.27 71.75 18.33 Alto 0.67 3156.87 4.63 7.39 8.74 11.04 14.63 37.64 15.93 41665.47
28 Tamaulipas 3527735 2.58 25.79 0.25 0.43 1.62 1.42 17.43 11.24 76.27 21.00 Bajo 0.77 2786.17 6.78 12.40 15.83 17.43 15.94 25.58 6.04 49688.16
29 Tlaxcala 1342977 3.35 26.94 0.90 0.41 0.89 1.80 22.24 32.13 78.81 19.87 Medio 0.73 1022.30 3.70 8.79 11.63 15.51 17.85 33.37 9.14 37918.64
30 Veracruz de Ignacio de la Llave 8062579 8.50 39.88 1.26 1.07 8.67 5.98 23.09 45.86 78.12 16.41 Alto 0.60 1552.94 3.11 6.00 9.10 12.81 13.53 34.95 20.50 35126.25
31 Yucatán 2320898 6.00 31.55 5.87 0.69 1.06 1.41 26.17 23.32 69.68 17.51 Alto 0.64 2370.29 6.57 9.58 13.44 16.69 16.31 29.63 7.78 46765.71
32 Zacatecas 1622138 3.76 32.31 2.32 0.46 1.83 1.25 16.25 44.42 71.92 19.50 Medio 0.72 1158.00 7.37 12.12 15.22 13.44 17.74 26.83 7.28 44405.22

## 
## Call:
## lm(formula = ING_TRI_HOG ~ ANALF + PO2SM + VHAC + SBASC + OVSDE + 
##     OVSEE + OVSAE + OVPT + PL.5000 + `A/B` + C_plus + C + C_minus + 
##     D_plus + D + GM_2020, data = ING_HOG)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2743.8  -882.6  -103.0   727.2  4848.4 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)   
## (Intercept)     191219.15   58950.27   3.244  0.00704 **
## ANALF            -1596.77    1211.16  -1.318  0.21199   
## PO2SM             -223.28     120.27  -1.856  0.08810 . 
## VHAC              -502.63     320.84  -1.567  0.14319   
## SBASC              -64.35     291.95  -0.220  0.82925   
## OVSDE             -377.08     487.64  -0.773  0.45432   
## OVSEE            -2198.31    2130.53  -1.032  0.32251   
## OVSAE              437.79     822.80   0.532  0.60439   
## OVPT             -1386.70     876.95  -1.581  0.13980   
## PL.5000           -302.71     120.16  -2.519  0.02695 * 
## `A/B`             -293.23    1154.59  -0.254  0.80382   
## C_plus            1021.01     981.41   1.040  0.31869   
## C                 -853.62     908.71  -0.939  0.36606   
## C_minus          -1266.98     956.53  -1.325  0.20999   
## D_plus           -1573.28    1098.97  -1.432  0.17779   
## D                -1389.24     921.36  -1.508  0.15747   
## GM_2020Bajo     -16062.94    5666.89  -2.835  0.01505 * 
## GM_2020Medio    -11063.98    3772.03  -2.933  0.01253 * 
## GM_2020Muy alto  26728.09   10683.54   2.502  0.02782 * 
## GM_2020Muy bajo -23003.83    7980.10  -2.883  0.01376 * 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2924 on 12 degrees of freedom
## Multiple R-squared:  0.9717, Adjusted R-squared:  0.9268 
## F-statistic: 21.65 on 19 and 12 DF,  p-value: 1.641e-06
term estimate std.error statistic p.value
(Intercept) 191219.15 58950.27 3.24 0.01
ANALF -1596.77 1211.16 -1.32 0.21
PO2SM -223.28 120.27 -1.86 0.09
VHAC -502.63 320.84 -1.57 0.14
SBASC -64.35 291.95 -0.22 0.83
OVSDE -377.08 487.64 -0.77 0.45
OVSEE -2198.31 2130.53 -1.03 0.32
OVSAE 437.79 822.80 0.53 0.60
OVPT -1386.70 876.95 -1.58 0.14
PL.5000 -302.71 120.16 -2.52 0.03
A/B -293.23 1154.59 -0.25 0.80
C_plus 1021.01 981.41 1.04 0.32
C -853.62 908.71 -0.94 0.37
C_minus -1266.98 956.53 -1.32 0.21
D_plus -1573.28 1098.97 -1.43 0.18
D -1389.24 921.36 -1.51 0.16
GM_2020Bajo -16062.94 5666.89 -2.83 0.02
GM_2020Medio -11063.98 3772.03 -2.93 0.01
GM_2020Muy alto 26728.09 10683.54 2.50 0.03
GM_2020Muy bajo -23003.83 7980.10 -2.88 0.01
r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC deviance df.residual nobs
0.97 0.93 2924.35 21.65 0 19 -285.1 612.2 642.98 102621667 12 32

## # A tibble: 5 × 2
##   GM_2020_o `mean(ING_TRI_HOG)`
##   <fct>                   <dbl>
## 1 Muy bajo               63565.
## 2 Bajo                   58154.
## 3 Medio                  47881.
## 4 Alto                   44364.
## 5 Muy alto               32649.
## # A tibble: 1 × 1
##   `mean(ING_TRI_HOG)`
##                 <dbl>
## 1              49993.

Análisis de residuales

term estimate std.error statistic p.value
(Intercept) 178205.05 41411.26 4.30 0.00
ANALF -1408.89 669.36 -2.10 0.05
PO2SM -177.72 93.36 -1.90 0.07
VHAC -317.14 228.42 -1.39 0.18
OVPT -1004.17 535.90 -1.87 0.08
PL.5000 -231.31 88.37 -2.62 0.02
C_plus 890.02 846.69 1.05 0.31
C -1122.94 773.49 -1.45 0.16
C_minus -1021.05 686.18 -1.49 0.16
D_plus -1827.36 717.26 -2.55 0.02
D -1396.99 727.32 -1.92 0.07
GM_2020Bajo -9669.47 2669.24 -3.62 0.00
GM_2020Medio -7041.11 1872.98 -3.76 0.00
GM_2020Muy alto 17524.75 6111.77 2.87 0.01
GM_2020Muy bajo -14463.08 3924.63 -3.69 0.00
r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC deviance df.residual nobs
0.97 0.94 2637.29 35.97 0 14 -287.37 606.73 630.18 118239844 17 32