MUESTRA DATOS

Column {data-width=800}

Gráfico 1

Gráfico 2

Column

Promedio y mediana de porcentaje con el que ganó PC

  Promedio Mediana
1  67.4046  68.025

MUESTRA DE VARIABLE DEPENDIENTE

Column

PORCENTAJE CON EL QUE GANÓ PEDRO CASTILLO

# A tibble: 5 × 3
  MCR                 Promedio Mediana
  <fct>                  <dbl>   <dbl>
1 LIMA Y CALLAO           46.5    45.3
2 MACROREGION CENTRO      73.1    79.9
3 MACROREGION NORTE       58.7    59.0
4 MACROREGION ORIENTE     57.3    59.2
5 MACROREGION SUR         84.0    87.1

Histograma

Column

Gráfico de bigotes

Comparación en macroregiones

ANÁLISIS BIVARIADO

Column {data-width=500}

Prueba de correlación 1


    Pearson's product-moment correlation

data:  data$PORC_GAN and data$EDUC_PBL
t = 4.0329, df = 194, p-value = 7.916e-05
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.1435630 0.4025801
sample estimates:
      cor 
0.2781197

P valor: 7.916e-05 < 0.05, entonces el P valor es menor a 0.05, por lo tanto rechazamos la hipótesis nula y concluimos que: al 95% de nivel de confianza, sí hay correlación entre la tasa de instituciones educativas públicas por 10000 habitantes y el porcentaje de votos a Pedro Castillo en segunda vuelta.

Como se observa, el coeficiente es 0.27, por ello, la dirección es directa por el signo positivo y la fuerza es pequeña (es menor a 0.3).

Entonces, en las provincias donde hay mayor tasa de instituciones educativas públicas por 10000 habitantes, hubo mayor porcentaje de votos al candidato ganador en 2da vuelta: Pedro Castillo. Sin embargo, esto no sucederá en la misma medida para todos los casos, ya que la fuerza de correlación es pequeña

Prueba de correlación 2


    Pearson's product-moment correlation

data:  data$PORC_GAN and data$IND_CORR
t = -4.2807, df = 194, p-value = 2.927e-05
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.4167662 -0.1602170
sample estimates:
       cor 
-0.2937731

P valor: 2.927e-05 < 0.05, entonces el P valor es menor a 0.05, por lo tanto rechazamos la hipótesis nula y concluimos que: al 95% de nivel de confianza, sí existe correlación entre el índice de corrupción y el porcentaje de votos al candidato ganador en 2da vuelta.

Se observa que el valor del coeficiente es aproximadamente -0.294. Esto sugiere que hay una correlación negativa débil, es decir, indirecta (por el signo negativo) y pequeña (su valor es menor a 0.3), entre el índice de corrupción (IND_CORR) y el porcentaje con el que ganó el candidato presidencial (PORC_GAN). En base a estos resultados, se puede interpretar que a medida que aumenta el índice de corrupción, se tiende a disminuir el porcentaje de voto al candidato presidencial ganador (Pedro Castillo). Esto se ve reforzado por el coeficiente que indica que existe una correlación negativa e indirecta entre ambas variables.Sin embargo, esto no sucederá en la misma medida para todos los casos, debido a que la fuerza de correlación es pequeña.

Prueba de correlación 3


    Pearson's product-moment correlation

data:  data$PORC_GAN and data$SERV_GAS
t = -7.2098, df = 194, p-value = 1.22e-11
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.5635434 -0.3415515
sample estimates:
       cor 
-0.4596987

P valor: 1.22e-11<0.05, entonces termina siendo menor a 0.05, por lo que se termina rechazando la hipótesis nula. Siendo así, se saca la conclusión de que si existe una correlación entre el porcentaje de hogares que usan gas y el % de votos por Pedro Castillo en segunda vuelta.

Ahora, observamos que el coeficiente es -0.45, por lo que es concluyente que la dirección es inversa por el signo negativo y la fuerza que contiene es moderada (se encuentra entre -0.3 y -0.5).

Por lo tanto, se puede decir que en las provincias en donde hay un menor % de hogares que usan gas, hubo un mayor % de votos por Pedro Castillo en 2da vuelta. Ahora, al ser la fuerza de correlación moderada, se tiene la conclusión de que los casos pueden ser repetitivos pero podrían variar.

Prueba de correlación 4


    Spearman's rank correlation rho

data:  data$PORC_GAN and data$POBR_MON
S = 1883527, p-value = 7.565e-14
alternative hypothesis: true rho is not equal to 0
sample estimates:
       rho 
-0.5009498

P-valor: 7.565e-14 < 0.05, lo que indica que es menor a 0.05. Por ello, se rechaza la hipótesis nula, concluyendo que sí existe una correlación significativa entre el porcentaje con el que ganó PC y la pobreza monetaria.

El coeficiente de correlación de Spearman es -0.5009, lo que indica que la relación es inversa debido al signo negativo, y que su fuerza es moderada (ya que está entre -0.3 y -0.7).

Por lo tanto, se puede decir que en las provincias donde hay un mayor nivel de pobreza monetaria, el porcentaje de ganancia tiende a ser menor. Sin embargo, debido a que la correlación es moderada, esto sugiere que, aunque esta tendencia es repetitiva, podría variar dependiendo de otros factores externos no considerados en el análisis.

Prueba de correlación 5


    Pearson's product-moment correlation

data:  data$PORC_GAN and data$SERV_AGUA
t = -0.85709, df = 194, p-value = 0.3925
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.19985141  0.07941721
sample estimates:
        cor 
-0.06141908

P-valor: 0.3925 > 0.05, lo que indica que es mayor a 0.05. Por ello, no se puede rechazar la hipótesis nula, concluyendo que no existe una correlación significativa entre la VD y el acceso a servicios de agua.

El coeficiente de correlación de Pearson es -0.0614, lo que indica que la relación es inversa debido al signo negativo, pero extremadamente débil (cercano a 0). Esto significa que no hay una relación clara entre estas dos variables.

Por lo tanto, se puede decir que el porcentaje de ganancia y el acceso a servicios de agua no están correlacionados de manera significativa. La fuerza de la correlación es tan baja que los casos no presentan una tendencia consistente ni repetitiva, lo que sugiere que estas variables no tienen una relación directa en este análisis.

Prueba de correlación 6


    Pearson's product-moment correlation

data:  data$PORC_GAN and data$CP_MED
t = 1.8492, df = 194, p-value = 0.06595
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.008703122  0.266840726
sample estimates:
      cor 
0.1316101

P-valor: 0.06595 > 0.05, lo que indica que es mayor a 0.05. Por ello, no se puede rechazar la hipótesis nula, concluyendo que no existe una correlación significativa entre el porcentaje de con el que ganó PC y la tasa de centros médicos.

El coeficiente de correlación de Pearson es 0.1316, lo que sugiere una relación positiva débil entre ambas variables. Sin embargo, dado que el p-valor no es menor a 0.05, esta relación no puede considerarse estadísticamente significativa. Es decir, aunque hay una ligera tendencia positiva, esta no es lo suficientemente fuerte o consistente para considerarse relevante.

Por lo tanto, se puede decir que las variaciones en la tasa de centros médicos no están relacionadas significativamente con la VD. Al ser la fuerza de correlación débil y no significativa, los casos no muestran una tendencia clara ni consistente, lo que implica que no hay una relación directa entre estas dos variables en este análisis.

Column {data-width=500}

Gráfico 1

Gráfico 2

Gráfico 3

Gráfico 4

Gráfico 5

Gráfico 6

REGRESION GAUSSIANA

Column {data-width=500}

MODELO 1


Call:
lm(formula = PORC_GAN ~ SERV_GAS + SERV_AGUA, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-45.763 -11.725  -1.039  13.352  34.037 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 78.19608    4.60506  16.980  < 2e-16 ***
SERV_GAS    -0.42323    0.05674  -7.459 2.89e-12 ***
SERV_AGUA    0.13388    0.06837   1.958   0.0516 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.32 on 193 degrees of freedom
Multiple R-squared:  0.2267,    Adjusted R-squared:  0.2187 
F-statistic: 28.29 on 2 and 193 DF,  p-value: 1.684e-11


Call:
lm(formula = modelo1, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-45.763 -11.725  -1.039  13.352  34.037 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 78.19608    4.60506  16.980  < 2e-16 ***
SERV_GAS    -0.42323    0.05674  -7.459 2.89e-12 ***
SERV_AGUA    0.13388    0.06837   1.958   0.0516 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.32 on 193 degrees of freedom
Multiple R-squared:  0.2267,    Adjusted R-squared:  0.2187 
F-statistic: 28.29 on 2 and 193 DF,  p-value: 1.684e-11

Regresion: modelo 1
	modelo (I)
(Intercept)	78.196***
	(4.605)
SERV_GAS	−0.423***
	(0.057)
SERV_AGUA	0.134+
	(0.068)
Num.Obs.	196
R2	0.227
R2 Adj.	0.219
AIC	1655.9
BIC	1669.0
Log.Lik.	−823.943
F	28.288
RMSE	16.20
+ p

MODELO 2


Call:
lm(formula = PORC_GAN ~ SERV_GAS + SERV_AGUA + EDUC_PBL, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-43.126 -12.240  -1.196  13.276  33.331 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 85.96018    8.56227  10.039  < 2e-16 ***
SERV_GAS    -0.48314    0.07950  -6.077 6.46e-09 ***
SERV_AGUA    0.11094    0.07159   1.550    0.123    
EDUC_PBL    -0.04844    0.04504  -1.075    0.284    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.32 on 192 degrees of freedom
Multiple R-squared:  0.2313,    Adjusted R-squared:  0.2193 
F-statistic: 19.26 on 3 and 192 DF,  p-value: 5.839e-11


Call:
lm(formula = modelo2, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-43.126 -12.240  -1.196  13.276  33.331 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 85.96018    8.56227  10.039  < 2e-16 ***
SERV_GAS    -0.48314    0.07950  -6.077 6.46e-09 ***
SERV_AGUA    0.11094    0.07159   1.550    0.123    
EDUC_PBL    -0.04844    0.04504  -1.075    0.284    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.32 on 192 degrees of freedom
Multiple R-squared:  0.2313,    Adjusted R-squared:  0.2193 
F-statistic: 19.26 on 3 and 192 DF,  p-value: 5.839e-11

Regresion: modelo 2
	modelo (II)
(Intercept)	85.960***
	(8.562)
SERV_GAS	−0.483***
	(0.080)
SERV_AGUA	0.111
	(0.072)
EDUC_PBL	−0.048
	(0.045)
Num.Obs.	196
R2	0.231
R2 Adj.	0.219
AIC	1656.7
BIC	1673.1
Log.Lik.	−823.354
F	19.259
RMSE	16.15
+ p

MODELO 3


Call:
lm(formula = PORC_GAN ~ SERV_GAS + SERV_AGUA + EDUC_PBL + CP_MED, 
    data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-42.914 -11.981  -0.503  13.350  33.144 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 87.58302    9.05060   9.677  < 2e-16 ***
SERV_GAS    -0.50122    0.08590  -5.835 2.27e-08 ***
SERV_AGUA    0.10209    0.07343   1.390    0.166    
EDUC_PBL    -0.07525    0.06566  -1.146    0.253    
CP_MED       0.19592    0.34863   0.562    0.575    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.35 on 191 degrees of freedom
Multiple R-squared:  0.2326,    Adjusted R-squared:  0.2165 
F-statistic: 14.47 on 4 and 191 DF,  p-value: 2.432e-10


Call:
lm(formula = modelo3, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-42.914 -11.981  -0.503  13.350  33.144 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 87.58302    9.05060   9.677  < 2e-16 ***
SERV_GAS    -0.50122    0.08590  -5.835 2.27e-08 ***
SERV_AGUA    0.10209    0.07343   1.390    0.166    
EDUC_PBL    -0.07525    0.06566  -1.146    0.253    
CP_MED       0.19592    0.34863   0.562    0.575    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.35 on 191 degrees of freedom
Multiple R-squared:  0.2326,    Adjusted R-squared:  0.2165 
F-statistic: 14.47 on 4 and 191 DF,  p-value: 2.432e-10

Regresion: modelo 3
	modelo (III)
(Intercept)	87.583***
	(9.051)
SERV_GAS	−0.501***
	(0.086)
SERV_AGUA	0.102
	(0.073)
EDUC_PBL	−0.075
	(0.066)
CP_MED	0.196
	(0.349)
Num.Obs.	196
R2	0.233
R2 Adj.	0.217
AIC	1658.4
BIC	1678.1
Log.Lik.	−823.192
F	14.472
RMSE	16.14
+ p

MODELO 4


Call:
lm(formula = PORC_GAN ~ SERV_GAS + SERV_AGUA + EDUC_PBL + CP_MED + 
    IND_CORR, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-44.899 -11.821  -0.009  13.439  33.966 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 98.43629   11.23794   8.759 1.08e-15 ***
SERV_GAS    -0.47972    0.08656  -5.542 9.89e-08 ***
SERV_AGUA    0.08975    0.07351   1.221    0.224    
EDUC_PBL    -0.09846    0.06694  -1.471    0.143    
CP_MED       0.17941    0.34731   0.517    0.606    
IND_CORR    -0.21956    0.13581  -1.617    0.108    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.28 on 190 degrees of freedom
Multiple R-squared:  0.243, Adjusted R-squared:  0.2231 
F-statistic:  12.2 on 5 and 190 DF,  p-value: 2.917e-10


Call:
lm(formula = modelo4, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-44.899 -11.821  -0.009  13.439  33.966 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 98.43629   11.23794   8.759 1.08e-15 ***
SERV_GAS    -0.47972    0.08656  -5.542 9.89e-08 ***
SERV_AGUA    0.08975    0.07351   1.221    0.224    
EDUC_PBL    -0.09846    0.06694  -1.471    0.143    
CP_MED       0.17941    0.34731   0.517    0.606    
IND_CORR    -0.21956    0.13581  -1.617    0.108    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.28 on 190 degrees of freedom
Multiple R-squared:  0.243, Adjusted R-squared:  0.2231 
F-statistic:  12.2 on 5 and 190 DF,  p-value: 2.917e-10

Regresion: modelo 4
	modelo (IV)
(Intercept)	98.436***
	(11.238)
SERV_GAS	−0.480***
	(0.087)
SERV_AGUA	0.090
	(0.074)
EDUC_PBL	−0.098
	(0.067)
CP_MED	0.179
	(0.347)
IND_CORR	−0.220
	(0.136)
Num.Obs.	196
R2	0.243
R2 Adj.	0.223
AIC	1657.7
BIC	1680.7
Log.Lik.	−821.853
F	12.198
RMSE	16.03
+ p

Resultados de todos los modelos
	modelo (I)	modelo (II)	modelo (III)	modelo (IV)
(Intercept)	78.196***	85.960***	87.583***	98.436***
	(4.605)	(8.562)	(9.051)	(11.238)
SERV_GAS	−0.423***	−0.483***	−0.501***	−0.480***
	(0.057)	(0.080)	(0.086)	(0.087)
SERV_AGUA	0.134+	0.111	0.102	0.090
	(0.068)	(0.072)	(0.073)	(0.074)
EDUC_PBL		−0.048	−0.075	−0.098
		(0.045)	(0.066)	(0.067)
CP_MED			0.196	0.179
			(0.349)	(0.347)
IND_CORR				−0.220
				(0.136)
Num.Obs.	196	196	196	196
R2	0.227	0.231	0.233	0.243
R2 Adj.	0.219	0.219	0.217	0.223
AIC	1655.9	1656.7	1658.4	1657.7
BIC	1669.0	1673.1	1678.1	1680.7
Log.Lik.	−823.943	−823.354	−823.192	−821.853
F	28.288	19.259	14.472	12.198
RMSE	16.20	16.15	16.14	16.03
+ p

4 MODELOS

Resultados de todos los modelos
	modelo (I)	modelo (II)	modelo (III)	modelo (IV)
(Intercept)	78.196***	85.960***	87.583***	98.436***
	[69.113, 87.279]	[69.072, 102.848]	[69.731, 105.435]	[76.269, 120.603]
SERV_GAS	−0.423***	−0.483***	−0.501***	−0.480***
	[−0.535, −0.311]	[−0.640, −0.326]	[−0.671, −0.332]	[−0.650, −0.309]
SERV_AGUA	0.134+	0.111	0.102	0.090
	[−0.001, 0.269]	[−0.030, 0.252]	[−0.043, 0.247]	[−0.055, 0.235]
EDUC_PBL		−0.048	−0.075	−0.098
		[−0.137, 0.040]	[−0.205, 0.054]	[−0.231, 0.034]
CP_MED			0.196	0.179
			[−0.492, 0.884]	[−0.506, 0.864]
IND_CORR				−0.220
				[−0.487, 0.048]
Num.Obs.	196	196	196	196
R2	0.227	0.231	0.233	0.243
R2 Adj.	0.219	0.219	0.217	0.223
AIC	1655.9	1656.7	1658.4	1657.7
BIC	1669.0	1673.1	1678.1	1680.7
Log.Lik.	−823.943	−823.354	−823.192	−821.853
F	28.288	19.259	14.472	12.198
RMSE	16.20	16.15	16.14	16.03
+ p

AGREGO VARIABLE DE CONTROL


Call:
lm(formula = PORC_GAN ~ SERV_GAS + SERV_AGUA + EDUC_PBL + CP_MED + 
    IND_CORR + POR_POB_ELEC, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-47.180 -11.822  -0.121  13.545  33.097 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  88.94633   14.10562   6.306 1.98e-09 ***
SERV_GAS     -0.48303    0.08656  -5.580 8.23e-08 ***
SERV_AGUA     0.08246    0.07376   1.118   0.2650    
EDUC_PBL     -0.11562    0.06866  -1.684   0.0938 .  
CP_MED        0.21518    0.34858   0.617   0.5378    
IND_CORR     -0.21185    0.13590  -1.559   0.1207    
POR_POB_ELEC  0.13499    0.12140   1.112   0.2676    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.27 on 189 degrees of freedom
Multiple R-squared:  0.2479,    Adjusted R-squared:  0.224 
F-statistic: 10.38 on 6 and 189 DF,  p-value: 6.117e-10


Call:
lm(formula = modelo5_c, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-47.180 -11.822  -0.121  13.545  33.097 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  88.94633   14.10562   6.306 1.98e-09 ***
SERV_GAS     -0.48303    0.08656  -5.580 8.23e-08 ***
SERV_AGUA     0.08246    0.07376   1.118   0.2650    
EDUC_PBL     -0.11562    0.06866  -1.684   0.0938 .  
CP_MED        0.21518    0.34858   0.617   0.5378    
IND_CORR     -0.21185    0.13590  -1.559   0.1207    
POR_POB_ELEC  0.13499    0.12140   1.112   0.2676    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.27 on 189 degrees of freedom
Multiple R-squared:  0.2479,    Adjusted R-squared:  0.224 
F-statistic: 10.38 on 6 and 189 DF,  p-value: 6.117e-10

Regresion: modelo 5 Control
	modelo (V)
(Intercept)	88.946***
	(14.106)
SERV_GAS	−0.483***
	(0.087)
SERV_AGUA	0.082
	(0.074)
EDUC_PBL	−0.116+
	(0.069)
CP_MED	0.215
	(0.349)
IND_CORR	−0.212
	(0.136)
POR_POB_ELEC	0.135
	(0.121)
Num.Obs.	196
R2	0.248
R2 Adj.	0.224
AIC	1658.4
BIC	1684.7
Log.Lik.	−821.214
F	10.384
RMSE	15.97
+ p

CON VARIABLE DE CONTROL

Resultados de todos los modelos
	modelo (I)	modelo (II)	modelo (III)	modelo (IV)	modelo (V)
(Intercept)	78.196***	85.960***	87.583***	98.436***	88.946***
	(4.605)	(8.562)	(9.051)	(11.238)	(14.106)
SERV_GAS	−0.423***	−0.483***	−0.501***	−0.480***	−0.483***
	(0.057)	(0.080)	(0.086)	(0.087)	(0.087)
SERV_AGUA	0.134+	0.111	0.102	0.090	0.082
	(0.068)	(0.072)	(0.073)	(0.074)	(0.074)
EDUC_PBL		−0.048	−0.075	−0.098	−0.116+
		(0.045)	(0.066)	(0.067)	(0.069)
CP_MED			0.196	0.179	0.215
			(0.349)	(0.347)	(0.349)
IND_CORR				−0.220	−0.212
				(0.136)	(0.136)
POR_POB_ELEC					0.135
					(0.121)
Num.Obs.	196	196	196	196	196
R2	0.227	0.231	0.233	0.243	0.248
R2 Adj.	0.219	0.219	0.217	0.223	0.224
AIC	1655.9	1656.7	1658.4	1657.7	1658.4
BIC	1669.0	1673.1	1678.1	1680.7	1684.7
Log.Lik.	−823.943	−823.354	−823.192	−821.853	−821.214
F	28.288	19.259	14.472	12.198	10.384
RMSE	16.20	16.15	16.14	16.03	15.97
+ p

Column {data-width=500}

GRÁFICA 4 MODELOS

Gráfico de los 5 modelos

TABLA ANOVA

Comparación de modelos
Res.Df	RSS	Df	Sum of Sq	F	Pr(>F)
193	51421.63	NA	NA	NA	NA
192	51113.74	1	307.88484	1.1635794	0.2820992
191	51029.36	1	84.38012	0.3188951	0.5729420
190	50336.86	1	692.50283	2.6171539	0.1073816
189	50009.68	1	327.17910	1.2364976	0.2675596

DIAGNÓSTICO DE LA REGRESIÓN

Column {data-width=500}

LINEALIDAD

HOMOCEDASTICIDAD

NORMALIDAD

VALORES INFLUYENTES

Column {data-width=500} {.tabset} ———————————————————————–

LINEALIDAD


    RESET test

data:  reg1
RESET = 1.6332, df1 = 2, df2 = 191, p-value = 0.198

Dado que el p-valor es 0.198, mayor al nivel de significancia típico (0.05), no se rechaza la hipótesis nula. Esto sugiere que no hay evidencia suficiente para afirmar que el modelo reg1 esté mal especificado. En otras palabras, no se identificaron problemas significativos de especificación en el modelo.

NORMALIDAD SHAPIRO

Shapiro-Wilk normality test
	SW	p.value
W	0.9875723	0.0840092

Dado que el p-valor = 0.084 es mayor a 0.05, no se rechaza la hipótesis nula. Esto sugiere que no hay evidencia suficiente para concluir que los datos no sean normales. En otras palabras, los datos pueden considerarse como provenientes de una distribución normal.

HOMOCEDASTICIDAD Breusch-Pagan

studentized Breusch-Pagan test
	BP	df	p.value
BP	39.99844	2	0

Dado que el p-valor = 0 (mucho menor que 0.05), se rechaza la hipótesis nula. Esto indica que hay evidencia significativa de heterocedasticidad en el modelo.

ANÁLISIS FACTORIAL

Column {data-width=500}

TABLAS Y CORRELACIONES

          SERV_GAS SERV_AGUA EDUC_PBL CP_MED POBR_MON IND_CORR
SERV_GAS      1.00      0.38    -0.75  -0.35     0.81     0.50
SERV_AGUA     0.38      1.00    -0.47  -0.19     0.32     0.18
EDUC_PBL     -0.75     -0.47     1.00   0.71    -0.51    -0.55
CP_MED       -0.35     -0.19     0.71   1.00    -0.11    -0.39
POBR_MON      0.81      0.32    -0.51  -0.11     1.00     0.37
IND_CORR      0.50      0.18    -0.55  -0.39     0.37     1.00

Kaiser-Meyer-Olkin factor adequacy
Call: psych::KMO(r = corMatrix)
Overall MSA =  0.69
MSA for each item = 
 SERV_GAS SERV_AGUA  EDUC_PBL    CP_MED  POBR_MON  IND_CORR 
     0.69      0.73      0.67      0.60      0.68      0.93

[1] FALSE

[1] FALSE

Parallel analysis suggests that the number of factors =  2  and the number of components =  NA

CORRELACIÓN

Column {data-width=500}

FACTORES


Loadings:
          MR1    MR2   
SERV_GAS   0.852 -0.394
SERV_AGUA  0.328 -0.278
EDUC_PBL  -0.485  0.878
CP_MED            0.776
POBR_MON   0.958       
IND_CORR   0.361 -0.441

                 MR1   MR2
SS loadings    2.121 1.806
Proportion Var 0.354 0.301
Cumulative Var 0.354 0.654


Loadings:
          MR1    MR2   
SERV_GAS   0.852       
SERV_AGUA              
EDUC_PBL          0.878
CP_MED            0.776
POBR_MON   0.958       
IND_CORR               

                 MR1   MR2
SS loadings    2.121 1.806
Proportion Var 0.354 0.301
Cumulative Var 0.354 0.654

SERV_AGUA  IND_CORR    CP_MED  SERV_GAS  POBR_MON  EDUC_PBL 
0.1847342 0.3246819 0.6048139 0.8814600 0.9255702 1.0055885

   CP_MED  POBR_MON  SERV_GAS  EDUC_PBL  IND_CORR SERV_AGUA 
 1.009634  1.015764  1.408214  1.559488  1.924918  1.946792

[1] 0.946387

[1] 0.02634886

     RMSEA      lower      upper confidence 
0.11393638 0.05385432 0.18144701 0.90000000

[1] -6.914451

RESULTADOS

          MR1         MR2
1  0.83596055 -0.09140906
2 -0.01227989  0.26814213
3  0.19495806 -0.00730113
4 -1.51572452  0.21716355
5 -0.42921092  0.38086647
6 -0.12254682 -0.07281576

ANÁLISIS DE CONGLOMERADOS

Column {data-width=500}

CORRELACIÓN

           SERV_GAS SERV_AGUA  POBR_MON  IND_CORR
SERV_GAS  1.0000000 0.3827218 0.8070535 0.4957952
SERV_AGUA 0.3827218 1.0000000 0.3168633 0.1827262
POBR_MON  0.8070535 0.3168633 1.0000000 0.3739093
IND_CORR  0.4957952 0.1827262 0.3739093 1.0000000

PARTICIÓN

	SERV_GAS	SERV_AGUA	POBR_MON	IND_CORR	pam
Chachapoyas	65.28	87.62	4	62.7	1
Bagua	45.91	70.80	3	36.3	2
Bongará	56.13	83.00	3	27.7	2
Condorcanqui	15.36	22.38	1	30.2	2
Luya	45.28	80.50	2	33.3	2
Rodríguez de Mendoza	38.98	73.38	3	21.8	2
Utcubamba	48.57	77.71	3	57.6	1
Aija	22.76	76.92	3	33.5	2
Antonio Raymondi	18.93	91.15	2	41.2	2
Asunción	31.48	90.62	3	21.4	2
Bolognesi	31.27	79.33	4	40.3	2
Carhuaz	25.27	86.42	3	41.0	2
Carlos F. Fitzcarrald	15.34	85.79	2	41.6	2
Casma	61.48	64.82	4	52.5	1
Corongo	23.18	79.60	2	30.0	2

[1] "Alto Amazonas" "Bolognesi "    "Puerto Inca"

  pam SERV_GAS SERV_AGUA POBR_MON IND_CORR
1   1 67.75761  76.35693 4.306818 47.87273
2   2 30.76046  63.27657 2.129630 37.65833

Column {data-width=500}

JERÁRQUICA AGLOMERATIVA

	SERV_GAS	SERV_AGUA	POBR_MON	IND_CORR	agnes
Chachapoyas	65.28	87.62	4	62.7	1
Bagua	45.91	70.80	3	36.3	1
Bongará	56.13	83.00	3	27.7	1
Condorcanqui	15.36	22.38	1	30.2	2
Luya	45.28	80.50	2	33.3	2
Rodríguez de Mendoza	38.98	73.38	3	21.8	1
Utcubamba	48.57	77.71	3	57.6	1
Aija	22.76	76.92	3	33.5	1
Antonio Raymondi	18.93	91.15	2	41.2	2
Asunción	31.48	90.62	3	21.4	1
Bolognesi	31.27	79.33	4	40.3	1
Carhuaz	25.27	86.42	3	41.0	1
Carlos F. Fitzcarrald	15.34	85.79	2	41.6	2
Casma	61.48	64.82	4	52.5	1
Corongo	23.18	79.60	2	30.0	2

 [1] "Abancay "       "Aija "          "Ascope"         "Atalaya"       
 [5] "Cajamarca"      "Cajatambo"      "Castrovirreyna" "Caylloma  "    
 [9] "Chachapoyas "   "Huamanga"       "Huaytará"       "Ilo"           
[13] "Lauricocha"     "Marañón"        "Moyobamba"      "Pacasmayo"     
[17] "Paita"          "Piura"          "San Román"      "Sullana"       
[21] "Tarata"

  agnes SERV_GAS SERV_AGUA POBR_MON IND_CORR
1     1 51.18444  72.09000 3.530864 42.14321
2     2 28.92883  61.19662 1.727273 38.73377
3     3 76.61421  78.99605 5.000000 49.57368

         Aglomeracion
Particion  1  2  3
        1 50  0 38
        2 31 77  0

JERÁRQUICA DIVISIVA

	SERV_GAS	SERV_AGUA	POBR_MON	IND_CORR	diana
Chachapoyas	65.28	87.62	4	62.7	1
Bagua	45.91	70.80	3	36.3	2
Bongará	56.13	83.00	3	27.7	2
Condorcanqui	15.36	22.38	1	30.2	3
Luya	45.28	80.50	2	33.3	3
Rodríguez de Mendoza	38.98	73.38	3	21.8	2
Utcubamba	48.57	77.71	3	57.6	1
Aija	22.76	76.92	3	33.5	2
Antonio Raymondi	18.93	91.15	2	41.2	3
Asunción	31.48	90.62	3	21.4	2
Bolognesi	31.27	79.33	4	40.3	1
Carhuaz	25.27	86.42	3	41.0	2
Carlos F. Fitzcarrald	15.34	85.79	2	41.6	3
Casma	61.48	64.82	4	52.5	1
Corongo	23.18	79.60	2	30.0	3

 [1] "Bolognesi "              "Canchis"                
 [3] "Concepción"              "Espinar"                
 [5] "Ferreñafe"               "Huancavelica"           
 [7] "Huaylas "                "Mariscal Ramón Castilla"
 [9] "Páucar del Sara Sara"    "Recuay  "               
[11] "Rioja"                   "Sechura"                
[13] "Utcubamba"               "Yauyos"

  diana SERV_GAS SERV_AGUA POBR_MON IND_CORR
1     1 67.87161  77.29989 4.321839 48.02299
2     2 36.91571  68.96071 3.000000 36.99643
3     3 28.99365  62.69770 1.675676 38.66486
4     4 28.68571  36.80857 3.571429 29.25714

  diana SERV_GAS SERV_AGUA POBR_MON IND_CORR
4     4 28.68571  36.80857 3.571429 29.25714
3     3 28.99365  62.69770 1.675676 38.66486
2     2 36.91571  68.96071 3.000000 36.99643
1     1 67.87161  77.29989 4.321839 48.02299

                              [,1]         [,2]
Chachapoyas            0.425055624  0.128446444
Bagua                 -0.074549957 -0.145049529
Bongará                0.008359531 -0.154069184
Condorcanqui          -0.630905383 -0.122055120
Luya                  -0.206145350  0.032956819
Rodríguez de Mendoza  -0.149919523 -0.206868042
Utcubamba              0.100188561  0.155211972
Aija                  -0.195896983 -0.081248317
Antonio Raymondi      -0.285069403  0.245646960
Asunción              -0.156691091 -0.110496789
Bolognesi              0.042381279 -0.054975633
Carhuaz               -0.123984055  0.069198588
Carlos F. Fitzcarrald -0.292367496  0.244422656
Casma                  0.281881129 -0.051634997
Corongo               -0.348919647  0.052235075
Huaraz                 0.529695230  0.143265716
Huari                 -0.045232421  0.247954918
Huarmey                0.444432388 -0.007472750
Huaylas                0.096669430  0.004699584
Mariscal Luzuriaga    -0.479176094  0.117462154

CONCLUSIONES

Análisis univariado

El análisis univariado permite identificar aquello necesario para llevar acabo las demás regresiones. Podemos ver que el servicio a gas muestra una alta dispersión, con valores atípicos y significativos, algo que veremos que tiene relación después, ya que el acceso a servicio a gas es una de las variables más significativas dentro del estudio. Por su parte, el acceso a servicios de agua, presenta una distribución que se dirige hacia la derecha, lo que nos indica una desigualdad dentro del acceso de la misma. En adición, podemos observar valores atípicos dentro de la percepción del índice de corrupción, que podrían o no afectar otros análisis y constataremos después.

Gauss

En la regresión gaussiana podemos identificar que el acceso a servicio a gas tiene un efecto significativo dentro de la variable dependiente, teniendo un nivel de significancia alto. Por su lado, el acceso a servicio de agua no presenta une efecto significativo, siendo poco relevante en el modelo.

Del mismo modo, podemos notar que la relación entre el acceso a servicio a gas y el percentaje con el que ganó Pedro Castillo es negativa, lo que sugiere que mientras existe un aumento en el acceso a servicio a gas, hay una disminución en el porcentaje con el que ganó PC. Mientras que la relación que hay con el índice de corrupción es positiva, por lo que a mayor percepción de índice de corrupción existe un mayor porcentaje de votos por PC.

Podemos decir que el modelo resulta medianamente útil para entender porque se da el porcentaje de votos hacia Pedro Castillo.

Análisis factorial

Debido a que el índice de la prueba KMO es de 0,67 podemos decir que no existe una muy buena adecuación de las variables para el análisis, ya que existieron variables como el índice de corrupción que pueden ser perfectamente utilizadas, mientras que los centros médicos, al tener valores bajos, afectaron el análisis.

Seguido a esto, el número de factores óptimo, termina siendo 3.

En la matriz de correlación vemos que hay correlaciones moderadas y bajas, dando a entender que el modelo no es el mejor y puede ser mejorado.

El valor de la prueba de Barlett es alto, por lo que las correlaciones no son lo suficientemente fuertes y se limita la interpretación

Análisis de conglomerados

El análisis de conglomerados pudo identificar tres grupos principales dentro de las provincias - El primero incluye provincias con altos niveles de pobreza monetaria, que terminan teniendo una dependencia más grande que otras al acceso de servicios gas, con un bajo acceso a servicio de agua. - En el segundo podemos obsefvar que hay valores intermedios en las variables, por lo que existe una condición más equilibrada entre las provincias y la dependencia y acceso mismo a servicios básicos - En el tercero podemos ver que se muestras regiones con bajos niveles de pobreza e índice de corrupción.

Así, es visuble la separación de los conglomerados, por lo que podemos diferencias las necesidades de cada grupo.