Contexto

Column {data-width=500}

Introducción

En las elecciones presidenciales de Perú en 2021, el triunfo de Pedro Castillo en la segunda vuelta reflejó un respaldo significativo de sectores históricamente marginados. Su electorado se caracterizó por incluir mayoritariamente a mujeres, jóvenes, y poblaciones de regiones con bajo Índice de Desarrollo Humano (IDH). Estos votantes, motivados por demandas de justicia social, igualdad y representatividad, encontraron en Castillo una alternativa al statu quo político y económico. Este análisis explora las características socioeconómicas y demográficas que contribuyeron a consolidar su victoria frente a Keiko Fujimori. Pregunta: ¿Cuáles fueron las características de un votante por Pedro Castillo en Segunda vuelta 2021?

Column


Análisis Univariado

Column

Comentarios V. Dependiente

Histograma: Se puede apreciar desde el valor mínimo al máximo, la media y la desviación típica.

  • Min.: 25.93000
  • 1st Q: 52.4075000
  • Median: 68.11500
  • Mean: 67.04954
  • 3st Q: 83.8175000
  • Max.: 96.46000
  • SD.: 18.45752
  • CV: 0.2752819

La curva roja es una estimación suavizada de la densidad de los datos y resalta una concentración en torno a los rangos de 60%-80%, con una caída a medida que el porcentaje de votos disminuye.

Column

Histograma V. Dependiente


Análisis Bivariado

Column

Comentarios

Después de realizar la correlación Spearman, se conluyó que las variables:

  • El “porcentaje_mujeres”, sí tiene correlación con la variable dependiente mientras que,

  • El “porcentaje_jovenes”, tiene una correlación baja e,

  • “IDH”, sí existe correlación.

Column {data-width=600}

Bivariado 1

Spearman
$estimate
      rho 
0.2728297 

$p.value
[1] 0.0001093545

Bivariado 2

Spearman
$estimate
      rho 
0.1441227 

$p.value
[1] 0.04386842

Bivariado 3

Spearman
$estimate
       rho 
-0.4647144 

$p.value
[1] 6.814326e-12

Regresión Lineal

Column

Comentarios

Interpretación RL1:

El porcentaje de mujeres votantes SÍ tiene efecto y es significativo, por lo que, tiene una relación directa controlado por el porcentaje de pobreza extrema.

Interpretación RL2:

El porcentaje de jovenes no es significativo en los votos por Castillo.

Interpretación RL3:

Añadimos la variable IDH y todas las variables son significativas con el porcentaje de votos por Castillo pero solo el porcentaje de mujeres y el IDH tienen efecto. Para saber cuál regresión es mejor, las compararemos.

Interpretación Anova:

El modelo3 es el mejor.

Linealidad: Línea roja debe tender a horizontal

Homocedasticidad: Línea roja debe tender a horizontal

Normalidad de los residuos: ¿Puntos cerca a la diagonal?

No multicolinealidad: > 5 es problematico

Valores influyentes: Si no aparece ningún número, no afecta

Column {data-width=600}

Regresión 1

Regresion: modelo 1
 VotosCastillo (I)
(Intercept) -15.142
(27.213)
porcentaje_mujeres 1.496**
(0.554)
Porc_PE 0.613***
(0.110)
Num.Obs. 196
R2 0.186
R2 Adj. 0.178
AIC 1665.7
BIC 1678.8
Log.Lik. -828.839
F 22.095
RMSE 16.61
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Regresión 2

Regresion: modelo 2
&nbsp;VotosCastillo (II)
(Intercept) -17.057
(29.924)
porcentaje_mujeres 1.507**
(0.560)
porcentaje_jovenes 0.046
(0.293)
Porc_PE 0.607***
(0.117)
Num.Obs. 196
R2 0.186
R2 Adj. 0.174
AIC 1667.7
BIC 1684.0
Log.Lik. -828.826
F 14.663
RMSE 16.61
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Regresión 3

Regresion: modelo 3
&nbsp;VotosCastillo (III)
(Intercept) 26.881
(30.687)
porcentaje_mujeres 1.632**
(0.539)
porcentaje_jovenes -0.411
(0.303)
IDH -66.330***
(16.159)
Porc_PE 0.139
(0.160)
Num.Obs. 196
R2 0.252
R2 Adj. 0.237
AIC 1653.1
BIC 1672.8
Log.Lik. -820.541
F 16.118
RMSE 15.92
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Comparando modelos

Tabla ANOVA para comparar modelos
Res.Df RSS Df Sum of Sq F Pr(>F)
193 54055.94 NA NA NA NA
192 54049.10 1 6.83466 0.0262833 0.8713818
191 49667.36 1 4381.74440 16.8503664 0.0000599

Linealidad

Interpretación: La falta de linearidad provocaría que el modelo no sirva para explicar las mismas variables con datos diferentes en otros estudios.

Homocedasticidad

Interpretación: Se rechaza que el modelo muestre homocedasticidad.

Normalidad de los residuos

Interpretación: Se rechaza la normalidad de los residuos. Por lo tanto, porcentaje de votos se distribuye de manera normal y se puede realizar inferencias a partir de lo encontrado como interpretaciones sólidas y confiables en base a resultados.

No multicolinealidad

Evaluando Multicolinealidad usando VIF (Variance Inflation Factors)
VIF
porcentaje_mujeres 1.046401
porcentaje_jovenes 1.298750
IDH 2.627061
Porc_PE 2.330429

Interpretación: no existe multiconealidad alta entre los predictores y permite calcular bien el efecto de cada regresor.

Valores influyentes

Cuadro V.I

Valores Influyentes criticos
cook.d hat
NA NA
:—— :—

Interpretación: Ningún número afecta el cálculo de la regresión.


Clusterización

Column

Comentarios

PAM:

Gráfico C: Nos recomienda dos clusters.

Clusterización: Provincias mal clusterizadas: “BONGARA”, “CAJATAMBO”, “HUAMANGA”, “JAÉN”, “LAMPA”, “SANDIA”, “UTCUBAMBA”.

Agnes:

Gráfico D: Recomienda un cluster.

No se puede continuar con el análisis porque no permite un operador unitario. Por lo tanto, el análisis concluye allí.

Diana:

Gráfico E: Nos recomienda dos clusters.

Clusterización: Sin provincias mal clusterizadas.

Gráfico DIANA - Dos subconjuntos sin provincias mal clusterizadas.

Conclusión:

Nos quedamos con los resultados de Diana, pues, tiene un mejor Silhouettes y no cuenta con provincias mal clusterizadas.

Column {data-width=600}

Grafico A

Datos seleccionados

Grafico B

Las variables están estandarizadas.

Grafico C - PAM

Silhouettes PAM


Grafico D - AGNES

Grafico E - DIANA

Silhouettes Diana

Grafico PAM - Mal clusterizados

Grafico DIANA - Mal clusterizados


Conclusiones

Column

Conclusiones

En conclusión, el análisis confirmó la hipótesis de que el triunfo de Pedro Castillo en la segunda vuelta de las elecciones presidenciales de 2021 estuvo impulsado por un electorado compuesto mayoritariamente por mujeres, jóvenes y personas de regiones con bajo Índice de Desarrollo Humano (IDH). Este segmento poblacional encontró en su candidatura una oportunidad para expresar demandas de cambio estructural y mayor inclusión social, consolidando su victoria frente a una contrincante asociada con el continuismo. Esto resalta la importancia de entender las dinámicas socioeconómicas en los procesos electorales peruanos.

Column