Entrega 4

1. Presentación: objetivo de la investigación, base de datos y variables

1.1 Objetivo de la investigación

El objetivo principal del trabajo es examinar a nivel provincial la relación entre el IDH (variable dependiente) y una serie de variables independientes, las cuales están asociadas a la capacidad estatal.

Es relevante abordar el trabajo de manera cuantitativa, pues la relación entre las variables nos ayudará a identificar patrones y tendencias que pueden influir en la implementación de políticas públicas y en la toma de decisiones del gobierno peruano. Asimismo, creemos que esta relación tiene un aporte académico importante, ya que puede sentar la base para futuras investigaciones académicas.

Para llegar a este objetivo, hemos aplicado una serie de técnicas que permiten medir las variables independientes y la relación que guardan con la variable dependiente. Estas mediciones fueron aplicadas con la ayuda de modelos lineales y análisis de conglomerados.

La presente entrega se estructura de la siguiente manera: 1) presentación de la base de datos, 2) los resultados del modelo de regresión lineal y 3) los resultados de aplicación de la técnica de conglomerados.

Tomando esto en cuenta, se subirá el documento a Github para posteriormente crear un póster con información completa del trabajo.

1.2 Base de datos

El proceso de construcción de la base de datos partió desde un planteamiento teórico hacia la operacionalización de las variables y la recolección de datos desde fuentes diversas.

Primero, partimos por definir el Índice de Desarrollo Humano (IDH), los datos se recolectaron de la medición del INEI (2019).

Luego, pasamos a definir capacidad estatal, y dividir el concepto en dimensiones que a su vez agrupan a un grupo de variables operacionadas; las cuales se seleccionaron porque tenían una relación estrecha con la variable de interés según la revisión de la literatura académica.

La dimensión 1 fue “distribución territorial y legibilidad estatal”, que incluía las variables: cantidad de población (INEI, 2017), extensión territorial (INEI, 2013), densidad de población (división entre las dos anteriores) y cantidad de distritos (OpenDatasSoft, 2023).

La dimensión 2 fue la “capacidad coercitiva del Estado” que incluía las variables: cantidad de dependencias judiciales (portal del Poder Judicial, 2021), cantidad de comisarías (RENAMU, 2018), número de policías por comisarías (INEI, 2017) y promedio de patrullaje por día (INEI, 2020).

La dimensión 3 fue la “capacidad fiscal del Estado” que incluía las variables: la recaudación tributaria (CEPLAN, 2020), el Presupuesto Institucional Modificado (Portal Amigable, 2022) y gasto presupuestario (CEPLAN, 2020).

La dimensión 4 es la “capacidad administrativa y provisión de servicios desde el Estado”, la cual incluye variables relacionadas al sector educación como el número de locales públicos educativos que cuentan con internet y computadoras funcionales (Censo Escolar, 2017), el porcentaje de locales educativos en buen estado (CEPLAN, 2020) y el porcentaje de satisfacción con los servicios educativos (ENAHO, 2022); las variables relacionadas al sector salud (CEPLAN, 2020) son cantidad de hospitales, cantidad de profesionales de la salud y cantidad de personas que no tienen seguro.

Por último, se uieron los datos en una sola base de datos, que tenía como unidad de análisis a las provincias del Perú.

El Repositorio de la base de datos es: https://docs.google.com/spreadsheets/d/1zhSUOzPt8TH9mXuZzWsrpLYthjWWgJDs/edit?rtpof=true

1.2.1 Visualización de la base de datos

library(rio)
## Warning: package 'rio' was built under R version 4.2.3
library(DT)
## Warning: package 'DT' was built under R version 4.2.3
data= import("Base_de_datos_F5.xlsx")
datatable(data)

2. Modelo de regresión lineal multiple

2.1 Cargar librerías

library(rmdformats)
## Warning: package 'rmdformats' was built under R version 4.2.2
library(DescTools)
## Warning: package 'DescTools' was built under R version 4.2.1
library(nortest)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
library(stargazer)
## 
## Please cite as:
##  Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
library(modelsummary)
## Warning: package 'modelsummary' was built under R version 4.2.3
## 
## Attaching package: 'modelsummary'
## The following objects are masked from 'package:DescTools':
## 
##     Format, Mean, Median, N, SD, Var
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(magrittr)
## Warning: package 'magrittr' was built under R version 4.2.1
library(BBmisc)
## Warning: package 'BBmisc' was built under R version 4.2.3
## 
## Attaching package: 'BBmisc'
## The following objects are masked from 'package:dplyr':
## 
##     coalesce, collapse, symdiff
## The following object is masked from 'package:DescTools':
## 
##     %nin%
## The following object is masked from 'package:base':
## 
##     isFALSE
library(knitr)
## Warning: package 'knitr' was built under R version 4.2.1
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.2.3
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
library(car)
## Warning: package 'car' was built under R version 4.2.1
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.1
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
## The following object is masked from 'package:DescTools':
## 
##     Recode

2.2 Base de datos: limpieza de valores perdidos (NA’s)

Visualización de la base de datos:

str(data)
## 'data.frame':    196 obs. of  12 variables:
##  $ PROVINCIA   : chr  "CONDORCANQUI" "BONGARA" "RODRIGUEZ DE MENDOZA" "LUYA" ...
##  $ DEPARTAMENTO: chr  "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
##  $ idh         : num  0.254 0.413 0.366 0.341 0.543 ...
##  $ DISTRITOS   : num  3 12 12 23 21 6 7 2 7 9 ...
##  $ PIM         : num  133.9 25.9 50.1 77 395.2 ...
##  $ PATRULLAJE  : num  4 6 3 5 2 4 2 4 8 1 ...
##  $ COMISARIAS  : num  6 6 6 11 8 7 8 1 6 1 ...
##  $ JUDICIAL    : num  3 3 3 3 11 9 10 1 2 2 ...
##  $ EDUCONEC    : num  11 23 6 30 32 41 62 7 4 7 ...
##  $ ESTADOLOCAL : num  15.2 12.9 16.3 11.1 21.7 16.9 15.9 13 9.6 28.1 ...
##  $ HOSPITAL    : num  15 36 41 62 51 90 123 3 158 10 ...
##  $ NOSEGUROS   : num  14969 7952 13968 295 2560 ...

Comprobación de la existencia de valores perdidos:

any(is.na(data))
## [1] TRUE
sum(is.na(data$PATRULLAJE))
## [1] 6
data[!complete.cases(data[,-1]),]%>%kbl()%>%
  kable_styling(bootstrap_options = "striped", font_size = 10)
PROVINCIA DEPARTAMENTO idh DISTRITOS PIM PATRULLAJE COMISARIAS JUDICIAL EDUCONEC ESTADOLOCAL HOSPITAL NOSEGUROS
128 CAJATAMBO LIMA 0.3845 5 30.79828 NA 1 2 3 6.3 8 2261
131 YAUYOS LIMA 0.4466 33 56.52597 NA 4 3 42 18.8 39 6439
136 CANTA LIMA 0.5684 7 62.06808 NA 2 1 77 16.9 31 1957
138 PUTUMAYO LORETO 0.3989 4 22.09124 NA 1 2 1 0.0 25 6264
147 MANU MADRE DE DIOS 0.5945 4 40.38689 NA 4 4 3 16.5 79 208312
179 BELLAVISTA SAN MARTIN 0.4195 6 98.98334 NA 3 3 27 7.7 39 6587

Limpieza de la base de datos:

datos=data[complete.cases(data[,-1]),] 
row.names(datos)=NULL
any(is.na(datos))
## [1] FALSE

Base de datos limpia

str(datos)
## 'data.frame':    190 obs. of  12 variables:
##  $ PROVINCIA   : chr  "CONDORCANQUI" "BONGARA" "RODRIGUEZ DE MENDOZA" "LUYA" ...
##  $ DEPARTAMENTO: chr  "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
##  $ idh         : num  0.254 0.413 0.366 0.341 0.543 ...
##  $ DISTRITOS   : num  3 12 12 23 21 6 7 2 7 9 ...
##  $ PIM         : num  133.9 25.9 50.1 77 395.2 ...
##  $ PATRULLAJE  : num  4 6 3 5 2 4 2 4 8 1 ...
##  $ COMISARIAS  : num  6 6 6 11 8 7 8 1 6 1 ...
##  $ JUDICIAL    : num  3 3 3 3 11 9 10 1 2 2 ...
##  $ EDUCONEC    : num  11 23 6 30 32 41 62 7 4 7 ...
##  $ ESTADOLOCAL : num  15.2 12.9 16.3 11.1 21.7 16.9 15.9 13 9.6 28.1 ...
##  $ HOSPITAL    : num  15 36 41 62 51 90 123 3 158 10 ...
##  $ NOSEGUROS   : num  14969 7952 13968 295 2560 ...

2.2 Creación del modelo de regresion lineal multiple

Modelo 5

Tras un examen de la correlación entre todas las variables independientes y la dependiente, se econotró que solo 5 variables tenian una correlación fuerte y significativa. En consecuencia, se procedió a formular una ecuación en base a dichas variables.

La ecuación indica que el Indice de Desarrollo Humano (IDH) se explica por las variables Presupuesto Institucional Modificado (PIM), cantidad de dependencias judiciales (JUDICIAL), porcentaje de locales educativos en buen estado (ESTADOLOCAL), número de locales públicos educativos que cuentan con internet y computadoras funcionales (EDUCONEC) y cantidad de personas que no tienen seguro (NOSEGUROS).

IDH = C + αPIM + βJUDICIAL + δESTADOLOCAL + θEDUCONEC + φ*NOSEGUROS + ε

modelo5 = lm(idh~PIM+ JUDICIAL + ESTADOLOCAL+ EDUCONEC + NOSEGUROS, datos)

summary(modelo5) 
## 
## Call:
## lm(formula = idh ~ PIM + JUDICIAL + ESTADOLOCAL + EDUCONEC + 
##     NOSEGUROS, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.21575 -0.06293 -0.01817  0.05402  0.27490 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.782e-01  1.843e-02  20.520  < 2e-16 ***
## PIM          2.024e-04  3.228e-05   6.268 2.54e-09 ***
## JUDICIAL     1.207e-03  6.247e-04   1.932   0.0549 .  
## ESTADOLOCAL  1.668e-03  8.815e-04   1.892   0.0601 .  
## EDUCONEC    -4.452e-04  3.032e-04  -1.469   0.1437    
## NOSEGUROS    9.185e-08  4.251e-08   2.161   0.0320 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.09966 on 184 degrees of freedom
## Multiple R-squared:  0.2755, Adjusted R-squared:  0.2558 
## F-statistic:    14 on 5 and 184 DF,  p-value: 1.353e-11

Se puede ver que el modelo explica el 25 % de los datos. Ademas, en cuanto a la significancia y el valor de los coeficientes tenemos lo siguiente. Primero, en la dimensión de capacidad fiscal, se encontró que el Presupuesto Institucional Modificado (PIM) tiene un efecto positivo, y es significativo al 0.05. Segundo, en la capacidad coercitiva, se encontró que la cantidad de dependencias judiciales(JUDICIAL) influye de manera positiva, y es significativo solo al 0.1. Asimismo, el porcentaje de locales educativos en buen estado (ESTADOLOCAL) está relacionada inversamente, y es significativo al 0.1. Por último, en temas de salud, la cantidad de personas que no tienen seguro (NOSEGUROS) se relaciona positivamente y es significativo al 0.05. La única variable no significativa es el número de locales públicos educativos que cuentan con internet y computadoras funcionales (EDUCONEC); por ende, no será incluido en la ecuación final.

Al final, la ecuación quedaría con los siguientes parámetros y el valor de la constante:

IDH = 3.843e-01 + 1.991e-10PIM+1.127e-3JUDICIAL + 1.485e-03ESTADOLOCAL + 5.473e-08NOSEGUROS + ε

2.3 Calculamos los diagnósticos de la regresión

1. Linealidad

plot(modelo5,1) #Se espera que la línea roja tienda a la horizontal

mean(modelo5$residuals) # Se espera que el promedio de los residuos sea cercano a 0
## [1] -2.90666e-19

En base al resultado visual obtenido se asume la relación lineal entre las variables. La relación es lineal porque en el gráfico la línea roja tienda a la horizontal y con el test, se obtiene 1.923924e-19, un valor muy cercano a 0. Esto significa que el promedio de los residuos sea cercano a 0. A partir de ello, se declara que es factible poder explicar las mismas variables del caso con datos diferentes en próximos estudios.

2. Homocedasticidad

library(base)
plot(modelo5,3) # Se espera que la línea roja debe tender a horizontal.

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.1
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(modelo5) #H0 = Modelo homocedástico, buscamos que sea mayor a 0.05 
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo5
## BP = 6.666, df = 5, p-value = 0.2467

Se asume que la dispersión de los errores de la estimación (idh) mantiene una variación constante. Por un lado, la gráfica nos indica que al analizar las raíces de los errores estandarizados versus los valores estimados, la distancia de los puntos a la línea de referencia es similar. En complemento a ello, se realizó el test de Breusch-Pagan que da como resultado 5.8148, por ende, rechazamos que el modelo muestre homocedasticidad (p-value = 0.3247). La presencia de heterocedasticidad afecta el cálculo de los p-values, afectando directamente la validez de todo el modelo.

3. Normalidad de residuos

plot(modelo5,2) # En este caso la expectativa es que los puntos se acerquen lo más posible a la línea oblicua del gráfico que representa una distribución normal

shapiro.test(modelo5$residuals) #H0= Hay normalidad
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo5$residuals
## W = 0.97066, p-value = 0.0005081

El Q-Q plot refleja que hay indicios de falta de normalidad en los residuos (aquellos de mayor valor), corroborado también por el test de hipótesis de Shapiro Wilk (p-value = 0.0009552). En consecuencia, la falta de normalidad limita la capacidad de hacer inferencias, pues, los estimadores tienden a no ser eficientes.

4. No multicolinealidad

VIF(modelo5) #>5 es problemático
##         PIM    JUDICIAL ESTADOLOCAL    EDUCONEC   NOSEGUROS 
##    1.379543   22.880821    1.027414   24.526092    1.013596

Se asume que hay multicolinealidad cuando los predictores tienen una correlación muy alta entre sí. En este caso, los resultados muestra valores mayores a 5 para las variables administración de justicia (JUDICIAL) y Número de locales públicos educativos que cuentan con internet y computadoras funcionales (EDUCONEC). Lo cual es problemático porque, a aunque no perjuda el calculo de las aproximaciones, si evita calcular el efecto de cada regresor.

5. Valores influyentes

plot(modelo5,5) #miramos valores fuera de las lineas punteadas
## Warning in sqrt(crit * p * (1 - hh)/hh): Se han producido NaNs

## Warning in sqrt(crit * p * (1 - hh)/hh): Se han producido NaNs

checModelo5=as.data.frame(influence.measures(modelo5)$is.inf)
checModelo5[checModelo5$cook.d & checModelo5$hat,] #visualizamos valores
##     dfb.1_ dfb.PIM dfb.JUDI dfb.ESTA dfb.EDUC dfb.NOSE dffit cov.r cook.d  hat
## 134  FALSE    TRUE     TRUE    FALSE     TRUE    FALSE  TRUE  TRUE   TRUE TRUE
## 146  FALSE   FALSE    FALSE    FALSE    FALSE     TRUE  TRUE  TRUE   TRUE TRUE

Se supone que hay casos particulares, que tienen la capacidad de trastocar lo que el modelo representa; entonces, se debe detectarlo y suprimirlo para mejorar el modelo. En este caso, la gráfica muestra que existen valores fuera de las lineas punteadas; este es la fila 134 y 146. Estas dos filaa están afectando los cálculos de la regresión (sin él habría otro resultado).

2.4 Conclusiones: interpretación del modelo

La ecuación:

IDH = 3.843e-01 + 1.991e-10PIM+1.127e-3JUDICIAL + 1.485e-03ESTADOLOCAL - 4.087e-04EDUCONEC + 5.473e-08*NOSEGUROS + ε

La relación entre la capacidad estatal y el desarrollo humano es positiva, significativa, pero de poco impacto. Dado que el Índice de Desarrollo Humano (IDH) se basa en tres dimensiones: la esperanza de vida al nacer, el acceso a la educación y el ingreso per cápita.

La relación se explica porque la capacidad estatal, en sus diferentes dimensiones, posibilita la generación de condiciones básicas y necesaria para que las personas puedan desarrollar sus potencialidades. Es decir, se establece un piso, una infraestructura estatal, para el desarrollo humano.

Entonces, se establece dos escenarios. Primero, si se cuenta con poca capacidad estatal, las personas no cuentan con desarrollo humano. Segundo, una mayor capacidad estatal crea condiciones para que las personas tengan desarrollo humano. Además, encontramos algunas variables que no influyen en el desarrollo humano, sino que se mantienen constante, independientemente de la provincia que sea.

El desarrollo estatal se debe dar en diferentes dimensiones para así garantizar de manera completa el desarrollo humano.

Primero, en la capacidad coercitiva, se encontró que la administración de justicia influye de manera positiva porque garantiza las mínimas condiciones del Estado de Derecho; es decir, una amplia población tiene el acceso a un sistema de justicia que responda a sus intereses y les brinde protección legal.

Segundo, en la dimensión de capacidad fiscal, se encontró que el Presupuesto Institucional Modificado (PIM) tiene un efecto positivo. Esto debido a que el gobierno puede administrar y gastar estos recursos de manera responsable y sostenible para satisfacer las necesidades de la sociedad.

Tercero, en la dimensión administrativa y provisión de servicios públicos, tanto la educación y la salud tienen una relación directa. En educación, el porcentaje de locales educativos en buen estado, impacta positivamente en Desarrollo Humano debido a que el Estado cumple con su responsabilidad de proporcionar y mantener instalaciones educativas adecuadas y seguras para los estudiantes. Asimismo, el número de locales públicos educativos que cuentan con internet y computadoras funcionales, es algo indispensable para el desarrollo humano. Por último, en temas de salud, la cantidad de personas que no tienen seguro se relaciona positivamente con el Desarrollo Humano. Sin ser un contrasentido, implica que las personas pobres cuentan con seguro SIS, pero no con la infraestructura hospitalaria adecuada.

Por tanto, la capacidad estatal influye en el desarrollo humano porque garantiza lo mínimo y necesario para que las personas puedan desarrollarse en diferentes dimensiones como la administración de justicia, presupuesto para los gobiernos, e infraestructura para brindar servicios públicos de educación y salud.

3. Clusterización

3.1 Limpieza de Base de datos

3.1.1 Limpieza de NA’s y eliminación de variable NOSEGUROS

any(is.na(data))
## [1] TRUE
sum(is.na(data$PATRULLAJE)) #ubicación de los NA's
## [1] 6
datitos <- data[,apply(data,2,function(x) !any(is.na(x)))]#eliminar columnas con N.A
#Verificando NA's elimandos 
any(is.na(datitos))
## [1] FALSE

¿Por que eliminar la variable NOSEGUROS?

Cuando dos variables tienen una correlación negativa, es más probable que los casos que tienen valores altos en una variable tengan valores bajos en la otra variable, lo que puede dificultar la identificación de grupos homogéneos o la asignación adecuada de casos a grupos.

Por lo tanto, como se ve en la imgen de arriba la variable NOSEGUROS nos proporciona 4 correlaciones negativas los que dificulta que los casos puedan agruparse, es decir que los casos que tengan caracteristicas similares se puedan ver afectados por correlaciones negativas, creando mas de 7 grupos. De tal manera, que hemos decidido eliminar la variable NOSEGUROS para disminuir el impacto de la correlacion negativa en la agrupacion de casos.

datitos <- datitos[,-11 ] #ELIMINAR NOSEGUROS

3.1.2 Eliminación de casos atípicos

Se decidió eliminar la provincia Lima porque mostraba valores atípicos que sesgaban los resultados.

datitos <- datitos[-137, ] #ELIMINAR LIMA DATO ATIPICO
#datitos<- datitos [-42, ] #ELIMINAR AREQUIPA DATO ATIPICO 
nrow(datitos) #PARA SABER CUANTOS FILAS TENGO DESPUES DE ELIMINAR LIMA
## [1] 195
library(BBmisc)

3.2 Transformacion de la data : Estandarizacion

Dado que tenemos diferentes unidades en cada variable, lo que debemos hacer transformar los datitos en una unidad estandar para evitar confundir a los algoritmos de conglomeración.

3.2.1 Creacion de Boxplot para la visualizacion de la dispersion de las variables indepedientes

boxplot(normalize(datitos[,c(3:10)],method='range',range=c(0,10)))

boxplot(normalize(datitos[,c(3:10)],method='standardize'))

3.2.2 Codigos para estandarizar datitos :

datitos[,c(3:10)]=normalize(datitos[,c(3:10)],method='range',range=c(0,10))

3.2.3 Correlaciones :

cor(datitos[,c(3:10)])
##                    idh   DISTRITOS        PIM COMISARIAS   JUDICIAL   EDUCONEC
## idh         1.00000000  0.12529894 0.45766872  0.2143446 0.52052725 0.41557993
## DISTRITOS   0.12529894  1.00000000 0.31689325  0.3193807 0.32895039 0.41987184
## PIM         0.45766872  0.31689325 1.00000000  0.4509536 0.93189836 0.87445998
## COMISARIAS  0.21434461  0.31938066 0.45095359  1.0000000 0.46731993 0.56586534
## JUDICIAL    0.52052725  0.32895039 0.93189836  0.4673199 1.00000000 0.85004933
## EDUCONEC    0.41557993  0.41987184 0.87445998  0.5658653 0.85004933 1.00000000
## ESTADOLOCAL 0.14364847 -0.01830878 0.07844603  0.1401182 0.07893006 0.05935721
## HOSPITAL    0.03935239  0.06188039 0.12099363  0.3185607 0.09523026 0.13209339
##             ESTADOLOCAL    HOSPITAL
## idh          0.14364847  0.03935239
## DISTRITOS   -0.01830878  0.06188039
## PIM          0.07844603  0.12099363
## COMISARIAS   0.14011822  0.31856065
## JUDICIAL     0.07893006  0.09523026
## EDUCONEC     0.05935721  0.13209339
## ESTADOLOCAL  1.00000000 -0.03578671
## HOSPITAL    -0.03578671  1.00000000

Observacion: Debido a que , tanto en clase como en el material de consulta no se explica como invetir un rango en el caso de que salga una correlacion negativa se decidio realizar el analisis de todas formas a pesar de ese detalle. De igual forma se elimino la variable NOSEGUROS para lograr disminuir un poco el impacto de correlaciones negativas en el analsis conglomerado.

3.4. Preparación de los datos para clusterizacion

dataClus=datitos[,c(3:10)] 
row.names(dataClus)=datitos$PROVINCIA
str(dataClus)
## 'data.frame':    195 obs. of  8 variables:
##  $ idh        : num  0.716 4.082 3.1 2.565 6.822 ...
##  $ DISTRITOS  : num  0.606 3.333 3.333 6.667 6.061 ...
##  $ PIM        : num  0.79 0.128 0.277 0.441 2.39 ...
##  $ COMISARIAS : num  1.15 1.15 1.15 2.12 1.54 ...
##  $ JUDICIAL   : num  0.175 0.175 0.175 0.175 0.877 ...
##  $ EDUCONEC   : num  0.287 0.63 0.143 0.831 0.888 ...
##  $ ESTADOLOCAL: num  2.77 2.35 2.97 2.03 3.96 ...
##  $ HOSPITAL   : num  0.179 0.492 0.566 0.879 0.715 ...
library(cluster)
g.dist = daisy(dataClus, metric="gower")

3.5. La tecnica de jerarquizacion

3.5.1 Jerarquizacion aglomerativa

PASO 1: Decidir linkages

Linkage tipo SINGLE.

Linkage tipo COMPLETE.

Linkage tipo AVERAGE

  • USAR WARD.D para disminuir el efecto de las correlaciones negativas que en este caso son pocas

PASO 2: Cantidad de clusters - uso del estadistico gap

## PARA JERARQUICO
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.2.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_nbclust(dataClus, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F,hc_func = "agnes")

PASO 3: Clusterizar vía AGNES

set.seed(123)

res.agnes<- hcut(g.dist, k = 4,hc_func='agnes',hc_method = "ward.D")

dataClus$agnes=res.agnes$cluster

# ver

head(dataClus,15)%>%kbl()%>%kable_styling()
idh DISTRITOS PIM COMISARIAS JUDICIAL EDUCONEC ESTADOLOCAL HOSPITAL agnes
CONDORCANQUI 0.7157939 0.6060606 0.7896620 1.1538462 0.1754386 0.2865330 2.773723 0.1788376 1
BONGARA 4.0815034 3.3333333 0.1277931 1.1538462 0.1754386 0.6303725 2.354015 0.4918033 1
RODRIGUEZ DE MENDOZA 3.0996622 3.3333333 0.2765346 1.1538462 0.1754386 0.1432665 2.974453 0.5663189 1
LUYA 2.5654561 6.6666667 0.4409641 2.1153846 0.1754386 0.8309456 2.025547 0.8792846 1
CHACHAPOYAS 6.8222128 6.0606061 2.3896123 1.5384615 0.8771930 0.8882521 3.959854 0.7153502 2
BAGUA 5.0971284 1.5151515 1.3144633 1.3461538 0.7017544 1.1461318 3.083942 1.2965723 2
UTCUBAMBA 5.2892736 1.8181818 1.3441005 1.5384615 0.7894737 1.7478510 2.901460 1.7883756 2
ASUNCION 3.5768581 0.3030303 0.2168198 0.1923077 0.0000000 0.1719198 2.372263 0.0000000 1
CORONGO 3.5620777 1.8181818 0.1490388 1.1538462 0.0877193 0.0859599 1.751825 2.3099851 1
AIJA 3.1608953 2.4242424 0.1321368 0.1923077 0.0877193 0.1719198 5.127737 0.1043219 1
MARISCAL LUZURIAGA 1.1929899 2.1212121 0.2368046 0.0000000 0.0877193 0.6303725 2.317518 0.4769001 1
OCROS 5.1921453 2.7272727 0.0463804 0.3846154 0.0877193 0.1432665 4.762774 0.3278689 1
ANTONIO RAIMONDI 2.0418074 1.5151515 0.1448019 0.1923077 0.0877193 0.3724928 2.043796 0.1490313 1
CARLOS FERMIN FITZCARRALD 1.8243243 0.6060606 0.2298101 0.5769231 0.0877193 0.4011461 2.755475 0.3427720 1
POMABAMBA 2.5844595 0.9090909 0.4528819 3.0769231 0.0877193 0.5730659 3.229927 1.9225037 1
fviz_dend(res.agnes, cex = 0.7, horiz = T,main = "")
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

PASO 4 : Evaluando el uso del AGNES

fviz_silhouette(res.agnes,print.summary = F)

silAGNES=data.frame(res.agnes$silinfo$widths)
silAGNES$PROVINCIAS=row.names(silAGNES)
poorAGNES=silAGNES[silAGNES$sil_width<0,'PROVINCIAS']%>%sort()
poorAGNES
## [1] "ABANCAY"               "CANCHIS"               "JUNIN"                
## [4] "LAMBAYEQUE"            "OXAPAMPA"              "SAN ANTONIO DE PUTINA"
## [7] "SATIPO"                "SECHURA"               "YAUYOS"
  • ME SALEN MENOS PROVINCIAS CLUSTERIZADAS

PASO 5 : Verificando etiquetas de cluster

aggregate(.~ agnes, data=dataClus,mean)
##   agnes      idh DISTRITOS        PIM COMISARIAS   JUDICIAL   EDUCONEC
## 1     1 3.029510  2.416405  0.6205071   1.042772  0.2313975  0.8922043
## 2     2 7.061711  2.473920  1.0831273   1.125473  0.7937877  1.2692001
## 3     3 7.508322  3.404635  5.0773425   1.798643  4.0041280  4.2406877
## 4     4 9.495355  8.484848 10.0000000  10.000000 10.0000000 10.0000000
##   ESTADOLOCAL  HOSPITAL
## 1    2.796061 0.6782209
## 2    3.470145 0.6542718
## 3    2.872477 0.8152889
## 4    6.222628 2.1460507
  • falta ordenar de menor a mayor

PASO 6 : Guardemos la columna de AGNES en la data integrada, y eliminemosla de dataClus.

datitos$agnespoor=datitos$PROVINCIA%in%poorAGNES
datitos$agnes=as.ordered(dataClus$agnes)
dataClus$agnes=NULL

PASO 5: Visualizacion comparativa

# k es la cantidad de dimensiones
proyeccion = cmdscale(g.dist, k=2,add = T) 
head(proyeccion$points,20)
##                                   [,1]         [,2]
## CONDORCANQUI              -0.161080846 -0.007152285
## BONGARA                   -0.068269064  0.050314825
## RODRIGUEZ DE MENDOZA      -0.096529897  0.060617701
## LUYA                      -0.062681844  0.192334221
## CHACHAPOYAS                0.148082852  0.025744830
## BAGUA                      0.011756664 -0.020787106
## UTCUBAMBA                  0.046222351  0.010711536
## ASUNCION                  -0.150961333 -0.055339234
## CORONGO                   -0.115149082  0.028251120
## AIJA                      -0.123891620 -0.039486308
## MARISCAL LUZURIAGA        -0.160196857  0.028410410
## OCROS                     -0.053086509 -0.080562203
## ANTONIO RAIMONDI          -0.170344755 -0.002343503
## CARLOS FERMIN FITZCARRALD -0.171651558 -0.028564731
## POMABAMBA                 -0.110633037  0.029293476
## RECUAY                    -0.077676498  0.012583886
## PALLASCA                  -0.116396641  0.011230511
## SIHUAS                    -0.124096003 -0.001183863
## BOLOGNESI                 -0.031834594 -0.020170156
## HUARMEY                   -0.007104257 -0.136863656

PASO 6: Recuperar las coordenadas

# data frame prep:
datitos$dim1 <- proyeccion$points[,1]
datitos$dim2 <- proyeccion$points[,2]
library(ggrepel)
## Warning: package 'ggrepel' was built under R version 4.2.3
base= ggplot(datitos,aes(x=dim1, y=dim2,label=row.names(dataClus))) 
base + geom_text_repel(size=2, max.overlaps = 50,min.segment.length = unit(0, 'lines'))

## 3.6. Grafica de AGNES

# solo paises mal clusterizados
AGNESlabels=ifelse(datitos$agnespoor,datitos$PROVINCIA,'')

agnesPlot=base + geom_point(size=3, 
                            aes(color=as.factor(agnes))) +
          labs(title = "AGNES") 
# hacer notorios los paises mal clusterizados
agnesPlot + geom_text_repel(size=2,
                            aes(label=AGNESlabels),
                            max.overlaps = 50,
                            min.segment.length = unit(0, 'lines'))

options(max.print = 5000) #codigo para copiar data en chat gpt
datitos_ordenado <- arrange(datitos,agnes) #codigo para ordenar segun la columna agnes
head(datitos_ordenado,195)%>%kbl()%>%kable_styling()
PROVINCIA DEPARTAMENTO idh DISTRITOS PIM COMISARIAS JUDICIAL EDUCONEC ESTADOLOCAL HOSPITAL agnespoor agnes dim1 dim2
CONDORCANQUI AMAZONAS 0.7157939 0.6060606 0.7896620 1.1538462 0.1754386 0.2865330 2.7737226 0.1788376 FALSE 1 -0.1610808 -0.0071523
BONGARA AMAZONAS 4.0815034 3.3333333 0.1277931 1.1538462 0.1754386 0.6303725 2.3540146 0.4918033 FALSE 1 -0.0682691 0.0503148
RODRIGUEZ DE MENDOZA AMAZONAS 3.0996622 3.3333333 0.2765346 1.1538462 0.1754386 0.1432665 2.9744526 0.5663189 FALSE 1 -0.0965299 0.0606177
LUYA AMAZONAS 2.5654561 6.6666667 0.4409641 2.1153846 0.1754386 0.8309456 2.0255474 0.8792846 FALSE 1 -0.0626818 0.1923342
ASUNCION ANCASH 3.5768581 0.3030303 0.2168198 0.1923077 0.0000000 0.1719198 2.3722628 0.0000000 FALSE 1 -0.1509613 -0.0553392
CORONGO ANCASH 3.5620777 1.8181818 0.1490388 1.1538462 0.0877193 0.0859599 1.7518248 2.3099851 FALSE 1 -0.1151491 0.0282511
AIJA ANCASH 3.1608953 2.4242424 0.1321368 0.1923077 0.0877193 0.1719198 5.1277372 0.1043219 FALSE 1 -0.1238916 -0.0394863
MARISCAL LUZURIAGA ANCASH 1.1929899 2.1212121 0.2368046 0.0000000 0.0877193 0.6303725 2.3175182 0.4769001 FALSE 1 -0.1601969 0.0284104
OCROS ANCASH 5.1921453 2.7272727 0.0463804 0.3846154 0.0877193 0.1432665 4.7627737 0.3278689 FALSE 1 -0.0530865 -0.0805622
ANTONIO RAIMONDI ANCASH 2.0418074 1.5151515 0.1448019 0.1923077 0.0877193 0.3724928 2.0437956 0.1490313 FALSE 1 -0.1703448 -0.0023435
CARLOS FERMIN FITZCARRALD ANCASH 1.8243243 0.6060606 0.2298101 0.5769231 0.0877193 0.4011461 2.7554745 0.3427720 FALSE 1 -0.1716516 -0.0285647
POMABAMBA ANCASH 2.5844595 0.9090909 0.4528819 3.0769231 0.0877193 0.5730659 3.2299270 1.9225037 FALSE 1 -0.1106330 0.0292935
RECUAY ANCASH 4.3750000 2.7272727 0.3329852 0.7692308 0.0877193 0.6590258 2.0802920 0.1639344 FALSE 1 -0.0776765 0.0125839
PALLASCA ANCASH 2.2719595 3.0303030 0.2565646 1.5384615 0.0877193 0.4871060 8.3029197 0.2682563 FALSE 1 -0.1163966 0.0112305
SIHUAS ANCASH 1.9995777 2.7272727 0.4422655 0.1923077 0.0877193 0.7449857 5.2737226 0.2831595 FALSE 1 -0.1240960 -0.0011839
BOLOGNESI ANCASH 4.9303209 4.2424242 0.2742019 0.7692308 0.0877193 0.4871060 5.1459854 0.2980626 FALSE 1 -0.0318346 -0.0201702
CARHUAZ ANCASH 4.9303209 3.0303030 0.4580900 1.7307692 0.2631579 1.0601719 3.7226277 0.2980626 FALSE 1 -0.0133324 0.0079296
YUNGAY ANCASH 2.4535473 2.1212121 0.5191531 0.7692308 0.2631579 1.0601719 2.4452555 0.4172876 FALSE 1 -0.1131249 0.0398181
HUARI ANCASH 4.3179899 4.5454545 0.8921134 1.3461538 0.7017544 1.8051576 2.4817518 0.9090909 FALSE 1 0.0258211 0.1182009
HUAYLAS ANCASH 3.9273649 2.7272727 0.6602628 1.3461538 0.5263158 1.0028653 3.5036496 0.8196721 FALSE 1 -0.0374249 0.0351314
ANTABAMBA APURIMAC 2.1853885 1.8181818 0.2905860 0.5769231 0.1754386 0.1719198 1.9343066 0.3576751 FALSE 1 -0.1561344 0.0173817
GRAU APURIMAC 1.7926520 3.9393939 0.3162009 0.9615385 0.3508772 0.3438395 2.6642336 0.2086438 FALSE 1 -0.1155821 0.0907998
AYMARAES APURIMAC 2.8610642 4.8484848 0.4255899 0.9615385 0.2631579 0.6017192 1.3321168 0.8047690 FALSE 1 -0.0881363 0.1385809
CHINCHEROS APURIMAC 2.6330236 3.0303030 0.8023143 1.5384615 0.3508772 1.6905444 5.2737226 0.5216095 FALSE 1 -0.0407856 0.0668034
COTABAMBAS APURIMAC 3.2200169 1.5151515 0.6622204 0.3846154 0.1754386 0.8022923 2.1532847 0.1043219 FALSE 1 -0.1220544 -0.0028680
ANDAHUAYLAS APURIMAC 4.2715372 5.7575758 2.2244796 2.3076923 1.1403509 1.8624642 1.7700730 1.6989568 FALSE 1 0.1013235 0.2066587
LA UNION AREQUIPA 2.9201858 3.0303030 0.2784061 1.1538462 0.0877193 0.0573066 2.0802920 0.8643815 FALSE 1 -0.1086978 0.0763203
HUANCA SANCOS AYACUCHO 3.4459459 0.9090909 0.0842842 1.3461538 0.0877193 0.0573066 4.2700730 1.2816692 FALSE 1 -0.1133979 -0.0478012
SUCRE AYACUCHO 3.5451858 3.0303030 0.1438827 0.3846154 0.0877193 0.2292264 1.4781022 0.2682563 FALSE 1 -0.1156574 0.0448717
PAUCAR DEL SARA SARA AYACUCHO 4.5586993 2.7272727 0.1923300 1.1538462 0.0877193 0.3438395 2.6277372 0.5365127 FALSE 1 -0.0662714 0.0047060
VILCAS HUAMAN AYACUCHO 1.9995777 2.1212121 0.2843927 0.5769231 0.1754386 0.4297994 3.9598540 0.3278689 FALSE 1 -0.1409480 -0.0086451
VICTOR FAJARDO AYACUCHO 3.2896959 3.3333333 0.2029076 0.7692308 0.1754386 0.5444126 3.3759124 0.4321908 FALSE 1 -0.0935955 0.0406712
CANGALLO AYACUCHO 2.3163007 1.5151515 0.7096341 0.9615385 0.2631579 0.3438395 4.5802920 0.1192250 FALSE 1 -0.1276057 -0.0325827
PARINACOCHAS AYACUCHO 4.1765203 2.1212121 0.6611664 0.1923077 0.1754386 0.6590258 4.0145985 0.1937407 FALSE 1 -0.0811622 -0.0462044
LUCANAS AYACUCHO 4.3454392 6.0606061 1.0681195 1.7307692 0.3508772 2.2636103 2.6277372 0.8494784 FALSE 1 0.0477016 0.1594788
LA MAR AYACUCHO 2.3859797 3.0303030 1.6608297 3.0769231 0.9649123 0.9169054 2.2810219 1.6840537 FALSE 1 -0.0141507 0.1589529
HUANTA AYACUCHO 3.5874155 3.3333333 1.2222589 1.9230769 0.4385965 1.6332378 1.5693431 1.6542474 FALSE 1 -0.0043836 0.1511492
SAN PABLO CAJAMARCA 1.9636824 0.9090909 0.2237823 0.1923077 0.0877193 0.4871060 3.2116788 0.1788376 FALSE 1 -0.1699526 -0.0393744
CONTUMAZA CAJAMARCA 4.2757601 2.1212121 0.3029804 0.5769231 0.1754386 0.6876791 2.1532847 0.1192250 FALSE 1 -0.0916226 -0.0129905
SANTA CRUZ CAJAMARCA 3.6190878 3.0303030 0.4124047 1.7307692 0.1754386 0.7736390 2.7737226 0.5663189 FALSE 1 -0.0663958 0.0654078
SAN MARCOS CAJAMARCA 2.5211149 1.8181818 0.3638959 0.7692308 0.0877193 0.8022923 1.8065693 0.2980626 FALSE 1 -0.1371687 0.0287286
SAN MIGUEL CAJAMARCA 3.1904561 3.6363636 0.3807627 2.5000000 0.1754386 1.0028653 3.2846715 0.6855440 FALSE 1 -0.0534479 0.1029702
CAJABAMBA CAJAMARCA 2.7618243 1.8181818 0.4424907 1.1538462 0.3508772 1.0601719 2.5729927 0.4023845 FALSE 1 -0.1042968 0.0301688
CELENDIN CAJAMARCA 2.1832770 3.3333333 0.5603409 1.7307692 0.2631579 1.0601719 4.5620438 0.5067064 FALSE 1 -0.0725754 0.0748041
HUALGAYOC CAJAMARCA 3.1608953 0.6060606 0.8039114 0.1923077 0.2631579 1.4040115 1.6058394 0.1043219 FALSE 1 -0.1143846 0.0016246
CUTERVO CAJAMARCA 2.8547297 4.2424242 1.6154540 2.3076923 0.4385965 3.2951289 3.4124088 0.6408346 FALSE 1 0.0440082 0.1846301
CHOTA CAJAMARCA 2.9750845 5.4545455 1.5398389 1.5384615 0.8771930 2.0916905 0.4927007 0.7302534 FALSE 1 0.0199915 0.2218207
SAN IGNACIO CAJAMARCA 2.9581926 1.8181818 1.4328678 1.1538462 0.4385965 1.3467049 1.1496350 1.2816692 FALSE 1 -0.0595370 0.0861447
CANAS CUSCO 0.7854730 2.1212121 0.3598636 1.7307692 0.0877193 0.8022923 4.0145985 0.3278689 FALSE 1 -0.1279227 0.0280960
ACOMAYO CUSCO 1.6490709 1.8181818 0.2454131 0.9615385 0.1754386 0.9169054 1.9160584 0.1192250 FALSE 1 -0.1454823 0.0358284
PARURO CUSCO 0.6081081 2.4242424 0.3156149 0.5769231 0.0877193 0.5157593 4.1788321 0.4769001 FALSE 1 -0.1468867 0.0068185
PAUCARTAMBO CUSCO 0.4814189 1.5151515 0.5965065 0.7692308 0.0877193 0.7449857 1.3321168 0.1639344 FALSE 1 -0.1664824 0.0312740
ANTA CUSCO 3.6929899 2.4242424 0.3768853 1.7307692 0.2631579 0.9742120 2.1167883 0.2384501 FALSE 1 -0.0747819 0.0501428
CHUMBIVILCAS CUSCO 2.4831081 2.1212121 0.6804206 0.9615385 0.2631579 0.9455587 1.9708029 0.7749627 FALSE 1 -0.1068003 0.0597169
ESPINAR CUSCO 5.1478041 2.1212121 0.5286237 0.3846154 0.2631579 0.6303725 2.1350365 0.2533532 FALSE 1 -0.0588109 -0.0400416
CALCA CUSCO 3.5831926 2.1212121 0.5394774 0.9615385 0.3508772 1.0601719 1.4051095 0.4918033 FALSE 1 -0.0864888 0.0417004
QUISPICANCHI CUSCO 2.6815878 3.3333333 0.7025591 2.3076923 0.5263158 1.6332378 1.4598540 0.3278689 FALSE 1 -0.0461406 0.1512634
ANGARAES HUANCAVELICA 2.2445101 3.3333333 0.9350058 0.7692308 0.2631579 0.9455587 1.0401460 0.7153502 FALSE 1 -0.0935834 0.1205239
TAYACAJA HUANCAVELICA 3.0468750 6.0606061 1.3767937 1.5384615 0.3508772 2.2349570 1.6240876 1.3859911 FALSE 1 0.0153651 0.2277823
ACOBAMBA HUANCAVELICA 1.8813345 2.1212121 0.5030636 0.5769231 0.3508772 0.6876791 2.4452555 0.8047690 FALSE 1 -0.1278586 0.0398970
CHURCAMPA HUANCAVELICA 2.1326014 3.0303030 0.4805321 0.1923077 0.0877193 0.8309456 2.6094891 0.2682563 FALSE 1 -0.1234362 0.0603019
HUAYTARA HUANCAVELICA 3.8386824 4.5454545 0.4033391 0.5769231 0.1754386 0.3151862 2.9197080 0.5663189 FALSE 1 -0.0715572 0.0624422
CASTROVIRREYNA HUANCAVELICA 3.7119932 3.6363636 0.3776384 1.3461538 0.2631579 0.5730659 5.2554745 0.4470939 FALSE 1 -0.0567783 0.0234253
HUANCAVELICA HUANCAVELICA 4.3686655 5.4545455 3.1903856 0.9615385 1.5789474 2.2922636 3.4124088 0.5514158 FALSE 1 0.1272399 0.1354304
HUACAYBAMBA HUANUCO 2.0882601 0.9090909 0.1558767 0.9615385 0.3508772 0.2578797 3.1569343 0.6110283 FALSE 1 -0.1496374 -0.0199851
YAROWILCA HUANUCO 1.7124155 2.1212121 0.2025994 0.1923077 0.0877193 0.3151862 2.6642336 0.2831595 FALSE 1 -0.1601809 0.0115324
LAURICOCHA HUANUCO 4.2820946 1.8181818 0.1612975 0.7692308 0.0877193 0.2005731 3.4306569 0.4172876 FALSE 1 -0.0954306 -0.0511095
MARAÑON HUANUCO 2.3184122 1.2121212 0.2250995 0.7692308 0.0877193 0.2578797 3.3211679 0.3427720 FALSE 1 -0.1543948 -0.0289895
DOS DE MAYO HUANUCO 3.4923986 2.4242424 0.5538057 0.1923077 0.0877193 0.4871060 1.5145985 0.8792846 FALSE 1 -0.1092544 0.0382057
PUERTO INCA HUANUCO 3.5409628 1.2121212 0.3137495 0.9615385 0.0877193 0.3724928 5.7116788 0.5365127 FALSE 1 -0.1116782 -0.0786840
PACHITEA HUANUCO 1.1296453 0.9090909 0.3339622 1.1538462 0.0877193 0.5730659 4.2153285 0.2086438 FALSE 1 -0.1576959 -0.0380977
HUAMALIES HUANUCO 3.3467061 3.0303030 0.4949560 0.3846154 0.0877193 0.8022923 4.1058394 0.2831595 FALSE 1 -0.0900987 0.0130451
AMBO HUANUCO 3.2896959 2.1212121 0.4530070 0.5769231 0.2631579 0.7163324 2.4087591 0.4918033 FALSE 1 -0.1084146 0.0172010
CONCEPCION JUNIN 4.9472128 4.2424242 0.4520838 0.9615385 0.2631579 1.6905444 2.0437956 0.5365127 FALSE 1 0.0005404 0.0734113
BOLIVAR LA LIBERTAD 1.5920608 1.5151515 0.1243206 0.5769231 0.0877193 0.3151862 3.1934307 0.0894188 FALSE 1 -0.1666957 -0.0208596
JULCAN LA LIBERTAD 0.0000000 0.9090909 0.3013936 0.7692308 0.0000000 0.4011461 1.9525547 0.1490313 FALSE 1 -0.1903495 -0.0047588
GRAN CHIMU LA LIBERTAD 3.2263514 0.9090909 0.2805360 1.3461538 0.0877193 0.3724928 2.1532847 0.3725782 FALSE 1 -0.1327384 -0.0088759
SANTIAGO DE CHUCO LA LIBERTAD 2.8040541 2.1212121 0.4838657 0.9615385 0.0877193 0.8595989 2.4452555 0.4172876 FALSE 1 -0.1141563 0.0353158
PATAZ LA LIBERTAD 3.6592061 3.6363636 0.7918411 2.5000000 0.0877193 1.5472779 3.3029197 1.4008942 FALSE 1 -0.0102189 0.1185870
OTUZCO LA LIBERTAD 1.2394426 2.7272727 0.6119930 0.3846154 0.2631579 1.5759312 3.0839416 0.1043219 FALSE 1 -0.1058443 0.0610324
SANCHEZ CARRION LA LIBERTAD 1.4083615 2.1212121 1.0762831 0.5769231 0.4385965 1.6332378 1.4598540 0.6557377 FALSE 1 -0.0938467 0.0875520
FERREÑAFE LAMBAYEQUE 4.2947635 1.5151515 0.7788514 0.1923077 0.2631579 1.2034384 2.2080292 0.1788376 FALSE 1 -0.0744323 -0.0241813
LAMBAYEQUE LAMBAYEQUE 5.4476351 3.3333333 1.6298049 2.6923077 0.8771930 6.2177650 1.0218978 0.9388972 TRUE 1 0.1615209 0.1461696
CAJATAMBO LIMA 3.4818412 1.2121212 0.1580285 0.1923077 0.0877193 0.0573066 1.1496350 0.0745156 FALSE 1 -0.1536460 -0.0248174
PUTUMAYO LORETO 3.7858953 0.9090909 0.1046997 0.1923077 0.0877193 0.0000000 0.0000000 0.3278689 FALSE 1 -0.1544582 -0.0377108
REQUENA LORETO 3.3319257 3.0303030 0.6620637 1.9230769 0.0877193 0.2005731 2.1350365 0.5216095 FALSE 1 -0.0823254 0.0846941
LORETO LORETO 3.0384291 1.2121212 0.7905659 1.1538462 0.2631579 0.5730659 2.1897810 10.0000000 FALSE 1 -0.1583748 0.0313649
MARISCAL RAMON CASTILLA LORETO 2.7871622 0.9090909 0.5022235 0.7692308 0.0877193 0.8882521 4.0510949 0.5216095 FALSE 1 -0.1247725 -0.0376408
UCAYALI LORETO 3.8112331 1.5151515 0.9201091 0.7692308 0.1754386 0.6017192 3.4854015 0.8345753 FALSE 1 -0.0823791 -0.0258132
DATEM DEL MARAÑON LORETO 2.1157095 1.5151515 0.9052260 0.9615385 0.1754386 0.0573066 1.2773723 0.8941878 FALSE 1 -0.1376963 0.0423931
ALTO AMAZONAS LORETO 4.5650338 1.8181818 1.9133444 0.3846154 0.3508772 1.3180516 2.0255474 1.5648286 FALSE 1 -0.0099615 0.0208126
DANIEL ALCIDES CARRION PASCO 3.1756757 1.2121212 0.8074821 2.8846154 0.1754386 1.2320917 2.6824818 2.7272727 FALSE 1 -0.0707736 0.0568754
AYABACA PIURA 0.6376689 2.7272727 2.0777788 2.1153846 0.1754386 1.5186246 4.1240876 1.2071535 FALSE 1 -0.0299611 0.1159155
HUANCABAMBA PIURA 0.9543919 2.1212121 2.2617323 0.1923077 0.3508772 1.5472779 3.0474453 0.1490313 FALSE 1 -0.0702157 0.0579269
MORROPON PIURA 4.4826858 2.7272727 1.8586377 2.8846154 0.4385965 2.6361032 1.6605839 0.1937407 FALSE 1 0.0536779 0.1153504
MOHO PUNO 1.2816723 0.9090909 0.1757201 0.3846154 0.0877193 0.5157593 1.1861314 0.5961252 FALSE 1 -0.1834136 0.0060669
YUNGUYO PUNO 3.1862331 1.8181818 0.3627328 0.9615385 0.0877193 1.0601719 1.1313869 0.2086438 FALSE 1 -0.1175918 0.0333922
LAMPA PUNO 4.4594595 2.7272727 0.4227216 0.7692308 0.0877193 0.8595989 4.0328467 1.3412817 FALSE 1 -0.0469450 -0.0072791
HUANCANE PUNO 2.0692568 2.1212121 0.6641216 1.5384615 0.2631579 1.1174785 4.2883212 1.0283159 FALSE 1 -0.0857177 0.0383745
SANDIA PUNO 3.9717061 2.7272727 0.4063151 0.7692308 0.0877193 0.8882521 4.8905109 0.5216095 FALSE 1 -0.0661063 -0.0178186
MELGAR PUNO 4.4298986 2.4242424 0.7066764 0.9615385 0.1754386 1.6045845 2.8467153 2.2503726 FALSE 1 -0.0252635 0.0356503
CARABAYA PUNO 2.5506757 2.7272727 0.7239634 2.8846154 0.0877193 1.2320917 3.9781022 0.6706408 FALSE 1 -0.0606822 0.0820685
EL COLLAO PUNO 3.3720439 1.2121212 0.8964926 0.1923077 0.1754386 0.8882521 1.4781022 0.3576751 FALSE 1 -0.1164351 0.0012803
CHUCUITO PUNO 2.6520270 1.8181818 0.8388069 3.0769231 0.2631579 2.0916905 3.4489051 2.5186289 FALSE 1 -0.0395586 0.0942000
AZANGARO PUNO 2.1009291 4.2424242 1.3545234 0.9615385 0.5263158 2.2922636 0.9854015 0.6110283 FALSE 1 -0.0264771 0.1888878
HUALLAGA SAN MARTIN 3.9843750 1.5151515 0.4687620 0.7692308 0.0877193 0.4584527 6.3868613 0.8345753 FALSE 1 -0.0885673 -0.0840057
PICOTA SAN MARTIN 4.6283784 2.7272727 0.0859949 0.7692308 0.0877193 0.5157593 2.4270073 0.1937407 FALSE 1 -0.0733762 -0.0063833
EL DORADO SAN MARTIN 2.3500845 1.2121212 0.0740539 0.5769231 0.0877193 0.6590258 1.1861314 0.7004471 FALSE 1 -0.1589313 0.0148887
BELLAVISTA SAN MARTIN 4.2208615 1.5151515 0.5756478 0.5769231 0.1754386 0.7449857 1.4051095 0.5365127 FALSE 1 -0.0941842 -0.0130598
MARISCAL CACERES SAN MARTIN 4.7972973 1.2121212 0.7228186 0.5769231 0.5263158 0.8022923 2.6094891 0.2533532 FALSE 1 -0.0603694 -0.0597148
LAMAS SAN MARTIN 3.0553209 3.0303030 0.5412644 0.5769231 0.2631579 1.0601719 3.8868613 0.2384501 FALSE 1 -0.0834538 0.0323457
TARATA TACNA 4.4594595 2.1212121 0.0758040 0.9615385 0.0877193 0.2292264 2.8467153 0.1639344 FALSE 1 -0.0879843 -0.0329955
CANDARAVE TACNA 3.1271115 1.2121212 0.0706072 1.3461538 0.0000000 0.5157593 1.6423358 0.3129657 FALSE 1 -0.1357006 0.0073230
PURUS UCAYALI 2.7195946 0.0000000 0.1868693 0.1923077 0.0877193 0.0000000 1.3138686 0.0894188 FALSE 1 -0.1826085 -0.0208274
ATALAYA UCAYALI 2.2550676 0.9090909 0.6956571 0.5769231 0.0877193 0.1432665 5.4927007 0.4619970 FALSE 1 -0.1452874 -0.0673132
PADRE ABAD UCAYALI 4.6241554 1.8181818 1.5423307 0.1923077 0.0877193 0.5730659 3.3576642 0.3278689 FALSE 1 -0.0508622 -0.0437343
CHACHAPOYAS AMAZONAS 6.8222128 6.0606061 2.3896123 1.5384615 0.8771930 0.8882521 3.9598540 0.7153502 FALSE 2 0.1480829 0.0257448
BAGUA AMAZONAS 5.0971284 1.5151515 1.3144633 1.3461538 0.7017544 1.1461318 3.0839416 1.2965723 FALSE 2 0.0117567 -0.0207871
UTCUBAMBA AMAZONAS 5.2892736 1.8181818 1.3441005 1.5384615 0.7894737 1.7478510 2.9014599 1.7883756 FALSE 2 0.0462224 0.0107115
HUARMEY ANCASH 7.4936655 1.2121212 0.2161151 0.9615385 0.2631579 0.2578797 1.8795620 0.5812221 FALSE 2 -0.0071043 -0.1368637
CASMA ANCASH 7.1304899 0.9090909 0.3159000 0.3846154 0.3508772 0.3151862 1.6423358 0.1490313 FALSE 2 -0.0269145 -0.1466982
HUARAZ ANCASH 7.2402872 3.3333333 3.2880486 0.5769231 3.2456140 1.6618911 2.9379562 0.8643815 FALSE 2 0.2108605 -0.0125296
CONDESUYOS AREQUIPA 7.6435811 2.1212121 0.5081338 0.5769231 0.0877193 0.2005731 1.4963504 0.6408346 FALSE 2 0.0022009 -0.1070999
CASTILLA AREQUIPA 7.3184122 3.9393939 0.6143852 0.3846154 0.1754386 0.5157593 1.8065693 0.1490313 FALSE 2 0.0248030 -0.0448626
CARAVELI AREQUIPA 8.3804899 3.6363636 0.2471948 0.3846154 0.1754386 0.6876791 1.8795620 0.5514158 FALSE 2 0.0386694 -0.0739105
ISLAY AREQUIPA 8.6845439 1.5151515 0.7066489 0.7692308 0.5263158 1.0028653 5.1459854 0.2086438 FALSE 2 0.0567107 -0.2049163
CAMANA AREQUIPA 8.5409628 2.1212121 0.7429314 3.8461538 0.7017544 1.0028653 6.1678832 1.6095380 FALSE 2 0.1219647 -0.1392381
CAYLLOMA AREQUIPA 7.7956081 5.7575758 1.2728146 1.3461538 0.5263158 1.1461318 2.3175182 0.4769001 FALSE 2 0.1156799 0.0161580
JAEN CAJAMARCA 5.8023649 3.3333333 1.9425682 1.3461538 1.3157895 3.8968481 4.2153285 0.2682563 FALSE 2 0.1570701 0.0303968
URUBAMBA CUSCO 6.7229730 1.8181818 0.3934424 1.1538462 0.7017544 1.3753582 1.9708029 0.2086438 FALSE 2 0.0253720 -0.0712663
CANCHIS CUSCO 5.2491554 2.1212121 1.1941971 0.7692308 0.6140351 1.3180516 1.6788321 0.1937407 TRUE 2 -0.0041818 -0.0044205
LA CONVENCION CUSCO 4.8754223 3.9393939 1.6439002 0.5769231 1.1403509 2.0916905 4.6532847 0.2980626 FALSE 2 0.0738153 0.0348330
LEONCIO PRADO HUANUCO 5.9206081 2.7272727 1.3311975 1.1538462 1.3157895 1.3467049 1.1313869 0.3129657 FALSE 2 0.0579266 0.0176059
PALPA ICA 8.1925676 1.2121212 0.4365651 0.9615385 0.0877193 0.4297994 3.9416058 0.2980626 FALSE 2 0.0120977 -0.1955207
NASCA ICA 8.2981419 1.2121212 0.5300680 0.7692308 0.8771930 1.0888252 4.0510949 0.6855440 FALSE 2 0.0584859 -0.1805214
PISCO ICA 7.4852196 2.1212121 0.8649492 0.3846154 0.8771930 1.5472779 2.9197080 0.3725782 FALSE 2 0.0668168 -0.1015592
CHINCHA ICA 7.7850507 3.0303030 1.3431221 5.3846154 1.5789474 2.3782235 4.6167883 1.3263785 FALSE 2 0.2132257 -0.0290864
JUNIN JUNIN 4.4742399 0.9090909 0.2927763 0.3846154 0.2631579 0.8309456 10.0000000 0.2831595 TRUE 2 -0.1039103 -0.1506997
YAULI JUNIN 8.8112331 2.7272727 0.2286483 0.3846154 0.2631579 0.9169054 4.2518248 0.2980626 FALSE 2 0.0474471 -0.1582655
CHUPACA JUNIN 6.1380912 2.4242424 0.3999545 0.5769231 0.2631579 1.0888252 2.3722628 0.6259314 FALSE 2 -0.0057911 -0.0486813
JAUJA JUNIN 5.9332770 10.0000000 0.8899343 2.6923077 0.2631579 2.8653295 4.4343066 1.3561848 FALSE 2 0.1462688 0.1107724
TARMA JUNIN 5.4455236 2.4242424 1.1612054 0.7692308 0.7894737 1.5186246 4.9817518 0.9538003 FALSE 2 0.0431731 -0.0438130
CHANCHAMAYO JUNIN 5.4687500 1.5151515 1.5121624 1.9230769 1.3157895 1.6905444 3.1204380 0.9687034 FALSE 2 0.0690579 -0.0096158
SATIPO JUNIN 3.6782095 2.4242424 1.8983150 0.5769231 0.8771930 1.4040115 4.2153285 1.9225037 TRUE 2 0.0046526 0.0363702
CHEPEN LA LIBERTAD 7.1600507 0.6060606 0.5486172 0.9615385 0.2631579 1.5472779 2.0072993 1.0283159 FALSE 2 0.0255616 -0.1048682
VIRU LA LIBERTAD 5.9248311 0.6060606 0.7997214 0.7692308 0.3508772 0.6590258 4.7992701 0.2533532 FALSE 2 -0.0233592 -0.1500661
PACASMAYO LA LIBERTAD 7.5929054 1.2121212 0.5811607 0.5769231 0.3508772 1.4326648 6.0036496 0.1639344 FALSE 2 0.0421905 -0.2014728
ASCOPE LA LIBERTAD 7.7132601 2.1212121 0.6345086 2.3076923 0.8771930 1.5759312 2.9197080 0.3129657 FALSE 2 0.0905580 -0.0738526
CAÑETE LIMA 9.8184122 4.5454545 2.2936847 0.5769231 2.2807018 1.2320917 4.2518248 0.2235469 FALSE 2 0.2039159 -0.0790849
OYON LIMA 7.5464527 1.5151515 0.1606239 1.3461538 0.1754386 0.6590258 0.5474453 1.8181818 FALSE 2 0.0110403 -0.0951078
YAUYOS LIMA 4.7930743 9.6969697 0.3156053 0.7692308 0.1754386 1.1747851 3.4306569 0.5365127 TRUE 2 -0.0059744 0.0803514
HUAROCHIRI LIMA 7.0164696 9.3939394 0.8338487 0.1923077 2.2807018 1.4040115 3.1569343 0.1341282 FALSE 2 0.1437468 0.0077190
BARRANCA LIMA 8.6803209 1.2121212 1.1044422 0.9615385 0.9649123 1.5472779 3.8686131 0.6557377 FALSE 2 0.0978490 -0.1583108
HUARAL LIMA 8.7119932 3.3333333 1.3386804 1.3461538 0.9649123 1.6332378 2.5364964 1.0730253 FALSE 2 0.1443768 -0.0298282
HUAURA LIMA 9.1089527 3.3333333 2.4273604 1.5384615 1.9298246 2.2349570 3.5583942 1.0730253 FALSE 2 0.2319494 -0.0300899
CANTA LIMA 7.3648649 1.8181818 0.3495496 0.3846154 0.0000000 2.1776504 3.0839416 0.4172876 FALSE 2 0.0408718 -0.1133247
TAHUAMANU MADRE DE DIOS 8.9695946 0.6060606 0.2553673 0.1923077 0.2631579 0.1146132 8.1569343 0.1788376 FALSE 2 0.0041724 -0.3053877
MANU MADRE DE DIOS 7.9159628 0.9090909 0.2167568 0.7692308 0.2631579 0.0573066 3.0109489 1.1326379 FALSE 2 0.0043843 -0.1757260
TAMBOPATA MADRE DE DIOS 8.4227196 0.6060606 2.4704569 1.3461538 1.9298246 1.0601719 7.3722628 0.8792846 FALSE 2 0.1659537 -0.2071911
GENERAL SANCHEZ CERRO MOQUEGUA 6.5730574 3.0303030 0.4432868 0.9615385 0.1754386 0.4584527 2.7372263 0.5514158 FALSE 2 0.0067569 -0.0501265
ILO MOQUEGUA 9.8437500 0.6060606 0.7928416 2.5000000 0.9649123 0.9742120 2.7189781 1.0432191 FALSE 2 0.0923129 -0.1403786
MARISCAL NIETO MOQUEGUA 10.0000000 1.8181818 2.1836978 1.3461538 1.3157895 1.5472779 1.4781022 0.2235469 FALSE 2 0.1429332 -0.0893730
OXAPAMPA PASCO 4.3961149 2.1212121 1.6500073 1.9230769 0.4385965 1.4613181 4.0510949 0.7302534 TRUE 2 0.0150968 0.0230339
PASCO PASCO 6.8813345 3.6363636 2.3677807 0.9615385 1.4035088 2.5501433 2.3722628 0.1639344 FALSE 2 0.1622314 0.0210588
SECHURA PIURA 5.2301520 1.5151515 0.0000000 1.1538462 0.1754386 0.9169054 1.8613139 0.2980626 TRUE 2 -0.0578393 -0.0463599
PAITA PIURA 6.9277872 1.8181818 1.6437453 0.9615385 0.3508772 1.1461318 2.5364964 0.6706408 FALSE 2 0.0531555 -0.0701880
TALARA PIURA 7.7048142 1.5151515 0.9545931 1.1538462 1.0526316 0.9455587 4.2700730 0.2384501 FALSE 2 0.0689489 -0.1564462
SAN ANTONIO DE PUTINA PUNO 5.9184966 1.2121212 0.2705909 0.5769231 0.1754386 0.4297994 2.3905109 0.1192250 TRUE 2 -0.0561982 -0.1093105
SAN ROMAN PUNO 7.1579392 1.2121212 2.0914792 0.7692308 1.7543860 2.4068768 3.6131387 0.6408346 FALSE 2 0.1421678 -0.1020074
TOCACHE SAN MARTIN 6.0388514 1.5151515 0.9420943 1.3461538 0.3508772 1.0888252 1.7700730 0.5812221 FALSE 2 0.0034807 -0.0443836
RIOJA SAN MARTIN 5.2533784 2.4242424 0.8416762 1.1538462 0.7017544 1.9197708 4.2335766 0.6110283 FALSE 2 0.0337115 -0.0184016
MOYOBAMBA SAN MARTIN 5.6735642 1.5151515 2.4799069 1.3461538 1.1403509 1.6332378 3.4306569 0.8792846 FALSE 2 0.0876015 -0.0318564
SAN MARTIN SAN MARTIN 8.1904561 3.9393939 2.5157490 1.3461538 1.6666667 1.9770774 2.6277372 0.9538003 FALSE 2 0.2070880 0.0053759
JORGE BASADRE TACNA 9.7276182 0.6060606 0.1829486 0.9615385 0.0000000 0.2005731 2.2810219 0.9836066 FALSE 2 0.0093451 -0.1874005
CONTRALMIRANTE VILLAR TUMBES 6.8538851 0.6060606 0.2692679 0.1923077 0.2631579 0.6017192 4.7810219 1.1922504 FALSE 2 -0.0087357 -0.1878742
ZARUMILLA TUMBES 6.1127534 0.9090909 0.4052380 0.5769231 0.4385965 0.3438395 3.1021898 0.1937407 FALSE 2 -0.0400808 -0.1338336
TUMBES TUMBES 7.8230574 1.5151515 2.6821262 1.9230769 2.0175439 1.9484241 4.9452555 0.5514158 FALSE 2 0.1944668 -0.1159684
SANTA ANCASH 8.3530405 2.4242424 3.1640823 3.4615385 4.4736842 3.5816619 2.2445255 0.8047690 FALSE 3 0.3121786 0.0061132
ABANCAY APURIMAC 6.3703547 2.4242424 2.4979682 1.7307692 1.8421053 1.9770774 1.2956204 0.9836066 TRUE 3 0.1481596 0.0368652
HUAMANGA AYACUCHO 5.6967905 4.5454545 3.9521263 0.7692308 2.8947368 3.8108883 3.2116788 0.5514158 FALSE 3 0.2355437 0.0936466
CAJAMARCA CAJAMARCA 6.6680743 3.3333333 4.0985441 2.3076923 3.2456140 4.8424069 6.2408759 1.1475410 FALSE 3 0.3328072 0.0269458
PROV, CONSTITUCIONAL DEL CALLAO CALLAO 8.8809122 1.5151515 7.6740478 0.0000000 6.5789474 6.1031519 2.9014599 0.2384501 FALSE 3 0.3924062 -0.1231639
CUSCO CUSCO 9.4108953 2.1212121 7.0441163 1.1538462 5.6140351 2.9512894 2.5182482 0.7600596 FALSE 3 0.3531879 -0.0570713
HUANUCO HUANUCO 6.5266047 3.6363636 4.0528655 0.7692308 2.6315789 2.9226361 2.9744526 0.9388972 FALSE 3 0.2349061 0.0432199
ICA ICA 8.8703547 3.9393939 3.8854928 0.7692308 3.0701754 3.6962751 1.3686131 0.6110283 FALSE 3 0.2981092 0.0249510
HUANCAYO JUNIN 7.5274493 8.1818182 5.6806701 1.5384615 5.0877193 4.9283668 0.9671533 1.6095380 FALSE 3 0.4322030 0.1707246
TRUJILLO LA LIBERTAD 8.8745777 3.0303030 6.7379135 3.4615385 7.3684211 6.1318052 1.6423358 1.2667660 FALSE 3 0.4747959 0.0715498
CHICLAYO LAMBAYEQUE 7.5717905 5.7575758 6.5705548 0.9615385 7.1052632 5.7020057 2.0072993 0.1043219 FALSE 3 0.4256322 0.1007723
MAYNAS LORETO 7.2677365 3.0303030 6.9426535 3.0769231 2.7192982 5.0429799 4.3065693 0.4619970 FALSE 3 0.3648828 0.0165479
SULLANA PIURA 6.8116554 2.1212121 2.7382198 2.1153846 2.1052632 4.0401146 2.0620438 1.1773472 FALSE 3 0.2200220 0.0289301
PIURA PIURA 7.3754223 2.7272727 8.1490762 1.5384615 5.5263158 6.6475645 5.8941606 0.4321908 FALSE 3 0.4277960 -0.0463117
PUNO PUNO 6.8201014 4.2424242 3.5838275 2.5000000 1.9298246 3.5816619 2.4270073 1.5052161 FALSE 3 0.2688662 0.1071990
TACNA TACNA 8.1989020 3.0303030 4.3472132 2.5000000 3.0701754 3.2951289 5.0000000 0.9836066 FALSE 3 0.3293176 -0.0257969
CORONEL PORTILLO UCAYALI 6.4168074 1.8181818 5.1954510 1.9230769 2.8070175 2.8366762 1.7700730 0.2831595 FALSE 3 0.2260151 0.0208606
AREQUIPA AREQUIPA 9.4953547 8.4848485 10.0000000 10.0000000 10.0000000 10.0000000 6.2226277 2.1460507 FALSE 4 0.7663069 0.0891304
library(openxlsx)
## Warning: package 'openxlsx' was built under R version 4.2.1
write.xlsx(datitos_ordenado, file = "~/ENTREGA 4/datitos_ordenado (1).xlsx" )
## Warning in file.create(to[okay]): cannot create file '~/ENTREGA
## 4/datitos_ordenado (1).xlsx', reason 'No such file or directory'

3.7. Conclusiones

Para interpretar cada clúster en el resultado de la jerarquización aglomerativa con k=4, considerando las variables estandarizadas (idh, distritos, pim, comisarias, judicial, educonec, estadolocal y hospital), podemos analizar las características de las provincias en cada clúster:

Cluster 1: Este clúster está compuesto por una amplia variedad de provincias, abarcando diferentes regiones del país. Se caracteriza por tener valores bajos en las variables analizadas. Las provincias de este clúster se encuentran en un nivel bajo de desarrollo humano y presentan pocos distritos, presupuesto institucional, comisarías, dependencias judiciales, colegios con acceso a internet, locales educativos en buen estado y hospitales. Estas provincias podrían requerir una mayor inversión y desarrollo en diversos aspectos para mejorar su calidad de vida y bienestar.

Cluster 2: Este clúster está conformado por provincias que presentan valores moderados en las variables analizadas. Las provincias en este clúster muestran un nivel intermedio de desarrollo humano y cuentan con una cantidad moderada de distritos, presupuesto institucional, comisarías, dependencias judiciales, colegios con acceso a internet, locales educativos en buen estado y hospitales. Aunque no tienen los niveles más altos en estas variables, muestran un nivel de desarrollo aceptable y podrían beneficiarse de inversiones adicionales para mejorar aún más.

Cluster 3: Este clúster está compuesto por provincias que presentan valores altos en las variables analizadas. Las provincias en este clúster se destacan por tener un alto nivel de desarrollo humano y contar con un mayor número de distritos, presupuesto institucional, comisarías, dependencias judiciales, colegios con acceso a internet, locales educativos en buen estado y hospitales. Estas provincias muestran un mayor nivel de desarrollo en comparación con los clústeres anteriores y tienen una infraestructura institucional y social más sólida.

Cluster 4: Este clúster está compuesto por una única provincia, Arequipa. Esta provincia se distingue de las demás al tener los valores más altos en las variables analizadas. Arequipa muestra un nivel de desarrollo humano muy alto y cuenta con una mayor cantidad de distritos, presupuesto institucional, comisarías, dependencias judiciales, colegios con acceso a internet, locales educativos en buen estado y hospitales. Es considerada una de las provincias más desarrolladas en el país.

Es importante tener en cuenta que esta interpretación se basa únicamente en los resultados de la jerarquización aglomerativa y en las variables proporcionadas. Para obtener una comprensión más completa del desarrollo y las características de cada provincia, es necesario realizar análisis más detallados y considerar otras variables relevantes.

Los valores que se encuentran dentro de cada clúster son los siguientes:

Cluster 1: “ANDAHUAYLAS”, “ANTABAMBA”, “AYMARAES”, “CHINCHEROS”, “COTABAMBAS”, “GRAU”, “ACOBAMBA”, “ACOMAYO”, “AIJA”, “ALTO AMAZONAS”, “AMBO”, “ANGARAES”, “ANTA”, “ANTONIO RAIMONDI”, “ASUNCION”, “ATALAYA”, “AYABACA”, “AZANGARO”, “BELLAVISTA”, “BOLIVAR”, “BOLOGNESI”, “BONGARA”, “CAJABAMBA”, “CAJATAMBO”, “CALCA”, “CANAS”, “CANDARAVE”, “CANGALLO”, “CARABAYA”, “CARHUAZ”, “CARLOS FERMIN FITZCARRALD”, “CASTROVIRREYNA”, “CELENDIN”, “CHOTA”, “CHUCUITO”, “CHUMBIVILCAS”, “CHURCAMPA”, “CONCEPCION”, “CONDORCANQUI”, “CONTUMAZA”, “CORONGO”, “CUTERVO”, “DANIEL ALCIDES CARRION”, “DATEM DEL MARAÑON”, “DOS DE MAYO”, “EL COLLAO”, “EL DORADO”, “ESPINAR”, “FERREÑAFE”, “GRAN CHIMU”, “HUACAYBAMBA”, “HUALGAYOC”, “HUALLAGA”, “HUAMALIES”, “HUANCA SANCOS”, “HUANCABAMBA”, “HUANCANE”, “HUANCAVELICA”, “HUANTA”, “HUARI”, “HUAYLAS”, “HUAYTARA”, “JULCAN”, “LA MAR”, “LA UNION”, “LAMAS”, “LAMBAYEQUE”, “LAMPA”, “LAURICOCHA”, “LORETO”, “LUCANAS”, “LUYA”, “MARAÑON”, “MARISCAL CACERES”, “MARISCAL LUZURIAGA”, “MARISCAL RAMON CASTILLA”, “MELGAR”, “MOHO”, “MORROPON”, “OCROS”, “OTUZCO”, “PACHITEA”, “PADRE ABAD”, “PALLASCA”, “PARINACOCHAS”, “PARURO”, “PATAZ”, “PAUCAR DEL SARA SARA”, “PAUCARTAMBO”, “PICOTA”, “POMABAMBA”, “PUERTO INCA”, “PURUS”, “PUTUMAYO”, “QUISPICANCHI”, “RECUAY”, “REQUENA”, “RODRIGUEZ DE MENDOZA”, “SAN IGNACIO”, “SAN MARCOS”, “SAN MIGUEL”, “SAN PABLO”, “SANCHEZ CARRION”, “SANDIA”, “SANTA CRUZ”, “SANTIAGO DE CHUCO”, “SIHUAS”, “SUCRE”, “TARATA”, “TAYACAJA”, “UCAYALI”, “VICTOR FAJARDO”, “VILCAS HUAMAN”, “YAROWILCA”, “YUNGAY”, “YUNGUYO”.

Cluster 2: “ASCOPE”, “BAGUA”, “BARRANCA”, “CAMANA”, “CANCHIS”, “CANTA”, “CAÑETE”, “CARAVELI”, “CASMA”, “CASTILLA”, “CAYLLOMA”, “CHACHAPOYAS”, “CHANCHAMAYO”, “CHEPEN”, “CHINCHA”, “CHUPACA”, “CONDESUYOS”, “CONTRALMIRANTE VILLAR”, “GENERAL SANCHEZ CERRO”, “HUARAL”, “HUARAZ”, “HUARMEY”, “HUAROCHIRI”, “HUAURA”, “ILO”, “ISLAY”, “JAEN”, “JAUJA”, “JORGE BASADRE”, “JUNIN”, “LA CONVENCION”, “LEONCIO PRADO”, “MANU”, “MARISCAL NIETO”, “MOYOBAMBA”, “NASCA”, “OXAPAMPA”, “OYON”, “PACASMAYO”, “PAITA”, “PALPA”, “PASCO”, “PISCO”, “RIOJA”, “SAN ANTONIO DE PUTINA”, “SAN MARTIN”, “SAN ROMAN”, “SATIPO”, “SECHURA”, “TAHUAMANU”, “TALARA”, “TAMBOPATA”, “TARMA”, “TOCACHE”, “TUMBES”, “URUBAMBA”, “UTCUBAMBA”, “VIRU”, “YAULI”, “YAUYOS”, “ZARUMILLA”.

Cluster 3

“ABANCAY”, “CAJAMARCA”, “CHICLAYO”, “CORONEL PORTILLO”, “CUSCO”, “HUAMANGA”, “HUANCAYO”, “HUANUCO”, “ICA”, “MAYNAS”, “PIURA”, “CALLAO”, “PUNO”, “SANTA”, “SULLANA”, “TACNA”, “TRUJILLO”.

Cluster 4: “AREQUIPA”.

4. Bibliografía

Augusto, María Claudia, Eduardo Dargent y Stephanie Rousseau. “Más allá de la capacidad estatal: sociedad civil e implementación de políticas a nivel subnacional en Cusco y San Martín (Perú)”. Colombia Internacional, (90): 99-125.

Bersch, Katherine, Sergio Praza y Mathew Taylor (2017) “Bureaucratic Capacity and Political Autonomy within National States: Mapping the Archipielago of Excelence in Brazil”. En Centeno, Miguel, Atul Kohli y Deborah Yashar, States in the Developing World. Cambridge: Cambridge University Press, pp. 157-183.

Boone, Catherine (2012). Política territorial y el alcance del Estado: Irregularidad por diseño. Revista Ciencia Política 32(3): 623-641.

Censo Escolar - ESCALE - Unidad de Estadística Educativa. (2017). Gob.pe. http://escale.minedu.gob.pe/censo-escolar/-/document_library_display/oJ44/view/4028089;jsessionid=c01263291652b023a5c6c74fe1e2

CEPLAN (2020).Informe Nacional del Perú 2020: la protección de la Vida en la Emergencia y después. https://www.ceplan.gob.pe/informe-nacional/

Cerna, Diego, Luis García, Félix Puémape, Mauricio Rentería, Lucila Rozas y Paolo Sosa (2017). Acá no hay ventanillas. La burocracia de la calle en los programas sociales. Lima: IEP.

Constitución Política del Perú (1993). Constitución Política del Perú 1993. El Peruano.

Cutillas, E. (2017). Distribución mundial de la población con discapacidades en relación con los patrones geográficos del desarrollo humano. Documents d’anàlisi geogràfica, 63(1), 0029-53.

Dammert, L. (2007). Perspectivas y dilemas de la seguridad ciudadana en América Latina (Vol. 2). Flacso-Sede Ecuador.

Dargent, Eduardo, Andreas Feldman y Juan Pablo Luna (2017). Greater State Capacity, Lesser Stateness: Lessons from the Peruvian Commodity Boom. Politics & Society 54(1): 3-34

Evans, Peter, Evelyne Huber y John Stephens (2017). “The Political Foundations of State Efectiveness”. En Centeno, Miguel, Atul Kohli y Deborah Yashar, States in the Developing World. Cambridge: Cambridge University Press, pp. 380-408.

Fukuyama, F. (2004). State Building. Governance and World Order in the Twenty-First Century, Profile Books, Londres

Fukuyama, Francis (2004). La construcción del Estado: Hacia un nuevo orden mundial en el siglo XXI. Barcelona: Ediciones B.

Fukuyama, Francis (2004). La construcción del Estado: Hacia un nuevo orden mundial en el siglo XXI. Barcelona: Ediciones B.

Herbst, Jeffrey I. (2000). States and Power in Africa: Comparative lessons in authority and control. New Jersey: Princeton University Press.

INEI (2013). “Territorios y suelos”. En Perú: Anuario de Estadísticas Ambientales 2013. https://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1140/cap01.pdf

INEI (2017). Censo Nacional de Comisarias (CENACOM). https://www.datitosabiertos.gob.pe/dataset/censo-nacional-de-comisarias-cenacom-2017-instituto-nacional-de-estad%C3%ADstica-e-inform%C3%A1tica

INEI (2020). Registro Nacional de Municipalidades (RENAMU). https://www.datitosabiertos.gob.pe/dataset/registro-nacional-de-municipalidades-renamu-2020-instituto-nacional-de-estad%C3%ADstica-e

Kurtz, Marcus (2013) Latin American State Building in Comparative Perspective: Social Foundations of Instiutional Order. New York: Cambridge University Press.

Migdal, J. S. (1988). Strong societies and weak states: state-society relations and state capabilities in the Third World. Princeton University Press.

Ministerio de Economía y Finanzas. (2020). Guía de Orientación del Ciudadano del Proyecto de Ley del Presupuesto Público 2021. https://www.gob.pe/institucion/mef/campa%C3%B1as/2181-guia-deorientacion-del-ciudadano-del-proyecto-de-ley-del-presupuesto-publico-2021 Ministerio de Economía y Finanzas. (2020). Guía de Orientación del Ciudadano del Proyecto de Ley del Presupuesto Público 2021. https://www.gob.pe/institucion/mef/campa%C3%B1as/2181-guia-deorientacion-del-ciudadano-del-proyecto-de-ley-del-presupuesto-publico-2021 OpenDataSoft (2023). Distritos del Perú. https://bogota-laburbano.opendatasoft.com/explore/dataset/distritos-peru/table/

Peña, C. (2022). Infraestructura educativa y cierre de brechas. Revista Idep. https://revistas.idep.edu.co/index.php/mau/article/view/2751/2206

Peña, C. (2022). Infraestructura educativa y cierre de brechas. Revista Idep. https://revistas.idep.edu.co/index.php/mau/article/view/2751/2206

Poder Judicial (2021). Mapas y dependencias judiciales a nivel nacional por distrito judicial. https://www.pj.gob.pe/wps/wcm/connect/0657f40046813a98bdb3bd76dd7c9e83/Mapasdependenciasdic2021.pdf?MOD=AJPERES&CACHEID=0657f4004613a98bdb3bd76dd7c9e83

Pol Ulecia, M. A. (2008). Desarrollo Humano y territorio: Una aproximación metodológica. Universidad de Alicante.

Schwab, K. (2017). La cuarta revolución industrial. Debate

Scott, J. C. (1998). “Cities, People, and Language”. En Seeing like a state: How certain schemes to improve the human condition have failed. Yale University Press.

Solís, R., Sánchez, S. E., Carrión, M., Samatelo, E., Rodríguez-Zubiate, R., & Rodríguez, M. (2009). Cobertura de seguros de salud en relación con el uso de servicios médicos, condiciones de vida y percepción de la salud en Lima, Perú. Revista Peruana de Medicina Experimental y Salud Publica, 26(2), 136-144.

Solís, R., Sánchez, S. E., Carrión, M., Samatelo, E., Rodríguez-Zubiate, R., & Rodríguez, M. (2009). Cobertura de seguros de salud en relación con el uso de servicios médicos, condiciones de vida y percepción de la salud en Lima, Perú. Revista Peruana de Medicina Experimental y Salud Publica, 26(2), 136-144.

Sullivan, Heather (2018). Sticks, Stones, and Broken Bones: Protest Violence and the State. Journal of Conflict Resolution 63 (3): 700-726.

Sullivan, Heather (2018). Sticks, Stones, and Broken Bones: Protest Violence and the State. Journal of Conflict Resolution 63 (3): 700-726.

Taylor, Brian. (2011). State Building in Putin’s Russia. Policing and Coercion after Communism. New York, NY.: Cambridge University Press.

Tilly, C. (1991). War and state power. Middle East Report, 38-40.

Trinidad, R. (2003). La tecnología¿ solución para mejorar la calidad educativa rural? Un análisis del Proyecto de Educación a Distancia (EDIST). IEP.

Universidad del Pacífico (2020). Reporte del Índice de Desarrollo Humano distrital del Perú 2019 del Programa de las Naciones Unidas para el Desarrollo -PNUD. https://www.up.edu.pe/egp/programas-especializacion_copy(1)/SiteAssets/Lists/Observatorio/AllItems/Informe%20de%20Evidencia%20IDH%202019.pdf

Yufra, S., & Huerta, P. E. (2019). Reto de la Igualdad: Una lectura de las dinámicas territoriales en el Perú. Lima: Programa de las Naciones Unidas para el Desarrollo. https://www.undp.org/sites/g/files/zskgke326/files/migration/pe/896b1c8abc283aa2909892ebcc0201997a3bcf200795a9baa7e50855128b271a.pdf

Ziblatt, Daniel (2004). “Rethinking the origins of Federalism: Puzzle, Theory and Evidence from Nineteenth-Century Europe”. World Politics 57: 70-98.