1. Introducción

Column

Mapa del Índice de Desarrollo Humano por país

Reading layer `CNTR_RG_20M_2024_3035' from data source 
  `C:\Users\lenovo\Downloads\CNTR_RG_20M_2024_3035.shp.zip' using driver `ESRI Shapefile'
Simple feature collection with 260 features and 11 fields
Geometry type: MULTIPOLYGON
Dimension:     XY
Bounding box:  xmin: -7142163 ymin: -9185875 xmax: 16933500 ymax: 15428170
Projected CRS: ETRS89-extended / LAEA Europe

Column

Introducción

  • Problema observado:

En la Ciencia Política, cuando se estudia Teoría del Estado, resulta ser un tema interesante la formación y la construcción estatal, es decir, el constante proceso de reconfiguración de los límites territoriales de los estados, y la tarea organizadora de estos mismos por llevar y construir sistemas de instituciones desplegándolas a lo largo y amplio de su territorio. Charles Tilly, en “Coerción, Capital y los Estados europeos 990-1990”, postula que la preparación para la guerra y la guerra en sí misma significaban a su vez el mayor incentivo de supervivencia para la construcción estatal de los Estados modernos europeos, lo que trajo como consecuencia, en la mayoría de los casos, Estados más fuertes, más institucionalizados y con mayor alcance. Esta lógica se refleja en la ya conocida frase: “El Estado hace la guerra y la guerra hace al Estado.”

  • Pregunta de investigación:

¿De qué manera se relacionan el gasto militar, la extensión territorial, la cantidad poblacional y la criminialidad,medida a través de homicidios intencionales, de un determinado país con su nivel de desarrollo humano?

  • Hipótesis:

Los países con mayor territorio, mayor población y que gastan más en Defensa tendrán mayor valor numérico en su Índice del Desarrollo Humano. Es decir, estas variables afectan directamente proporcional al IDH. Además, la criminialidad,medida a través de homicidios intencionales,afectará inversamente proporcional al IDH.

2. Variable Dependiente

Column {data-width=500}

Diagrama de barras según la frecuencia del nivel categórico del IDH

Boxplot

Column

Tabla de frecuencias


    ALTO     BAJO    MEDIO MUY ALTO 
      38       29       32       61 

El proyecto inicial tuvo 195 países reconocidos por la ONU. Sin embargo, algunos no registraban datos requeridos. Por ello, nos quedamos con 160 países. Los países eliminados, en su mayoría, eran islas y países africanos pequeños que registraban niveles BAJO y MEDIO.

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.3800  0.6008  0.7445  0.7262  0.8562  0.9670 

Esta variable dependiente es ascendente y tiene como escala del 0 al 1. A mayor puntaje, mejor es el IDH.

SOMALIA posee el menor IDH con 0.38 calificando como BAJO.

SUIZA posee el mayor IDH con 0.967 calificando MUY ALTO.

La MEDIA es 0.7262 que calificaría como ALTO. Los paises situados aproximadamente en esta categoría son UZBEKISTAN, VIETNAM y LIBANO.

3. Variables Independientes y su correlación con el IDH

Column {data-width=600}

Superficie (km²)

Población

Cantidad de Ojivas nucleares

Gasto en Defensa (% del PBI)

Homicidios Intencionales por 100.000 habitantes

Column {data-width=400}

Superficie (km²)


    Pearson's product-moment correlation

data:  miproyecto$`Índice de desarrollo humano` and miproyecto$`Superficie (km²)`
t = 1.167, df = 158, p-value = 0.245
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.06362627  0.24410253
sample estimates:
       cor 
0.09244511 

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos.

Muchos países que tienen poca extensión territorial pueden tener un IDH ALTO, como BAJO.

Población


    Pearson's product-moment correlation

data:  miproyecto$`Índice de desarrollo humano` and miproyecto$`Población  ​`
t = -0.27549, df = 158, p-value = 0.7833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1764702  0.1337018
sample estimates:
        cor 
-0.02191145 

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos.

Muchos países que tienen poca población pueden tener un IDH ALTO, como BAJO.

Cantidad de Ojivas Nucleares


    Pearson's product-moment correlation

data:  miproyecto$`Cantidad de ojivas` and miproyecto$`Índice de desarrollo humano`
t = 1.3687, df = 158, p-value = 0.173
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.04771473  0.25905328
sample estimates:
      cor 
0.1082454 

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos.

Lo que sí se cumple es que los dos países con más ojivas nucleares poseen un IDH MAYOR a 0.8, es decir tienen un MUY ALTO nivel de IDH.

Gasto en Defensa (% del PBI)


    Pearson's product-moment correlation

data:  miproyecto$`Gasto Defensa (%PIB)` and miproyecto$`Índice de desarrollo humano`
t = 0.0026851, df = 158, p-value = 0.9979
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1549503  0.1553672
sample estimates:
        cor 
0.000213619 

Al ser las dos variables numéricas utilizo la Prueba R de Pearson. El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos

Sin embargo, en las anteriores pruebas de correlaciones ESTADOS UNIDOS, CHINA, INDIA, CANADÁ y RUSSIA eran valores atípicos que rompían la NO CORRELACIÓN, es decir, estos países tienen relación directamente proporcional con la variable dependiente. Pero en este caso, estos países se camuflan dentro de la NO CORRELACIÓN.

ALGUNOS PAÍSES CON MEJOR IDH NO NECESARIAMENTE GASTAN MÁS EN DEFENSA.

El país que gasta más en defensa es UCRANIA, que desde el 2022 fue invadido por Rusia.

Homicidios Intencionales por 100.000 habitantes


    Pearson's product-moment correlation

data:  miproyecto$`Homicidios por 100.000` and miproyecto$`Índice de desarrollo humano`
t = -3.3738, df = 158, p-value = 0.0009326
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.3983671 -0.1084342
sample estimates:
       cor 
-0.2592315 

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es menor a 0.05, entonces SÍ EXISTE CORRELACIÓN entre ellas dos. La correlación es inversa,es decir, A MENOR NÚMERO DE HOMICIDIOS INTENCIONALES POR 100.000 HABITANTES QUE REGISTREN EN UN PAÍS, MAYOR SERÁ SU NIVEL DE IDH.

4. Regresiones Gaussianas

Column {data-width=500}

1) ¿Afecta la extensión territorial y la cantidad poblacional en el IDH?


Call:
lm(formula = modelo1, data = miproyecto)

Residuals:
     Min       1Q   Median       3Q      Max 
-2.16491 -0.76411  0.05769  0.82478  1.53218 

Coefficients:
                            Estimate Std. Error t value Pr(>|t|)
(Intercept)                4.763e-18  7.903e-02   0.000    1.000
scale(`Superficie (km²)`)  1.251e-01  8.786e-02   1.424    0.156
scale(`Población  ​`)      -7.584e-02  8.786e-02  -0.863    0.389

Residual standard error: 0.9997 on 157 degrees of freedom
Multiple R-squared:  0.01323,   Adjusted R-squared:  0.0006588 
F-statistic: 1.052 on 2 and 157 DF,  p-value: 0.3515

2) ¿Afecta el gasto en Defensa y el número de homicidios intencionales en el IDH?


Call:
lm(formula = modelo2, data = miproyecto)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.2360 -0.7048  0.1533  0.8156  1.3445 

Coefficients:
                                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)                      5.780e-18  7.682e-02   0.000 1.000000    
scale(`Homicidios por 100.000`) -2.612e-01  7.736e-02  -3.377 0.000925 ***
scale(`Gasto Defensa (%PIB)`)   -2.268e-02  7.736e-02  -0.293 0.769816    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.9717 on 157 degrees of freedom
Multiple R-squared:  0.06771,   Adjusted R-squared:  0.05583 
F-statistic: 5.701 on 2 and 157 DF,  p-value: 0.004071

3) ¿Afecta la extensión territorial, la cantidad poblacional, el gasto en defensa y el número de homicidios intencionales en el IDH?


Call:
lm(formula = modelo3, data = miproyecto)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.2828 -0.6863  0.1481  0.7952  1.3626 

Coefficients:
                                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)                      1.113e-17  7.667e-02   0.000 1.000000    
scale(`Superficie (km²)`)        1.323e-01  8.542e-02   1.548 0.123564    
scale(`Población  ​`)            -9.109e-02  8.543e-02  -1.066 0.287997    
scale(`Homicidios por 100.000`) -2.655e-01  7.731e-02  -3.434 0.000764 ***
scale(`Gasto Defensa (%PIB)`)   -3.110e-02  7.739e-02  -0.402 0.688380    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.9699 on 155 degrees of freedom
Multiple R-squared:  0.08304,   Adjusted R-squared:  0.05937 
F-statistic: 3.509 on 4 and 155 DF,  p-value: 0.008987

4) Valores Influyentes

Column

Interpretación

  1. MODELO 1: (p-value: 0.3515/ MAYOR A 0.05) El primer modelo no sirve para explicar que estas dos independientes influyan en la dependiente. La extensión territorial y la cantidad poblacional no afectan al IDH.

  2. MODELO 2: (p-value: 0.004071/ MENOR A 0.05) El segundo modelo SÍ sirve para explicar la inluencia de las variables independientes sobre el IDH. Solamente una variable tiene significancia: el número de homicidios afecta inversamente el IDH. SI EL IDH AUMENTA EN UN PUNTO, EL NÚMERO DE HOMICIDIOS DISMUNUYE EN -2.655e-01.(APROXIMADAMETE -0.27)

  3. MODELO 3: El modelo 3 resume mejor lo expuesto

  4. ¿QUIÉNES SON LOS VALORES INFLUYENTES? 152= UCRANIA; 33= CHINA; 47= ERITREA

5. Clusters

Column {data-width=700}

Datos NO estandarizados

Prueba correlación entre las variables

                            Índice de desarrollo humano Superficie (km²)
Índice de desarrollo humano                 1.000000000      0.092445109
Superficie (km²)                            0.092445109      1.000000000
Gasto Defensa (%PIB)                        0.000213619      0.047053240
Homicidios por 100.000                     -0.259231463     -0.003376376
Población  ​                                -0.021911452      0.430962320
                            Gasto Defensa (%PIB) Homicidios por 100.000
Índice de desarrollo humano          0.000213619           -0.259231463
Superficie (km²)                     0.047053240           -0.003376376
Gasto Defensa (%PIB)                 1.000000000           -0.087622685
Homicidios por 100.000              -0.087622685            1.000000000
Población  ​                         -0.020029795           -0.043508016
                            Población  ​
Índice de desarrollo humano -0.02191145
Superficie (km²)             0.43096232
Gasto Defensa (%PIB)        -0.02002979
Homicidios por 100.000      -0.04350802
Población  ​                  1.00000000

Datos estandarizados

Cubo de Correlaciones de todas mis variables

¿Cantidad de clusters a solicitar?

Clusterización PAM

Índice de desarrollo humano Superficie (km²) Gasto Defensa (%PIB) Homicidios por 100.000 Población ​ pam
AFGANISTAN 0.462 652230 1.83 4.030 42647502 1
ALBANIA 0.789 28748 1.74 1.390 2791757 2
ALEMANIA 0.950 357580 1.52 0.910 84552236 3
ANGOLA 0.591 1246700 1.33 4.100 37885853 1
ARABIA SAUDITA 0.875 2149690 7.09 0.940 33962752 3
ARGELIA 0.745 2381741 8.17 1.160 46814301 2
ARGENTINA 0.849 2780400 0.47 4.490 45696154 3
ARMENIA 0.786 29743 5.45 2.210 2973843 2
AUSTRALIA 0.946 7741220 1.92 0.850 26713206 3
AUSTRIA 0.926 83871 0.84 0.880 9120816 3
AZERBAIYAN 0.760 86600 4.60 2.160 10336579 2
BANGLADES 0.670 148460 1.02 2.340 173562367 2
BAREIN 0.888 760 3.11 0.200 1607060 3
BELGICA 0.942 30528 1.21 1.080 11738761 3
BELICE 0.700 22966 0.82 28.060 417077 2
BENIN 0.504 112622 0.71 1.130 14462720 1
BIELORRUSIA 0.801 207600 1.80 2.380 9056698 2
BOLIVIA 0.698 1098581 1.39 4.420 12413319 2
BOTSUANA 0.708 581730 2.53 11.370 2521145 2
BRASIL 0.760 8515767 1.08 20.580 211998564 2
BRUNEI 0.823 5765 2.97 0.490 462733 3
BULGARIA 0.799 110879 1.85 1.090 6757687 3
BURKINA FASO 0.438 274200 4.01 1.250 23548782 1
BURUNDI 0.420 27830 3.66 5.650 14047788 1
CABO VERDE 0.661 4033 0.53 6.990 524877 2
CAMBOYA 0.600 181035 2.09 1.820 17638804 1
CAMERUN 0.587 475440 0.93 6.760 29123748 1
CANADA 0.935 9984670 1.29 1.980 39742428 3
CATAR 0.875 11571 6.96 0.070 3048428 3
CHAD 0.394 1284000 2.91 0.100 20299130 1
CHEQUIA 0.895 78867 1.52 0.770 10735858 3
CHILE 0.860 756102 1.63 6.350 19764772 3
CHINA 0.788 9596960 1.67 0.500 1419321279 2
CHIPRE 0.907 9251 1.82 0.820 1358287 3
COLOMBIA 0.758 1141748 2.87 24.910 52886360 2
CONGO 0.593 342000 2.00 13.400 6332969 1
COREA DEL SUR 0.929 100210 2.81 0.480 51717587 3
COSTA DE MARFIL 0.534 322463 0.89 56.900 31934229 1
COSTA RICA 0.806 51179 0.00 17.750 5129910 2
CROACIA 0.878 56594 1.78 0.670 3875325 3
CUBA 0.764 109884 2.88 4.460 10979781 2
DINAMARCA 0.952 42952 1.95 0.840 5977417 3
ECUADOR 0.765 256370 2.30 45.720 18135478 2
EGIPTO 0.728 1001450 0.87 1.310 116538256 2
EL SALVADOR 0.674 21041 1.28 7.900 6338198 2
EMIRATOS ARABES UNIDOS 0.937 83600 5.64 0.690 11027134 3
ERITREA 0.493 117600 20.87 15.610 3535610 1
ESLOVAQUIA 0.855 49035 2.02 1.120 5506759 3
ESLOVENIA 0.926 20273 1.34 0.570 2118690 3
ESPANA 0.911 505370 1.51 0.690 47910532 3
ESTADOS UNIDOS 0.927 9833517 3.36 5.760 345426567 3
ESTONIA 0.899 45228 2.87 1.540 1360549 3
ESUATINI 0.610 17364 1.57 12.510 1242830 1
ETIOPIA 0.492 1104300 0.79 8.510 132059770 1
FILIPINAS 0.710 300000 1.25 4.350 115843663 2
FINLANDIA 0.942 338145 2.42 0.980 5617313 3
FIYI 0.729 18274 1.32 2.060 928802 2
FRANCIA 0.910 643801 2.06 1.340 66548532 3
GABON 0.693 267667 1.15 9.300 2538954 2
GEORGIA 0.814 69700 1.68 2.030 3807668 3
GHANA 0.602 238533 0.39 1.830 34427416 1
GRECIA 0.893 131957 3.23 0.840 10047813 3
GUATEMALA 0.629 108889 0.41 23.370 18406367 1
GUINEA 0.471 245857 2.13 8.500 14754780 1
GUINEA-BISAU 0.483 36125 1.46 1.120 2201359 1
GUINEA ECUATORIAL 0.650 28051 1.59 3.200 1892522 1
GUYANA 0.742 214969 0.59 19.120 831093 2
HAITI 0.552 27750 0.05 41.150 11772561 1
HONDURAS 0.624 112777 1.57 31.440 10825704 1
HUNGRIA 0.851 93028 2.13 0.720 9676135 3
INDIA 0.644 3287263 2.44 2.820 1450935779 2
INDONESIA 0.713 1904569 0.68 0.300 283487932 2
IRAK 0.673 438317 2.07 10.080 46042015 2
IRAN 0.780 1648195 2.06 2.190 91567737 2
IRLANDA 0.950 70273 0.22 0.650 5255018 3
ISLANDIA 0.959 103000 0.00 1.290 393404 3
ISRAEL 0.915 20770 5.32 1.630 9387015 3
ITALIA 0.906 301340 1.61 0.570 59342870 3
JAMAICA 0.706 10991 1.22 49.300 2839183 2
JAPON 0.920 377975 1.20 0.230 123753042 3
JORDANIA 0.736 89342 4.91 0.990 11552883 2
KAZAJISTAN 0.802 2724900 0.48 2.550 20592575 2
KENIA 0.601 580367 0.91 4.870 56432945 1
KIRGUISTAN 0.701 199951 3.62 1.750 7186014 2
KUWAIT 0.847 17818 4.90 0.250 4934508 3
LAOS 0.620 236800 0.19 6.900 7769823 1
LESOTO 0.521 30355 1.54 43.560 2337427 1
LETONIA 0.879 64589 2.27 2.500 1871874 3
LIBANO 0.723 10400 8.91 2.240 5805963 2
LIBERIA 0.487 111369 2.30 3.090 5612812 1
LIBIA 0.746 1759540 15.48 2.500 7381028 2
LITUANIA 0.879 65300 2.72 2.630 2859113 3
LUXEMBURGO 0.927 2586 0.75 1.530 673043 3
MACEDONIA DEL NORTE 0.765 25713 1.70 1.530 1823011 2
MADAGASCAR 0.487 587041 0.66 6.100 31964961 1
MALASIA 0.807 330803 0.93 0.730 35557670 3
MALAUI 0.508 118484 1.01 1.780 21655290 1
MALI 0.410 1240192 3.83 10.800 24478596 1
MALTA 0.915 316 0.56 0.560 539613 3
MARRUECOS 0.698 446550 3.64 1.710 38081175 2
MAURICIO 0.796 2040 0.15 2.270 1271171 2
MAURITANIA 0.540 1030700 2.55 1.000 5169402 1
MEXICO 0.781 1964375 0.66 24.860 130860999 2
MOLDAVIA 0.763 33851 0.55 2.540 3034968 2
MONGOLIA 0.741 1564116 0.60 5.920 3475540 2
MONTENEGRO 0.844 13812 1.63 0.790 638485 3
MOZAMBIQUE 0.461 799380 1.73 3.590 34631766 1
MYANMAR 0.608 676578 3.79 2.580 54500087 1
NAMIBIA 0.610 824292 2.74 11.210 3030127 1
NEPAL 0.601 147181 1.08 2.130 29651054 1
NICARAGUA 0.669 130370 0.55 11.350 6916135 2
NIGER 0.394 1267000 2.07 4.420 27032418 1
NIGERIA 0.548 923768 0.81 15.750 232679482 1
NORUEGA 0.966 386224 1.61 0.720 5576655 3
NUEVA ZELANDA 0.939 267710 1.22 1.460 5213946 3
OMAN 0.819 309500 5.40 0.140 5281542 3
PAISES BAJOS 0.946 41865 1.53 0.690 18228738 3
PAKISTAN 0.540 881913 2.80 4.330 251269158 1
PANAMA 0.820 75517 0.00 12.470 4515575 2
PAPUA NUEVA GUINEA 0.568 462840 0.31 9.340 10576508 1
PARAGUAY 0.731 406752 0.91 6.780 6929152 2
PERU 0.762 1285216 1.12 8.600 34217850 2
POLONIA 0.881 312685 3.83 0.800 38539208 3
PORTUGAL 0.874 92212 1.52 0.720 10425291 3
REINO UNIDO 0.940 243610 2.26 1.000 69138185 3
REPUBLICA CENTROAFRICANA 0.387 622984 2.29 20.120 5330692 1
REPUBLICA DEMOCRATICA DEL CONGO 0.481 2344858 1.16 13.400 109276265 1
REPUBLICA DOMINICANA 0.766 48670 0.81 9.600 11427558 2
RUANDA 0.548 26338 1.27 3.610 14256573 1
RUMANIA 0.827 238391 1.61 1.110 19015096 3
RUSIA 0.821 17098246 5.86 6.800 144820423 2
SENEGAL 0.517 196722 1.47 0.270 18501989 1
SERBIA 0.805 88361 2.85 1.310 6736217 3
SEYCHELLES 0.802 455 1.71 7.970 130436 2
SIERRA LEONA 0.458 71740 0.56 1.700 8642029 1
SINGAPUR 0.949 728 2.66 0.070 5832387 3
SIRIA 0.557 185180 4.06 0.880 24672757 1
SOMALIA 0.380 637657 0.00 4.300 19009156 1
SRI LANKA 0.780 65610 1.64 2.500 23103559 2
SUDAFRICA 0.717 1219090 0.73 36.300 64007186 2
SUDAN 0.516 1861484 0.92 5.150 50448962 1
SUECIA 0.952 450295 1.47 1.150 10606994 3
SUIZA 0.967 41277 0.70 0.600 8921980 3
TAILANDIA 0.803 513120 1.17 2.580 71668010 2
TANZANIA 0.532 947300 1.15 3.750 68560162 1
TAYIKISTAN 0.679 143100 1.22 0.890 10590929 2
TIMOR ORIENTAL 0.566 14874 1.26 4.064 1400638 1
TRINIDAD Y TOBAGO 0.814 5128 0.89 29.364 1507779 2
TUNEZ 0.732 163610 2.36 4.690 12277103 2
TURKMENISTAN 0.744 488100 2.90 1.010 7494494 2
TURQUIA 0.855 783562 1.50 2.520 87473800 3
UCRANIA 0.734 603550 36.65 3.780 37860222 2
UGANDA 0.550 241038 1.98 8.970 50015089 1
URUGUAY 0.830 176215 2.00 11.250 3386582 2
UZBEKISTAN 0.727 447400 3.56 1.400 36361859 2
VENEZUELA 0.699 916445 0.50 12.650 28405544 2
VIETNAM 0.726 331210 1.81 1.540 100987686 2
YEMEN 0.424 527968 3.97 5.810 40583174 1
ZAMBIA 0.569 752618 1.30 5.200 21314960 1
ZIMBABUE 0.550 390757 0.25 0.510 16634366 1

Silhouette

¿Quiénes son los países mal clusterizados?

 [1] "ALBANIA"             "ARMENIA"             "AZERBAIYAN"         
 [4] "BIELORRUSIA"         "CABO VERDE"          "CHINA"              
 [7] "CUBA"                "IRAN"                "JORDANIA"           
[10] "KAZAJISTAN"          "MACEDONIA DEL NORTE" "MAURICIO"           
[13] "MOLDAVIA"            "PANAMA"              "RUSIA"              
[16] "SEYCHELLES"          "SRI LANKA"           "TAILANDIA"          
[19] "TURKMENISTAN"        "URUGUAY"            

Promedio de cada cluster

  pam Índice de desarrollo humano Superficie (km²) Gasto Defensa (%PIB)
1   1                   0.5253600         513910.9             2.023000
2   2                   0.7431404        1163393.5             2.822281
3   3                   0.8973962         768671.1             2.250377
  Homicidios por 100.000 Población  ​
1               9.031280    34329582
2               8.868667    86586462
3               1.223396    26454243

Coordenadas - Pares ordenados de los países

                       [,1]         [,2]
AFGANISTAN      0.187914635 -0.124585183
ALBANIA        -0.074677675  0.005830209
ALEMANIA       -0.179663887 -0.027778547
ANGOLA          0.124170715 -0.056999243
ARABIA SAUDITA -0.161887629 -0.039333721
ARGELIA        -0.047374081 -0.027058195
ARGENTINA      -0.109222817  0.017597217
ARMENIA        -0.074709802 -0.002659871
AUSTRALIA      -0.238046029 -0.039608461
AUSTRIA        -0.169170717 -0.015299992
AZERBAIYAN     -0.047799801 -0.003283797
BANGLADES       0.043435784 -0.022151904
BAREIN         -0.157415696 -0.023526077
BELGICA        -0.174991394 -0.018826092
BELICE          0.100206634  0.230513189
BENIN           0.153391875 -0.115880422
BIELORRUSIA    -0.077515182  0.008882039
BOLIVIA         0.034441315  0.005888969
BOTSUANA        0.052597629  0.079237047
BRASIL         -0.007656237  0.217766946

Mapa de Proyecciones de los países hacia sus cluster en PAM

Países mal clusterizados en Gráfica PAM

6. Conclusiones

La hipótesis inicial se rechaza. Los países que tienen mejor IDH no están afectados por ser más grandes, ni ser más poblados, ni porque gasten mayor porcentaje del PBI en Defensa.Es cierto que existen casos como Estados Unidos, China, Russia que sí cumplen una relación directa entre las variables mencionadas pero no por ellos podemos establecer una correlación inluyente en general para todos los casos o la mayoría de ellos.

LO QUE sí SE ESTABLECE SIGNIFICATIVAMENTE ES LA AFECTACIÓN DEL IDH POR LA VARAIBLE INDEPENDIENTE HOMICIDIOS INTENCIONALES POR 100.000 HABITANTES EN CADA PAÍS: A MAYOR TASA DE HOMICIDIOS, MENOR SERÁ EL VALOR NUMÉRICO DEL IDH.

Column

---
title: "¿La guerra construye Estados? Análisis del poderío
militar como indicador de desarrollo humano y control interno en la actualidad"
author: "Isaac Levano"
output: 
  flexdashboard::flex_dashboard:
    theme: united
    orientation: columns
    vertical_layout: fill
    source_code: embed
---

1. Introducción {data-icon="fa-signal"}
===================================== 

```{r}
library(tmap) #Dibujar el mapa
library(sf) #Para leer el shapefile y reducir el tamaño del archivo
library(pryr) #Calcular el tamaño del archivo
library(readr) #para cargar csv
library(base) # para merge
library(reshape2) # para hacer dcast
library(plyr) # para mineria en csv 
library(dplyr) # para inner join
library(readxl)
library(shinyMobile)
```

```{r}
library(rio)
miproyecto=import("myproyect.xlsx")
```

```{r}
setwd("C:/Users/lenovo/Downloads")
```


```{r setup, include=FALSE}
library(flexdashboard)
```

Column {data-width=300}
-----------------------------------------------------------------------

### Mapa del Índice de Desarrollo Humano por país 


```{r}
shp_mapworld <- st_read("CNTR_RG_20M_2024_3035.shp.zip")
```


```{r}
shp_mapworld <- shp_mapworld %>%
  rename(Country = NAME_ENGL)
```

```{r}
shp_mapworld$Country <- toupper(iconv(shp_mapworld$Country, from = "UTF-8", to = "ASCII//TRANSLIT"))
```

```{r}
colnames(shp_mapworld)[colnames(shp_mapworld) == "Country"] <- "PAIS"
```


```{r}
shp_mapworld2=merge(shp_mapworld,miproyecto,by="PAIS", all.x = T)
```

```{r}
tmap_mode("view")
```
```{r}
shp_mapworld2= shp_mapworld2[-c(2,3,4,5,6,7,8,9,10,11)]
```

```{r}
shp_mapworld2= shp_mapworld2[-c(13,14,15,16)]
```

```{r}
tm_shape(shp_mapworld2) +
  tm_fill("Índice de desarrollo humano", id="PAIS", palette = "Oranges", style="quantile", title="Índice de desarrollo humano") +
  tm_borders("grey25", alpha=.05) + 
  tm_layout("Índice de desarrollo humano",
            main.title.position = "center") + tm_view(view.legend.position = c("left","bottom") #esto sirve para bajar la leyenda y que no estorbe con el título 
            )

tmap_last <- tmap_last()
```

Column {data-width=250}
-----------------------------------------------------------------------

### Introducción
* **Problema observado:**

En la Ciencia Política, cuando se estudia Teoría del Estado, resulta ser un tema interesante la formación y la construcción estatal, es decir, el constante proceso de reconfiguración de los límites territoriales de los estados, y la tarea organizadora de estos mismos por llevar y construir sistemas de instituciones desplegándolas a lo largo y amplio de su territorio.
Charles Tilly, en “Coerción, Capital y los Estados europeos 990-1990”, postula que la preparación para la guerra y la guerra en sí misma significaban a su vez el mayor incentivo de supervivencia para la construcción estatal de los Estados modernos europeos, lo que trajo como consecuencia, en la mayoría de los casos, Estados más fuertes, más institucionalizados y con mayor alcance. Esta lógica se refleja en la ya conocida frase: “El Estado hace la guerra y la guerra hace al Estado.”

* **Pregunta de investigación:**

¿De qué manera se relacionan el gasto militar, la extensión territorial, la cantidad poblacional y la criminialidad,medida a través de homicidios intencionales, de un determinado país con su nivel de desarrollo humano?

* **Hipótesis:**

Los países con mayor territorio, mayor población y que gastan más en Defensa tendrán mayor valor numérico en su Índice del Desarrollo Humano. Es decir, estas variables afectan directamente proporcional al IDH. Además, la criminialidad,medida a través de homicidios intencionales,afectará inversamente proporcional al IDH.


2. Variable Dependiente {data-icon="fa-signal"}
===================================== 



Column {data-width=500} {.tabset}
-----------------------------------------------------------------------

### Diagrama de barras según la frecuencia del nivel categórico del IDH

```{r}
library(ggplot2)
```

```{r}
ggplot(data = miproyecto, aes(x = `Nivel IDH - Categóricas`)) +
  geom_bar(fill = "lightgreen") +
  labs(title = "Distribución Categórica del nivel del IDH",
       x = "Nivel IDH - Categóricas",
       y = "Número de países",)
```

### Boxplot

```{r}
boxplot(miproyecto$`Índice de desarrollo humano`)
```

Column {data-width=450}
-----------------------------------------------------------------------

### Tabla de frecuencias


```{r}
table(miproyecto$`Nivel IDH - Categóricas`)
```
El proyecto inicial tuvo 195 países reconocidos por la ONU. Sin embargo, algunos no registraban datos requeridos. Por ello, nos quedamos con 160 países. Los países eliminados, en su mayoría, eran islas y países africanos pequeños que registraban niveles BAJO y MEDIO.

```{r}
summary(miproyecto$`Índice de desarrollo humano`)
```
Esta variable dependiente es ascendente y tiene como escala del 0 al 1. A mayor puntaje, mejor es el IDH.

SOMALIA posee el menor IDH con 0.38 calificando como BAJO.

SUIZA posee el mayor IDH con 0.967 calificando MUY ALTO.

La MEDIA es 0.7262 que calificaría como ALTO. Los paises situados aproximadamente en esta categoría son UZBEKISTAN, VIETNAM y LIBANO.

3. Variables Independientes y su correlación con el IDH {data-icon="fa-signal"}
===================================== 

Column {data-width=600} {.tabset}
-----------------------------------------------------------------------

### Superficie (km²)
```{r}
base=ggplot(data=miproyecto, aes(x=`Superficie (km²)`, y=`Índice de desarrollo humano`))
scatter1 = base + geom_point()+geom_smooth(method = "lm",formula=y~x,se=FALSE,col='dodgerblue1')
library(ggrepel)
scatterText1 = scatter1 + geom_text_repel(aes(label=PAIS),size=2)+labs(x="Superficie", 
       y="IDH")+ggtitle("Correlación entre IDH y Superficie en kilómetros cuadrados")
scatterText1
```

### Población


```{r}
base=ggplot(data=miproyecto, aes(x= `Población  ​`, y=`Índice de desarrollo humano`))
scatter2 = base + geom_point()+geom_smooth(method = "lm",formula=y~x,se=FALSE,col='dodgerblue1')
library(ggrepel)
scatterText2 = scatter2 + geom_text_repel(aes(label=PAIS),size=2)+labs(x="Población", 
       y="IDH")+ggtitle("Correlación entre IDH y Número de habitantes en el país")
scatterText2
```

### Cantidad de Ojivas nucleares

```{r}
base=ggplot(data=miproyecto, aes(x= miproyecto$`Cantidad de ojivas`, y=`Índice de desarrollo humano`))
scatter3 = base + geom_point()+geom_smooth(method = "lm",formula=y~x,se=FALSE,col='dodgerblue1')
library(ggrepel)
scatterText3 = scatter3 + geom_text_repel(aes(label=PAIS),size=2)+labs(x="Número de ojivas", 
       y="IDH")+ggtitle("Correlación entre IDH y Cantidad de Ojivas nucleares")
scatterText3
```


### Gasto en Defensa (% del PBI)
```{r}
base=ggplot(data=miproyecto, aes(x= miproyecto$`Gasto Defensa (%PIB)`, y=`Índice de desarrollo humano`))
scatter5 = base + geom_point()+geom_smooth(method = "lm",formula=y~x,se=FALSE,col='dodgerblue1')
library(ggrepel)
scatterText5 = scatter5 + geom_text_repel(aes(label=PAIS),size=2)+labs(x="Gasto Defensa (%PIB)", 
       y="IDH")+ggtitle("Correlación entre IDH y Gasto Defensa (%PIB)")
scatterText5
```

### Homicidios Intencionales por 100.000 habitantes

```{r}
base=ggplot(data=miproyecto, aes(x= miproyecto$`Homicidios por 100.000`, y=`Índice de desarrollo humano`))
scatter6 = base + geom_point()+geom_smooth(method = "lm",formula=y~x,se=FALSE,col='dodgerblue1')
library(ggrepel)
scatterText6 = scatter6 + geom_text_repel(aes(label=PAIS),size=2)+labs(x="Homicidios por 100.000", 
       y="IDH")+ggtitle("Correlación entre IDH y Homicidios por 100.000")
scatterText6
```


Column {data-width=400} {.tabset}
-----------------------------------------------------------------------
### Superficie (km²)

```{r}
cor.test(miproyecto$`Índice de desarrollo humano`, miproyecto$`Superficie (km²)`, method =c("pearson") )
```
Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos.

Muchos países que tienen poca extensión territorial pueden tener un IDH ALTO, como BAJO.

### Población
```{r}
cor.test(miproyecto$`Índice de desarrollo humano`, miproyecto$`Población  ​`, method =c("pearson") )
```

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos.

Muchos países que tienen poca población pueden tener un IDH ALTO, como BAJO.

### Cantidad de Ojivas Nucleares
```{r}
cor.test(miproyecto$`Cantidad de ojivas`, miproyecto$`Índice de desarrollo humano`, method =c("pearson") )
```

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos.

Lo que sí se cumple es que los dos países con más ojivas nucleares poseen un IDH MAYOR a 0.8, es decir tienen un MUY ALTO nivel de IDH.

### Gasto en Defensa (% del PBI)
```{r}
cor.test(miproyecto$`Gasto Defensa (%PIB)`, miproyecto$`Índice de desarrollo humano`, method =c("pearson") )
```

Al ser las dos variables numéricas utilizo la Prueba R de Pearson.
El p-valor es mayor a 0.05, entonces NO HAY CORRELACIÓN entre ellas dos

Sin embargo, en las anteriores pruebas de correlaciones ESTADOS UNIDOS, CHINA, INDIA, CANADÁ y RUSSIA eran valores atípicos que rompían la NO CORRELACIÓN, es decir, estos países tienen relación directamente proporcional con la variable dependiente. Pero en este caso, estos países se camuflan dentro de la NO CORRELACIÓN.

ALGUNOS PAÍSES CON MEJOR IDH NO NECESARIAMENTE GASTAN MÁS EN DEFENSA.

El país que gasta más en defensa es UCRANIA, que desde el 2022 fue invadido por Rusia.

### Homicidios Intencionales por 100.000 habitantes
```{r}
cor.test(miproyecto$`Homicidios por 100.000`, miproyecto$`Índice de desarrollo humano`, method =c("pearson") )
```
Al ser las dos variables numéricas utilizo la Prueba R de Pearson.

El p-valor es menor a 0.05, entonces SÍ EXISTE CORRELACIÓN entre ellas dos.
La correlación es inversa,es decir, A MENOR NÚMERO DE HOMICIDIOS INTENCIONALES POR 100.000 HABITANTES QUE REGISTREN EN UN PAÍS, MAYOR SERÁ SU NIVEL DE IDH.

4. Regresiones Gaussianas {data-icon="fa-signal"}
===================================== 

Column {data-width=500} {.tabset}
-----------------------------------------------------------------------
### 1) ¿Afecta la extensión territorial y la cantidad poblacional en el IDH?
```{r}
modelo1=formula(scale(`Índice de desarrollo humano`)~ scale(`Superficie (km²)`)+scale(`Población  ​`))
```

```{r}
reg1=lm(modelo1,data=miproyecto)
summary(reg1)
```
### 2) ¿Afecta el gasto en Defensa y el número de homicidios intencionales en el IDH?


```{r}
modelo2=formula(scale(`Índice de desarrollo humano`)~ scale(`Homicidios por 100.000`)+ scale(`Gasto Defensa (%PIB)`))
```


```{r}
reg2=lm(modelo2,data=miproyecto)
summary(reg2)
```


### 3) ¿Afecta la extensión territorial, la cantidad poblacional, el gasto en defensa y el número de homicidios intencionales en el IDH?


```{r}
modelo3=formula(scale(`Índice de desarrollo humano`)~ scale(`Superficie (km²)`)+scale(`Población  ​`)+scale(`Homicidios por 100.000`)+ scale(`Gasto Defensa (%PIB)`))
```

```{r}
reg3=lm(modelo3,data=miproyecto)
summary(reg3)
```
### 4) Valores Influyentes

```{r}
plot(reg3, 5)
```



Column {data-width=400}
-----------------------------------------------------------------------

### Interpretación

1) MODELO 1:
(p-value: 0.3515/ MAYOR A 0.05) El primer modelo no sirve para explicar que estas dos independientes influyan en la dependiente. La extensión territorial y la cantidad poblacional no afectan al IDH.

2) MODELO 2: 
(p-value: 0.004071/ MENOR A 0.05) El segundo modelo SÍ sirve para explicar la inluencia de las variables independientes sobre el IDH. Solamente una variable tiene significancia: el número de homicidios afecta inversamente el IDH.
SI EL IDH AUMENTA EN UN PUNTO, EL NÚMERO DE HOMICIDIOS DISMUNUYE EN -2.655e-01.(APROXIMADAMETE -0.27)

3) MODELO 3: 
El modelo 3 resume mejor lo expuesto

4) ¿QUIÉNES SON LOS VALORES INFLUYENTES?
152= UCRANIA; 
33= CHINA; 
47= ERITREA 









5. Clusters {data-icon="fa-signal"}
===================================== 

Column {data-width=700} {.tabset}
-----------------------------------------------------------------------

### Datos NO estandarizados

```{r}
library(BBmisc)
boxplot(normalize(miproyecto[,c(2,4,9,11,12)],method='range',range=c(0,10)))

```

### Prueba correlación entre las variables
```{r}
cor(miproyecto[,c(2,4,9,11,12)])
```
### Datos estandarizados
```{r}
boxplot(normalize(miproyecto[,c(2,4,9,11,12)],method='standardize'))
```


```{r}
select=c("Índice de desarrollo humano`","`Superficie (km²)`","`Gasto Defensa (%PIB)`","`Homicidios por 100.000`","`Población  ​`")
select=setdiff(names(miproyecto),select) 
theData=miproyecto[,select]
```


```{r}
library(polycor)
corMatrix=polycor::hetcor(theData)$correlations
```

### Cubo de Correlaciones de todas mis variables

```{r}
library(ggcorrplot)

ggcorrplot(corMatrix)
```

### ¿Cantidad de clusters a solicitar?

```{r}
dataClus=miproyecto[,c(2,4,9,11,12)]
row.names(dataClus)=miproyecto$PAIS
```

```{r}
library(cluster)
g.dist = daisy(dataClus, metric="gower")
```

```{r}
library(factoextra)
fviz_nbclust(dataClus, pam,diss=g.dist,method = "gap_stat",k.max = 10
             ,verbose = F)
```

### Clusterización PAM

```{r}
library(kableExtra)
set.seed(123)
res.pam=pam(g.dist,3,cluster.only = F)

#nueva columna
dataClus$pam=res.pam$cluster

# ver

head(dataClus,160)%>%kbl()%>%kable_styling()
```

### Silhouette

```{r}
fviz_silhouette(res.pam,print.summary = F)
```

### ¿Quiénes son los países mal clusterizados?
```{r}
silPAM=data.frame(res.pam$silinfo$widths)
silPAM$PAIS=row.names(silPAM)
poorPAM=silPAM[silPAM$sil_width<0,'PAIS']%>%sort()
poorPAM
```

### Promedio de cada cluster

```{r}
aggregate(.~ pam, data=dataClus,mean)
```

```{r}
miproyecto$pamIDHpoor=miproyecto$PAIS%in%poorPAM
miproyecto$pamIDH=as.ordered(dataClus$pam)
dataClus$pam=NULL
```

### Coordenadas - Pares ordenados de los países

```{r}
# k es la cantidad de dimensiones
proyeccion = cmdscale(g.dist, k=2,add = T) 
head(proyeccion$points,20)
```

```{r}
# data frame prep:
miproyecto$dim1 <- proyeccion$points[,1]
miproyecto$dim2 <- proyeccion$points[,2]
```

### Mapa de Proyecciones de los países hacia sus cluster en PAM
```{r}
library(ggrepel)
base= ggplot(miproyecto,aes(x=dim1, y=dim2,label=row.names(dataClus))) 
base + geom_text_repel(size=2, max.overlaps = 30,min.segment.length = unit(0, 'lines'))
```

### Países mal clusterizados en Gráfica PAM

```{r}
# solo paises mal clusterizados
PAMlabels=ifelse(miproyecto$pamIDHpoor,miproyecto$PAIS,'')

#base
base= ggplot(miproyecto,aes(x=dim1, y=dim2))  +
    scale_color_brewer(type = 'qual',palette ='Dark2'  ) + labs(subtitle = "Se destacan los países mal clusterizados")

pamPlot=base + geom_point(size=3, 
                          aes(color=pamIDH))  + 
        labs(title = "PAM") 
# hacer notorios los paises mal clusterizados
pamPlot + geom_text_repel(size=4,
                          aes(label=PAMlabels),
                          max.overlaps = 50,
                          min.segment.length = unit(0, 'lines'))
```

6. Conclusiones {data-icon="fa-signal"}
===================================== 

La hipótesis inicial se rechaza. Los países que tienen mejor IDH no están afectados por ser más grandes, ni ser más poblados, ni porque gasten mayor porcentaje del PBI en Defensa.Es cierto que existen casos como Estados Unidos, China, Russia que sí cumplen una relación directa entre las variables mencionadas pero no por ellos podemos establecer una correlación inluyente en general para todos los casos o la mayoría de ellos.

LO QUE sí SE ESTABLECE SIGNIFICATIVAMENTE ES LA AFECTACIÓN DEL IDH POR LA VARAIBLE INDEPENDIENTE HOMICIDIOS INTENCIONALES POR 100.000 HABITANTES EN CADA PAÍS: A MAYOR TASA DE HOMICIDIOS, MENOR SERÁ EL VALOR NUMÉRICO DEL IDH.

Column {data-width=500} 
-----------------------------------------------------------------------