Trabajo

Curso: POL304 - Estadística para el análisis político 2

Grupal

2022-11-12

El objetivo de este breve reporte es analizar el fenómeno migratorio internacional, a modo poner a prueba el poder explicativo de las variables escogidas como explorar más a fondo las características del fenómeno migratorio. Para ello se llevarán a cabo los siguientes análisis:

  • Realizar un análisis descriptivo y georreferenciado del fenómeno migratorio.
  • Aplicar técnicas de reducción de dimensiones para agrupar a los países en función de diversos indicadores globales.
  • Implementar técnicas multivariadas para modelar la net migration.
  1. Análisis de los indicadores:

La variable dependiente ha utilizar se obtuvo del portal World FactBook de la CIA. Esta estadística busca representar la diferencia de las que entran y salen de un país por cada 1000 personas. Consideramos esta una variable pertinente para poder estudiar el fenómenos migratorio, aunque algunas de sus limitaciones es quizás que no discrimina la razón de entrada o salida del país.

En cuanto a las variables independientes, recogidas de diversas fuentes, buscan operacionalizar fenómenos como cambio climático, desconfianza en los gobiernos, crisis económicas, violación a derechos humanos, falta de acceso a servicios básicos; como posibles variables detrás de la salida de las personas de sus países de origen.

Justificación:

Falta de acceso a Servicios Básicos

  • Uso del internet (% población)

  • Base de Datos: World Bank (DataBank) (usodelinternet.csv)

El internet ha pasado a ser considerado un casi un derecho debido a su importancia para el desarrollo de la vida de las personas. En ese sentido, se considera que la ausencia o problemas de acceso a este servicio por parte de la población podría ayudar a explicar un aumento en la probabilidad de abandoanr el país de origen.

MAPA DE LA VARIABLE DEPENDIENTE A partir de nuestra variable dependiente podemos observar una distribución territorial de la siguiente manera. Sin embargo esta es poco clara pues no se ven grandes diferencias entre los países graficados. Esto puede ser explicado por una baja variabilidad de la misma.

sd(DATA$MIGRATION)
## [1] 4.094368

Entonces, es pertinente realizar una serie de cortes que nos permitan observar de forma más clara la variabilidad.

#Ese mapa se puede ver mejor si hacen cortes:

mapDIS2$migration_cat = ifelse(mapDIS2$migration_r <= 0.2,1,
                               ifelse(mapDIS2$migration_r >0.2 & mapDIS2$migration_r <= 0.4,2,
                                ifelse(mapDIS2$migration_r > 0.4 & mapDIS2$migration_r <= 0.42,3,
                                ifelse(mapDIS2$migration_r > 0.42 & mapDIS2$migration_r <= 0.44,4,
                                       ifelse(mapDIS2$migration_r > 0.44,5,0)))))
summary(mapDIS2$migration_cat)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   2.000   3.000   3.442   5.000   5.000      41

crear otra variable que incluya

mapDIS2$migration_cat = factor(mapDIS2$migration_cat,
                               levels = c(1:5),
                               labels = c("Menor o igual a 0.2",
                                          "Entre 0.2 y 0.4",
                                          "Entre 0.4 y 0.42",
                                          "Entre 0.42 y 0.44",
                                          "Mayor a 0.44"))

#REDUCCION DE DIMENSIONES Agrupar los paises segun …

##   cluster size ave.sil.width
## 1       1   58          0.17
## 2       2   20          0.59
## 3       3   41          0.33

##  [1] "Ghana"                "Hungary"              "Indonesia"           
##  [4] "Italy"                "Latvia"               "Lithuania"           
##  [7] "Mexico"               "Poland"               "Sri Lanka"           
## [10] "United Arab Emirates" "Uruguay"

Eto son los países que no lograron ser clusterizados por la técnica escogida.

La mejor silueta se obtiene con PAM, calculamos su promedio

Mapa de Clusters:

REGRESION

Sobre nuestra regresión es posible observar que cuenta con r2 ajustado muy bajo, lo que habla de un débil poder explicativo. Esto puede mejorarse con una ampliación y retiro de variables. Sin embargo, es posible destacar el impacto significativo al 0.05, Lo que nos dice….

Regresion: modelo 1
modelo1
(Intercept) 1.328
(3.051)
DESEMPLEO 0.036
(0.066)
CRI -0.016
(0.012)
PUBLIC_SERV 0.212
(0.285)
CORRUPTION -0.341
(0.810)
HUMANRIGTHS -0.446*
(0.194)
INTERNET 0.026
(0.026)
Num.Obs. 119
R2 0.116
R2 Adj. 0.068
AIC 673.6
BIC 695.8
Log.Lik. -328.781
F 2.442
RMSE 3.83
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Conclusión: