Estadística para el análisis político 2 - POL304


¿Por qué a mí?: factores que explican la variación de la prevalencia del VIH en mujeres durante el 2008-2012 y el 2013-2017


  1. Índice

El tema de investigación del proyecto aplicativo es la prevalencia del VIH en mujeres a nivel internacional. Este tema resulta relevante debido a que el VIH/SIDA según el PNUD (2002) ha sido la principal causa de fallecimiento en África subsahariana y representa la cuarta parte de todos los casos mortales. Además, ha tenido una rápida expansión en los países del Caribe y América Central, así como en Asia y Europa Oriental. En las últimas décadas, mientras más se ha expandido el virus, afectando a una proporción importante de la población adulta, la demanda de servicios de salud y bienestar social se han incrementado. De esta forma, se ha dado pase a que los gobiernos incluyan medidas para tratar y prevenir el VIH en su agenda y política nacional. Como cada país diseñó un plan de acción diferente basado en los informes proporcionados por organismos como la ONUSIDA, tenemos países que se han enfocado en la desigualdad y pobreza, otros han priorizado un enfoque de género, mejora en la atención médica, atención a grupos vulnerables como los migrantes, entre otros. Debido a ello, la pregunta de investigación del presente trabajo busca responder sobre qué factores son los que explican la variación en la prevalencia del VIH en mujeres para los periodos 2008-2012 y 2013-2017.

A continuación se detallan las partes de la investigación: en primer lugar, procedimos con la limpeza de datas diferenciando los dos periodos que entrarán en comparación (2008-2012 y 2013-2017). En segundo lugar, realizamos el merge de las variables que iban a ser resumidas con la técnica de análisis factorial. Después de ello, juntamos los índices formados con el resto de variables y obtuvimos la data final (para ambos periodos). En tercer lugar, realizamos cuatro mapas de conglomerados o clusters por cada periodo (uno con todas las variables y los otros tres por cada hipótesis) para apreciar visualmente las diferencias entre los grupos formados de acuerdo a las distancias según las características de las variables. Finalmente, realizamos una regresión beta (por cada periodo) debido a la naturaleza de la variable dependiente para saber cuáles variables resultaban significativas y a qué conclusiones podríamos llegar con las diferencias entre ambos periodos. La idea que más se rescata es sobre el rol del Estado en temas tan importantes como la prevalencia de VIH en mujeres.

1. Carga y limpieza de la primera data

Para este primer periodo (2008-2012), trabajamos con data de la variable dependiente de los quinquenios 2008-2012 y con datas de las variables independientes y de control de los quinquenios 2003-2007.

Data de Prevalencia de VIH en mujeres (2008-2012)
  • La variable dependiente es la prevalencia del VIH en mujeres para los años 2008-2012. Es una variable que está en porcentaje.
link1="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ51CAVKCjF_48ylMXr4FJkuVOHpXlUhaGmIA44cdQeWt4cBNjfekSgrPMjZMXrZg/pub?gid=14954305&single=true&output=csv"
DataVIH=read.csv(link1, stringsAsFactors = F)
DataVIH1 = DataVIH[,c(1,53:57)]
names(DataVIH1) = c("Pais","2008","2009","2010","2011","2012")

DataVIH1$`2009` =   gsub("\\,", ".", DataVIH1$`2009`) 
DataVIH1$`2010` =   gsub("\\,", ".", DataVIH1$`2010`) 
DataVIH1$`2008` =   gsub("\\,", ".", DataVIH1$`2008`) 
DataVIH1$`2011` =   gsub("\\,", ".", DataVIH1$`2011`) 
DataVIH1$`2012` =   gsub("\\,", ".", DataVIH1$`2012`) 
DataVIH1[,c(2:6)]=lapply(DataVIH1[,c(2:6)],as.numeric) #volver numerico en grupo

DataVIH1 = DataVIH1[complete.cases(DataVIH1),]
row.names(DataVIH1) = NULL

DataVIH1$VIH = rowMeans(DataVIH1[,2:6])
DataVIH1 = DataVIH1[,c (1,7)]

NOTA Todas las variables independientes en esta primera data son del periodo 2003 al 2007.

Data de Población Activa Mujeres
  • Uno de los componentes de la variable independiente “empoderamiento” para la primera hipótesis del trabajo: el aumento del reforzamiento de las capacidades femeninas.
link2="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ-T56gOlA6lVVHHnrqUR6bc_doAmUewuvSlG4CcNgYyeZVUbPiozpcciPpDS3SyQ/pub?gid=1993384276&single=true&output=csv"
DataAct=read.csv(link2,stringsAsFactors = F)
DataAct1 = DataAct[,c(1,48:52)]
names(DataAct1) = c("Pais","2003","2004","2005", "2006", "2007")

DataAct1$`2003` =   gsub("\\,", ".", DataAct1$`2003`) 
DataAct1$`2004` =   gsub("\\,", ".", DataAct1$`2004`) 
DataAct1$`2005` =   gsub("\\,", ".", DataAct1$`2005`) 
DataAct1$`2006` =   gsub("\\,", ".", DataAct1$`2006`) 
DataAct1$`2007` =   gsub("\\,", ".", DataAct1$`2007`) 
DataAct1[,c(2:6)]=lapply(DataAct1[,c(2:6)],as.numeric) #volver numerico en grupo

DataAct1 = DataAct1[complete.cases(DataAct1),]
row.names(DataAct1) = NULL

DataAct1$PoblacionActiva = rowMeans(DataAct1[,2:6])
DataAct1= DataAct1[,c (1,7)]
Data de Participación en la Fuerza Laboral Mujeres
  • Otro de los componentes de la variable independiente “empoderamiento” para la primera hipótesis del trabajo: el aumento del reforzamiento de las capacidades femeninas.
link3="https://docs.google.com/spreadsheets/d/e/2PACX-1vTDcvi_z6RrnoATATdOGBLj2WlKRmVxqvx2hc4lUqkMwCcF3j9BLklmz0VjjIX4vA/pub?gid=1181245938&single=true&output=csv"
DataFLM= read.csv(link3, stringsAsFactors = F)
DataFLM1 = DataFLM[,c(1,48:52)]
names(DataFLM1) = c("Pais","2003","2004","2005", "2006", "2007")

DataFLM1$`2003` =   gsub("\\,", ".", DataFLM1$`2003`) 
DataFLM1$`2004` =   gsub("\\,", ".", DataFLM1$`2004`) 
DataFLM1$`2005` =   gsub("\\,", ".", DataFLM1$`2005`) 
DataFLM1$`2006` =   gsub("\\,", ".", DataFLM1$`2006`) 
DataFLM1$`2007` =   gsub("\\,", ".", DataFLM1$`2007`)
DataFLM1[,c(2:6)]=lapply(DataFLM1[,c(2:6)],as.numeric)

DataFLM1$FLM = rowMeans(DataFLM1[,2:6],na.rm = TRUE)
DataFLM1= DataFLM1[,c (1,7)]
DataFLM1 = DataFLM1[complete.cases(DataFLM1),]
row.names(DataFLM1) = NULL
Data Prevalencia de Métodos anticonceptivos
  • Es una variable independiente para la primera hipótesis sobre el aumento del reforzamiento de las capacidades femeninas.
link4="https://docs.google.com/spreadsheets/d/e/2PACX-1vRI-hkw-v7fdeFY_c1aS0c_DD86WJ-0k_G9Ti2lE_0_P3nGcPHagckLPhVM9SzD5g/pub?gid=932337199&single=true&output=csv"
DataMetodos= read.csv(link4, stringsAsFactors = F)
DataMetodos1 = DataMetodos[,c(1,48:52)]
names(DataMetodos1) = c("Pais","2003","2004","2005", "2006", "2007")

DataMetodos1$`2003` =   gsub("\\,", ".", DataMetodos1$`2003`) 
DataMetodos1$`2004` =   gsub("\\,", ".", DataMetodos1$`2004`) 
DataMetodos1$`2005` =   gsub("\\,", ".", DataMetodos1$`2005`) 
DataMetodos1$`2006` =   gsub("\\,", ".", DataMetodos1$`2006`) 
DataMetodos1$`2007` =   gsub("\\,", ".", DataMetodos1$`2007`)
DataMetodos1[,c(2:6)]=lapply(DataMetodos1[,c(2:6)],as.numeric)

DataMetodos1$Metodos = rowMeans(DataMetodos1[,2:6],na.rm = TRUE)
DataMetodos1= DataMetodos1[,c (1,7)]
DataMetodos1 = DataMetodos1[complete.cases(DataMetodos1),]
row.names(DataMetodos1) = NULL
Data de población que vive en barrios de tugurios
  • Es un componente para la hipótesis 2 del trabajo: un aumento en la calidad de vida.
link5="https://docs.google.com/spreadsheets/d/e/2PACX-1vQnghOacrnZH200jpcJc-Vym7n8rrfuQlupJ470spsBTvZ0WUWvl63x2AYL1W92sw/pub?gid=1538383881&single=true&output=csv"
DataTugurios= read.csv(link5, stringsAsFactors = F)
DataTugurios1 = DataTugurios[,c(1,48:52)]
names(DataTugurios1) = c("Pais","2003","2004","2005", "2006", "2007")

DataTugurios1$`2003` =   gsub("\\,", ".", DataTugurios1$`2003`) 
DataTugurios1$`2004` =   gsub("\\,", ".", DataTugurios1$`2004`) 
DataTugurios1$`2005` =   gsub("\\,", ".", DataTugurios1$`2005`) 
DataTugurios1$`2006` =   gsub("\\,", ".", DataTugurios1$`2006`) 
DataTugurios1$`2007` =   gsub("\\,", ".", DataTugurios1$`2007`)
DataTugurios1[,c(2:6)]=lapply(DataTugurios1[,c(2:6)],as.numeric)

DataTugurios1$BarriosTugurios = rowMeans(DataTugurios1[,2:6],na.rm = TRUE)
DataTugurios1= DataTugurios1[,c (1,7)]
DataTugurios1 = DataTugurios1[complete.cases(DataTugurios1),]
row.names(DataTugurios1) = NULL
Data del índice de Gini
  • Es el índice de desigualdad que se encuentra en un rango de 0 a 100. Así, un índice de Gini de 0 representa una equidad perfecta, mientras que un índice de 100 representa una inequidad perfecta.
link6="https://docs.google.com/spreadsheets/d/e/2PACX-1vSOdz-vUkw9_yctGztLL_PS87cCS7GoU10PiLA3ywnO8-iNXG1OBi_8OBOpZ0r3AQ/pub?gid=826191890&single=true&output=csv"
DataGini= read.csv(link6, stringsAsFactors = F)
DataGini1 = DataGini[,c(1,48:52)]
names(DataGini1) = c("Pais","2003","2004","2005", "2006", "2007")

DataGini1$`2003` =   gsub("\\,", ".", DataGini1$`2003`) 
DataGini1$`2004` =   gsub("\\,", ".", DataGini1$`2004`) 
DataGini1$`2005` =   gsub("\\,", ".", DataGini1$`2005`) 
DataGini1$`2006` =   gsub("\\,", ".", DataGini1$`2006`) 
DataGini1$`2007` =   gsub("\\,", ".", DataGini1$`2007`)
DataGini1[,c(2:6)]=lapply(DataGini1[,c(2:6)],as.numeric)

DataGini1$Gini = rowMeans(DataGini1[,2:6],na.rm = TRUE)
DataGini1= DataGini1[,c (1,7)]
DataGini1= DataGini1[complete.cases(DataGini1),]
row.names(DataGini1) = NULL
Data de alfabetización
  • Es un componente para la variable independiente “Densidad” para la hipótesis 2 del trabajo: aumento en la calidad de vida.
link7="https://docs.google.com/spreadsheets/d/e/2PACX-1vTTojodRJwkAu-98fKnnuzUCJZE-Wj4tDFm7F2XQLDeT3CSifu-yWiHZuZv-uzL2Q/pub?gid=1142139153&single=true&output=csv"
EDU=read.csv(link7,stringsAsFactors = F)

EDU1=EDU[,c(1,48:52)]
names(EDU1)=c("Pais","2003","2004","2005","2006","2007")

EDU1$`2003`= gsub("\\,", ".",EDU1$`2003`)
EDU1$`2004`= gsub("\\,", ".",EDU1$`2004`)
EDU1$`2005`= gsub("\\,", ".",EDU1$`2005`)
EDU1$`2006`= gsub("\\,", ".",EDU1$`2006`)
EDU1$`2007`= gsub("\\,", ".",EDU1$`2007`)
EDU1[c(2:6)] = lapply(EDU1[c(2:6)], as.numeric)

EDU1$EDU = rowMeans(EDU1[,2:6],na.rm = TRUE)
EDU1= EDU1[,c (1,7)]
EDU1= EDU1[complete.cases(EDU1),]
row.names(EDU1) = NULL
Data de acceso a la electricidad
  • Es un componente para la variable independiente “Densidad” para la hipótesis 2 del trabajo: aumento en la calidad de vida.
link8="https://docs.google.com/spreadsheets/d/e/2PACX-1vQrlQtEYBGaf0IhPz_H9oaM8uD1UaVoR1J_xP6bYe8ZqNAVSRJiLh4DXq52KomGsQ/pub?gid=2059415238&single=true&output=csv"
ENER=read.csv(link8,stringsAsFactors = F)

ENER1=ENER[,c(1,48:52)]
names(ENER1)=c("Pais","2003","2004","2005","2006","2007") 

ENER1$`2003`= gsub("\\,", ".",ENER1$`2003`)
ENER1$`2004`= gsub("\\,", ".",ENER1$`2004`)
ENER1$`2005`= gsub("\\,", ".",ENER1$`2005`)
ENER1$`2006`= gsub("\\,", ".",ENER1$`2006`)
ENER1$`2007`= gsub("\\,", ".",ENER1$`2007`)
ENER1[c(2:6)] = lapply(ENER1[c(2:6)], as.numeric)

ENER1$ENER = rowMeans(ENER1[,2:6],na.rm = TRUE)
ENER1= ENER1[,c (1,7)]
ENER1= ENER1[complete.cases(ENER1),]
row.names(ENER1) = NULL
Data de gasto en investigación y desarrollo
  • El porcentaje del PBI que se destina a gastos de investigación y desarrollo por país.
link9="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ6hJgrir9ZBg6Qo5dfwQGluWp4oZLEfSVgz-sVzHEqav1pulMwix_2jNcjxcCkjw/pub?gid=1845220649&single=true&output=csv"
GAST=read.csv(link9,stringsAsFactors = F)

GAST1=GAST[,c(1,48:52)]
names(GAST1)=c("Pais","2003","2004","2005","2006","2007") 

GAST1$`2003`= gsub("\\,", ".",GAST1$`2003`)
GAST1$`2004`= gsub("\\,", ".",GAST1$`2004`)
GAST1$`2005`= gsub("\\,", ".",GAST1$`2005`)
GAST1$`2006`= gsub("\\,", ".",GAST1$`2006`)
GAST1$`2007`= gsub("\\,", ".",GAST1$`2007`)
GAST1[c(2:6)] = lapply(GAST1[c(2:6)], as.numeric)

GAST1$GAST = rowMeans(GAST1[,2:6],na.rm = TRUE)
GAST1= GAST1[,c (1,7)]
GAST1= GAST1[complete.cases(GAST1),]
row.names(GAST1) = NULL
Data de suscripciones a banda ancha
  • Suscripciones de banda ancha fija por cada 100 personas.
link10="https://docs.google.com/spreadsheets/d/e/2PACX-1vTJo2T8oxMssc3utiol3H4IZDOw4jq1sNu12vGh4LUz2aZU-BTtDvkhDaESiIwCJQ/pub?gid=508597872&single=true&output=csv"
ban=read.csv(link10,stringsAsFactors = F)

ban1=ban[,c(1,48:52)]
names(ban1)=c("Pais","2003","2004","2005","2006","2007") 

ban1$`2003`= gsub("\\,", ".",ban1$`2003`)
ban1$`2004`= gsub("\\,", ".",ban1$`2004`)
ban1$`2005`= gsub("\\,", ".",ban1$`2005`)
ban1$`2006`= gsub("\\,", ".",ban1$`2006`)
ban1$`2007`= gsub("\\,", ".",ban1$`2007`)
ban1[c(2:6)] = lapply(ban1[c(2:6)], as.numeric)

ban1$ban = rowMeans(ban1[,2:6],na.rm = TRUE)
ban1= ban1[,c (1,7)]
ban1= ban1[complete.cases(ban1),]
row.names(ban1) = NULL
Data de Cobertura de tratamiento antirretroviral
  • Mide la cobertura de terapia antirretroviral en el % de personas que viven con VIH.
link11="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ7mf0BRsmhcre-RKQseWRY_aGZrVve25Wmmm85m4OMF2Eb8_NyqGhDjrRmePcuWg/pub?gid=26033417&single=true&output=csv"
antiRetrov=read.csv(link11, stringsAsFactors = F)

antiRetrov1=antiRetrov[,c(1,48:52)]
names(antiRetrov1) = c("Pais","2003","2004","2005", "2006", "2007")
antiRetrov1[,c(2:6)]=lapply(antiRetrov1[,c(2:6)],as.numeric) #volver numerico en grupo
## Warning in lapply(antiRetrov1[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov1[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov1[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov1[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov1[, c(2:6)], as.numeric): NAs introduced by
## coercion
antiRetrov1$CobARet = rowMeans(antiRetrov1[,2:6], na.rm = TRUE)
antiRetrov1= antiRetrov1[,c (1,7)]
antiRetrov1 = antiRetrov1[complete.cases(antiRetrov1),]
row.names(antiRetrov1) = NULL
Data de Esperanza de vida en mujeres
  • Nivel estimado de esperanza de vida para las mujeres por país de origen a nivel mundial.
link12="https://docs.google.com/spreadsheets/d/e/2PACX-1vQoWu6HPrX8qbiqsewwImM89BxWol-bI-b_ubT6v_hxbPG9JTxXFxaxX5nUJTm-bg/pub?gid=72965045&single=true&output=csv"
EspVida=read.csv(link12, stringsAsFactors = F)

EspVida1=EspVida[,c(1,48:52)]
names(EspVida1) = c("Pais","2003","2004","2005", "2006", "2007")
EspVida1$`2003` =   gsub("\\,", ".", EspVida1$`2003`) 
EspVida1$`2004` =   gsub("\\,", ".", EspVida1$`2004`) 
EspVida1$`2005` =   gsub("\\,", ".", EspVida1$`2005`) 
EspVida1$`2006` =   gsub("\\,", ".", EspVida1$`2006`) 
EspVida1$`2007` =   gsub("\\,", ".", EspVida1$`2007`)
EspVida1[,c(2:6)]=lapply(EspVida1[,c(2:6)],as.numeric) #volver numerico en grupo

EspVida1$VidaM = rowMeans(EspVida1[,2:6], na.rm = TRUE)
EspVida1= EspVida1[,c (1,7)]
EspVida1 = EspVida1[complete.cases(EspVida1),]
row.names(EspVida1) = NULL
Data de Migracion neta
  • La migración neta es el total neto de personas que migraron durante el periodo: la cantidad total de inmigrantes menos la cantidad anual de emigrantes, incluidos los ciudadanos y los no ciudadanos. Los datos son estimaciones de cinco años.
link13="https://docs.google.com/spreadsheets/d/e/2PACX-1vSri2T-73zRzhVczOzNqkAKmQ_qLcWrQHzuVl7QIFUE7fJRUbtKoDCeJ1zixpCjRA/pub?gid=1968467072&single=true&output=csv"
neta=read.csv(link13, stringsAsFactors = F)

migra1=neta[,c(1,52)]
names(migra1) = c("Pais","Migracion")
migra1 = migra1[complete.cases(migra1),]
row.names(migra1) = NULL

migra1[,c(2)]=as.numeric(migra1[,c(2)]) #volver numerico 
Data de Ayuda Oficial al Desarrollo (ODA)
  • Una de las variables de control es Ayuda Oficial al Desarrollo: desembolso de préstamos por parte de los organismos oficiales de los miembros del Comité de Asistencia para el Desarrollo (DAC) y de instituciones multilaterales a países receptores.
link14="https://docs.google.com/spreadsheets/d/e/2PACX-1vQMbPO51JV-DhQLOOX9GnTSN7Z4hlKuFjX6Ft9QRS07q1i28GeqAsAAhdfXkNq-uA/pub?gid=1457611805&single=true&output=csv"
ODA=read.csv(link14, stringsAsFactors = F)

ODA1=ODA[,c(1,48:52)]
names(ODA1) = c("Pais","2003","2004","2005", "2006", "2007")

ODA1$`2003` =   gsub("\\,", ".", ODA1$`2003`) 
ODA1$`2004` =   gsub("\\,", ".", ODA1$`2004`) 
ODA1$`2005` =   gsub("\\,", ".", ODA1$`2005`) 
ODA1$`2006` =   gsub("\\,", ".", ODA1$`2006`) 
ODA1$`2007` =   gsub("\\,", ".", ODA1$`2007`) 
ODA1[,c(2:6)]=lapply(ODA1[,c(2:6)],as.numeric) #volver numerico en grupo

ODA1$ODA = rowMeans(ODA1[,2:6], na.rm = TRUE)
ODA1= ODA1[,c (1,7)]
ODA1 = ODA1[complete.cases(ODA1),]
row.names(ODA1) = NULL
Data de Pais Africano
  • Una variable control dicotómica para saber si es o no un país africano.
link15="https://docs.google.com/spreadsheets/d/e/2PACX-1vT-0H84cFoinLuU8HZaFS1Yln8HhKYcVtaKCbcKn3iShculk-vuU3QJ888lCbUd_Q/pub?gid=1165629081&single=true&output=csv"
AFRICA=read.csv(link15, stringsAsFactors = F)
names(AFRICA)=c("Pais", "Africa")
Data de Población total de mujeres
  • Una variable de control demográfica.
link16="https://docs.google.com/spreadsheets/d/e/2PACX-1vTnOQNQQsmZQ1Ru-bqF5mBAlnpbxQOOH_IUuMv7XylSyOIvQ_Ij1OB64-a-pXaSgg/pub?gid=871901844&single=true&output=csv"
women=read.csv(link16, stringsAsFactors = F)

women1=women[,c(1,48:52)]
names(women1) = c("Pais","2003","2004","2005", "2006", "2007")

women1$`2003` =   gsub("\\,", ".", women1$`2003`) 
women1$`2004` =   gsub("\\,", ".", women1$`2004`) 
women1$`2005` =   gsub("\\,", ".", women1$`2005`) 
women1$`2006` =   gsub("\\,", ".", women1$`2006`) 
women1$`2007` =   gsub("\\,", ".", women1$`2007`) 
women1[,c(2:6)]=lapply(women1[,c(2:6)],as.numeric) #volver numerico en grupo

women1$Women = rowMeans(women1[,2:6], na.rm = TRUE)
women1= women1[,c (1,7)]
women1 = women1[complete.cases(women1),]
row.names(women1) = NULL

2. Carga y limpieza de la segunda data

Para este segundo periodo (2013-2017), trabajamos con data de la variable dependiente de los quinquenios 2013-2017 y con datas de las variables independientes y de control de los quinquenios 2008-2012.

Data de Prevalencia VIH en mujeres (2013-2017)
  • La variable dependiente es la prevalencia del VIH en mujeres para los años 2013-2017. Es una variable que está en porcentaje.
DataVIH=read.csv(link1, stringsAsFactors = F)
DataVIH2 = DataVIH[,c(1,58:62)]
names(DataVIH2) = c("Pais","2013","2014","2015", "2016", "2017")

DataVIH2$`2013` =   gsub("\\,", ".", DataVIH2$`2013`) 
DataVIH2$`2014` =   gsub("\\,", ".", DataVIH2$`2014`) 
DataVIH2$`2015` =   gsub("\\,", ".", DataVIH2$`2015`) 
DataVIH2$`2016` =   gsub("\\,", ".", DataVIH2$`2016`) 
DataVIH2$`2017` =   gsub("\\,", ".", DataVIH2$`2017`)
DataVIH2[,c(2:6)]=lapply(DataVIH2[,c(2:6)],as.numeric) #volver numerico en grupo

DataVIH2 = DataVIH2[complete.cases(DataVIH2),]
row.names(DataVIH2) = NULL

DataVIH2$VIH = rowMeans(DataVIH2[,2:6])
DataVIH2 = DataVIH2[,c (1,7)]

NOTA Todas las variables independientes en esta segunda data serán del periodo 2008 hasta el 2012, y son las mismas variables independientes de la primera data pero en otro periodo.

Data de Población Activa Mujeres
  • Uno de los componentes de la variable independiente “empoderamiento” para la primera hipótesis del trabajo: el aumento del reforzamiento de las capacidades femeninas.
DataAct=read.csv(link2,stringsAsFactors = F)
DataAct2 = DataAct[,c(1,53:57)]
names(DataAct2) = c("Pais","2008","2009", "2010", "2011", "2012")

DataAct2$`2008` =   gsub("\\,", ".", DataAct2$`2008`) 
DataAct2$`2009` =   gsub("\\,", ".", DataAct2$`2009`) 
DataAct2$`2010` =   gsub("\\,", ".", DataAct2$`2010`) 
DataAct2$`2011` =   gsub("\\,", ".", DataAct2$`2011`) 
DataAct2$`2012` =   gsub("\\,", ".", DataAct2$`2012`) 
DataAct2[,c(2:6)]=lapply(DataAct2[,c(2:6)],as.numeric) #volver numerico en grupo

DataAct2 = DataAct2[complete.cases(DataAct2),]
row.names(DataAct2) = NULL

DataAct2$PoblacionActiva = rowMeans(DataAct2[,2:6])
DataAct2= DataAct2[,c (1,7)]
Data de Participación en la Fuerza Laboral Mujeres
  • Otro de los componentes de la variable independiente “empoderamiento” para la primera hipótesis del trabajo: el aumento del reforzamiento de las capacidades femeninas.
DataFLM= read.csv(link3, stringsAsFactors = F)
DataFLM2 = DataFLM[,c(1,53:57)]
names(DataFLM2) = c("Pais","2008","2009","2010", "2011", "2012")

DataFLM2$`2008` =   gsub("\\,", ".", DataFLM2$`2008`) 
DataFLM2$`2009` =   gsub("\\,", ".", DataFLM2$`2009`) 
DataFLM2$`2010` =   gsub("\\,", ".", DataFLM2$`2010`) 
DataFLM2$`2011` =   gsub("\\,", ".", DataFLM2$`2011`) 
DataFLM2$`2012` =   gsub("\\,", ".", DataFLM2$`2012`)
DataFLM2[,c(2:6)]=lapply(DataFLM2[,c(2:6)],as.numeric)

DataFLM2$FLM = rowMeans(DataFLM2[,2:6],na.rm = TRUE)
DataFLM2= DataFLM2[,c (1,7)]
DataFLM2 = DataFLM2[complete.cases(DataFLM2),]
row.names(DataFLM2) = NULL
Data de Uso de Métodos anticoceptivos
  • Es una variable independiente para la primera hipótesis sobre el aumento del reforzamiento de las capacidades femeninas.
DataMetodos= read.csv(link4, stringsAsFactors = F)
DataMetodos2 = DataMetodos[,c(1,53:57)]
names(DataMetodos2) = c("Pais","2008","2009","2010", "2011", "2012")

DataMetodos2$`2008` =   gsub("\\,", ".", DataMetodos2$`2008`) 
DataMetodos2$`2009` =   gsub("\\,", ".", DataMetodos2$`2009`) 
DataMetodos2$`2010` =   gsub("\\,", ".", DataMetodos2$`2010`) 
DataMetodos2$`2011` =   gsub("\\,", ".", DataMetodos2$`2011`) 
DataMetodos2$`2012` =   gsub("\\,", ".", DataMetodos2$`2012`)
DataMetodos2[,c(2:6)]=lapply(DataMetodos2[,c(2:6)],as.numeric)

DataMetodos2$Metodos = rowMeans(DataMetodos2[,2:6],na.rm = TRUE)
DataMetodos2= DataMetodos2[,c (1,7)]
DataMetodos2 = DataMetodos2[complete.cases(DataMetodos2),]
row.names(DataMetodos2) = NULL
Data de población que vive en barrios de tugurios
  • Es un componente para la hipótesis 2 del trabajo: un aumento en la calidad de vida.
DataTugurios= read.csv(link5, stringsAsFactors = F)
DataTugurios2 = DataTugurios[,c(1,53:57)]
names(DataTugurios2) = c("Pais","2008","2009","2010", "2011", "2012")

DataTugurios2$`2008` =   gsub("\\,", ".", DataTugurios2$`2008`) 
DataTugurios2$`2009` =   gsub("\\,", ".", DataTugurios2$`2009`) 
DataTugurios2$`2010` =   gsub("\\,", ".", DataTugurios2$`2010`) 
DataTugurios2$`2011` =   gsub("\\,", ".", DataTugurios2$`2011`) 
DataTugurios2$`2012` =   gsub("\\,", ".", DataTugurios2$`2012`)
DataTugurios2[,c(2:6)]=lapply(DataTugurios2[,c(2:6)],as.numeric)

DataTugurios2$BarriosTugurios= rowMeans(DataTugurios2[,2:6],na.rm = TRUE)
DataTugurios2= DataTugurios2[,c (1,7)]
DataTugurios2 = DataTugurios2[complete.cases(DataTugurios2),]
row.names(DataTugurios2) = NULL
Data del índice de Gini
  • Es el índice de desigualdad que se encuentra en un rango de 0 a 100. Así, un índice de Gini de 0 representa una equidad perfecta, mientras que un índice de 100 representa una inequidad perfecta.
DataGini= read.csv(link6, stringsAsFactors = F)
DataGini2 = DataGini[,c(1,53:57)]
names(DataGini2) = c("Pais","2008","2009","2010", "2011", "2012")

DataGini2$`2008` =   gsub("\\,", ".", DataGini2$`2008`) 
DataGini2$`2009` =   gsub("\\,", ".", DataGini2$`2009`) 
DataGini2$`2010` =   gsub("\\,", ".", DataGini2$`2010`) 
DataGini2$`2011` =   gsub("\\,", ".", DataGini2$`2011`) 
DataGini2$`2012` =   gsub("\\,", ".", DataGini2$`2012`)
DataGini2[,c(2:6)]=lapply(DataGini2[,c(2:6)],as.numeric)

DataGini2$Gini= rowMeans(DataGini2[,2:6],na.rm = TRUE)
DataGini2= DataGini2[,c (1,7)]
DataGini2 = DataGini2[complete.cases(DataGini2),]
row.names(DataGini2) = NULL
Data de alfabetización
  • Es un componente para la variable independiente “Densidad” para la hipótesis 2 del trabajo: aumento en la calidad de vida.
EDU=read.csv(link7,stringsAsFactors = F)
EDU2=EDU[,c(1,53:57)]
names(EDU2)=c("Pais", "2008","2009","2010","2011","2012")

EDU2$`2008`= gsub("\\,", ".",EDU2$`2008`)
EDU2$`2009`= gsub("\\,", ".",EDU2$`2009`)
EDU2$`2010`= gsub("\\,", ".",EDU2$`2010`)
EDU2$`2011`= gsub("\\,", ".",EDU2$`2011`)
EDU2$`2012`= gsub("\\,", ".",EDU2$`2012`)
EDU2[c(2:6)] = lapply(EDU2[c(2:6)], as.numeric)

EDU2$EDU = rowMeans(EDU2[,2:6],na.rm = TRUE)
EDU2= EDU2[,c (1,7)]
EDU2= EDU2[complete.cases(EDU2),]
row.names(EDU2) = NULL
Data de acceso a la electricidad
  • Es un componente para la variable independiente “Densidad” para la hipótesis 2 del trabajo: aumento en la calidad de vida.
ENER=read.csv(link8,stringsAsFactors = F)
ENER2=ENER[,c(1,53:57)]
names(ENER2)=c("Pais","2008","2009","2010","2011","2012")

ENER2$`2008`= gsub("\\,", ".",ENER2$`2008`)
ENER2$`2009`= gsub("\\,", ".",ENER2$`2009`)
ENER2$`2010`= gsub("\\,", ".",ENER2$`2010`)
ENER2$`2011`= gsub("\\,", ".",ENER2$`2011`)
ENER2$`2012`= gsub("\\,", ".",ENER2$`2012`)
ENER2[c(2:6)] = lapply(ENER2[c(2:6)], as.numeric)

ENER2$ENER = rowMeans(ENER2[,2:6],na.rm = TRUE)
ENER2= ENER2[,c (1,7)]
ENER2= ENER2[complete.cases(ENER2),]
row.names(ENER2) = NULL
Data de Gasto en investigación y desarrollo
  • El porcentaje del PBI que se destina a gastos de investigación y desarrollo por país.
GAST=read.csv(link9,stringsAsFactors = F)

GAST2=GAST[,c(1,53:57)]
names(GAST2)=c("Pais","2008","2009","2010","2011","2012")

GAST2$`2008`= gsub("\\,", ".",GAST2$`2008`)
GAST2$`2009`= gsub("\\,", ".",GAST2$`2009`)
GAST2$`2010`= gsub("\\,", ".",GAST2$`2010`)
GAST2$`2011`= gsub("\\,", ".",GAST2$`2011`)
GAST2$`2012`= gsub("\\,", ".",GAST2$`2012`)
GAST2[c(2:6)] = lapply(GAST2[c(2:6)], as.numeric)

GAST2$GAST = rowMeans(GAST2[,2:6],na.rm = TRUE)
GAST2= GAST2[,c (1,7)]
GAST2= GAST2[complete.cases(GAST2),]
row.names(GAST2) = NULL
Data de suscripciones a banda ancha
  • Suscripciones de banda ancha fija por cada 100 personas.
ban=read.csv(link10,stringsAsFactors = F)

ban2=ban[,c(1,53:57)]
names(ban2)=c("Pais","2008","2009","2010","2011","2012")

ban2$`2008`= gsub("\\,", ".",ban2$`2008`)
ban2$`2009`= gsub("\\,", ".",ban2$`2009`)
ban2$`2010`= gsub("\\,", ".",ban2$`2010`)
ban2$`2011`= gsub("\\,", ".",ban2$`2011`)
ban2$`2012`= gsub("\\,", ".",ban2$`2012`)
ban2[c(2:6)] = lapply(ban2[c(2:6)], as.numeric)

ban2$ban = rowMeans(ban2[,2:6],na.rm = TRUE)
ban2= ban2[,c (1,7)]
ban2= ban2[complete.cases(ban2),]
row.names(ban2) = NULL
Data de Cobertura de tratamiento antirretroviral
  • Mide la cobertura de terapia antirretroviral en el % de personas que viven con VIH.
antiRetrov=read.csv(link11, stringsAsFactors = F)

antiRetrov2=antiRetrov[,c(1,53:57)]
names(antiRetrov2) = c("Pais","2008","2009","2010","2011","2012")
antiRetrov2[,c(2:6)]=lapply(antiRetrov2[,c(2:6)],as.numeric) #volver numerico en grupo
## Warning in lapply(antiRetrov2[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov2[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov2[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov2[, c(2:6)], as.numeric): NAs introduced by
## coercion

## Warning in lapply(antiRetrov2[, c(2:6)], as.numeric): NAs introduced by
## coercion
antiRetrov2$CobARet = rowMeans(antiRetrov2[,2:6], na.rm = TRUE)
antiRetrov2= antiRetrov2[,c (1,7)]
antiRetrov2 = antiRetrov2[complete.cases(antiRetrov2),]
row.names(antiRetrov2) = NULL
Data de Esperanza de vida en mujeres
  • Nivel estimado de esperanza de vida para las mujeres por país de origen a nivel mundial.
EspVida=read.csv(link12, stringsAsFactors = F)

EspVida2=EspVida[,c(1,53:57)]
names(EspVida2) = c("Pais","2008","2009","2010","2011","2012")
EspVida2$`2008` =   gsub("\\,", ".", EspVida2$`2008`) 
EspVida2$`2009` =   gsub("\\,", ".", EspVida2$`2009`) 
EspVida2$`2010` =   gsub("\\,", ".", EspVida2$`2010`) 
EspVida2$`2011` =   gsub("\\,", ".", EspVida2$`2011`) 
EspVida2$`2012` =   gsub("\\,", ".", EspVida2$`2012`)
EspVida2[,c(2:6)]=lapply(EspVida2[,c(2:6)],as.numeric) #volver numerico en grupo

EspVida2$VidaM = rowMeans(EspVida2[,2:6], na.rm = TRUE)
EspVida2= EspVida2[,c (1,7)]
EspVida2 = EspVida2[complete.cases(EspVida2),]
row.names(EspVida2) = NULL
Data de Migracion neta
  • La migración neta es el total neto de personas que migraron durante el periodo: la cantidad total de inmigrantes menos la cantidad anual de emigrantes, incluidos los ciudadanos y los no ciudadanos. Los datos son estimaciones de cinco años.
neta=read.csv(link13, stringsAsFactors = F)

migra2=neta[,c(1,57)]
names(migra2) = c("Pais","Migracion")
migra2 = migra2[complete.cases(migra2),]
row.names(migra2) = NULL

migra2[,c(2)]=as.numeric(migra2[,c(2)]) #volver numerico 
Data de Ayuda Oficial al Desarrollo (ODA)
  • Una de las variables de control es Ayuda Oficial al Desarrollo: desembolso de préstamos por parte de los organismos oficiales de los miembros del Comité de Asistencia para el Desarrollo (DAC) y de instituciones multilaterales a países receptores.
ODA=read.csv(link14, stringsAsFactors = F)
ODA2=ODA[,c(1,53:57)]
names(ODA2) = c("Pais","2008","2009","2010", "2011", "2012")

ODA2$`2008` =   gsub("\\,", ".", ODA2$`2008`) 
ODA2$`2009` =   gsub("\\,", ".", ODA2$`2009`) 
ODA2$`2010` =   gsub("\\,", ".", ODA2$`2010`) 
ODA2$`2011` =   gsub("\\,", ".", ODA2$`2011`) 
ODA2$`2012` =   gsub("\\,", ".", ODA2$`2012`) 
ODA2[,c(2:6)]=lapply(ODA2[,c(2:6)],as.numeric) #volver numerico en grupo

ODA2$ODA = rowMeans(ODA2[,2:6], na.rm = TRUE)
ODA2= ODA2[,c (1,7)]
ODA2 = ODA2[complete.cases(ODA2),]
row.names(ODA2) = NULL
Data de Pais Africano
  • Una variable control dicotómica para saber si es o no un país africano.
AFRICA=read.csv(link15, stringsAsFactors = F)
names(AFRICA)=c("Pais", "Africa")
Data de Población total de mujeres
  • Una variable de control demográfica.
women=read.csv(link16, stringsAsFactors = F)
women2=women[,c(1,53:57)]
names(women2) = c("Pais","2008","2009","2010", "2011", "2012")

women2$`2008` =   gsub("\\,", ".", women2$`2008`) 
women2$`2009` =   gsub("\\,", ".", women2$`2009`) 
women2$`2010` =   gsub("\\,", ".", women2$`2010`) 
women2$`2011` =   gsub("\\,", ".", women2$`2011`) 
women2$`2012` =   gsub("\\,", ".", women2$`2012`) 
women2[,c(2:6)]=lapply(women2[,c(2:6)],as.numeric) #volver numerico en grupo

women2$Women = rowMeans(women2[,2:6], na.rm = TRUE)
women2= women2[,c (1,7)]
women2 = women2[complete.cases(women2),]
row.names(women2) = NULL

3. Aplicación del merge

Peridodo 2008-2012 para la variable dependiente y 2003-2007 para las variables independientes
  • Hacemos el merge únicamente con las variables que serán resumidas en el análisis factorial. Lo hacemos con la opción de quedarnos con NA’s porque procedermos a imputar datos con la media en el análisis factorial (de lo contrario nos quedaríamos con menos de 50 casos). Decidimos imputar solo a los componentes de los índices porque al pasar por el análisis factorial, donde serán resumidos, el efecto no disminuye mucho en relación a variables que son imputadas sin pasar por un análisis factorial. El merge final se realizará con los índices producidos.
empoderamiento1=merge(DataAct1,DataFLM1,all.x=T,all.y=T)

desigualdad1=merge(DataTugurios1,DataGini1,all.x=T,all.y=T)
est1=merge(EDU1,ENER1,all.x=T,all.y=T)
estado1=merge(est1,GAST1,all.x=T,all.y=T)
densidad1=merge(estado1,ban1,all.x=T,all.y=T)
Calidad1=merge(desigualdad1,densidad1,all.x=T,all.y=T)

salud1=merge(EspVida1,antiRetrov1, all.x=T,all.y=T)
Periodo 2013-2017 para la variable dependiente y 2008-2012 para las variables independientes
  • En este periodo también hacemos el merge únicamente con las variables que serán resumidas en el análisis factorial. Lo hacemos con la opción de quedarnos con NA’s porque procedermos a imputar datos con la media en el análisis factorial (de lo contrario nos quedaríamos con menos de 50 casos). Decidimos imputar solo a los componentes de los índices porque al pasar por el análisis factorial, donde serán resumidos, el efecto no disminuye mucho en relación a variables que son imputadas sin pasar por un análisis factorial. El merge final se realizará con los índices producidos.
empoderamiento2=merge(DataAct2,DataFLM2,all.x=T,all.y=T)

est2=merge(DataTugurios2,EDU2,all.x=T,all.y=T)
estado2=merge(ENER2,est2,all.x=T,all.y=T)
densidad2=merge(estado2,GAST2,all.x=T,all.y=T)
Calidad2=merge(densidad2,ban2,all.x=T,all.y=T)

salud2=merge(EspVida2,antiRetrov2, all.x=T,all.y=T)

4. Descripción de datos

Utilizamos la técnica del análisis factorial para saber que tan apropiado es juntar las variables en varios indices. La pregunta que nos hacemos es ¿en cuantas dimensiones podemos resumir todas estas variables? Los indices actuarán como variables independientes latentes al conformar la hipótesis.

Análisis factorial para ‘Empoderamiento’
PRIMERA DATA: variables independientes del 2003 al 2007
  • Para crear esta variable independiente de la primera hipótesis usamos dos datas: Tasa de Población Activa y Fuerza Laboral.

Creamos una copia de la data y ponemos a los países como índice.

empoderamiento1_x=empoderamiento1
row.names(empoderamiento1) = empoderamiento1$Pais
empoderamiento1$Pais = NULL
head(empoderamiento1)
##             PoblacionActiva      FLM
## Afghanistan        43.55220       NA
## Albania            48.17600 29.15748
## Algeria            12.87380       NA
## Angola             75.08880 62.67960
## Arab World         19.62438 20.61435
## Argentina          49.57260 49.55246

Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.

empoderamiento1[is.na(empoderamiento1$PoblacionActiva), "PoblacionActiva"]=mean(empoderamiento1$PoblacionActiva, na.rm=T)
empoderamiento1[is.na(empoderamiento1$FLM), "FLM"]=mean(empoderamiento1$FLM, na.rm=T)

Estandarizamos:

empoderamiento1=as.data.frame(scale(empoderamiento1[,c(1,2)]))
head(empoderamiento1)
##             PoblacionActiva         FLM
## Afghanistan     -0.43930039  0.00000000
## Albania         -0.13370714 -1.37188100
## Algeria         -2.46687804  0.00000000
## Angola           1.64499686  0.96623135
## Arab World      -2.02072269 -1.96774987
## Argentina       -0.04140391  0.05063512

Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.

library(psych)
pearson1 = cor(empoderamiento1) #sacar la correlación de los puntajes estandarizadas
pearson1
##                 PoblacionActiva       FLM
## PoblacionActiva       1.0000000 0.7868555
## FLM                   0.7868555 1.0000000
cor.plot(pearson1, 
         numbers=T, 
         upper=FALSE, 
         main = "Correlation", 
         show.legend = FALSE) #verlo en un gráfico

KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.5.

KMO(empoderamiento1) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = empoderamiento1)
## Overall MSA =  0.5
## MSA for each item = 
## PoblacionActiva             FLM 
##             0.5             0.5

Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial.

#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(empoderamiento1, n=nrow(empoderamiento1)) 
## R was not square, finding R from data
## $chisq
## [1] 231.196
## 
## $p.value
## [1] 3.2698e-52
## 
## $df
## [1] 1

La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.

¿Cuántos índices debería crear? El R nos sugiere 1 índice.

fa.parallel(pearson1, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(empoderamiento1)) #cuantos indices deberia formar

## Parallel analysis suggests that the number of factors =  1  and the number of components =  NA
empoderamiento1 = fa(empoderamiento1, 
                     nfactors=1, 
                     rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
empoderamiento1$loadings
## 
## Loadings:
##                 MR1  
## PoblacionActiva 0.887
## FLM             0.887
## 
##                  MR1
## SS loadings    1.574
## Proportion Var 0.787

Ambas variables aportan de igual modo al índice. Se logró resumir el 78.7% de los componentes PoblacionActiva y FLM.

El MR1 está compuesto por ambas variables.

fa.diagram(empoderamiento1)

Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.

#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(empoderamiento1$communalities)
## PoblacionActiva             FLM 
##       0.7868555       0.7868555

Ambas variables aportan de igual modo al modelo.

Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.

# mientras mas grande peor (lo que mantiene)
sort(empoderamiento1$uniquenesses)
## PoblacionActiva             FLM 
##       0.2131445       0.2131445

La variable que está más cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores.

sort(empoderamiento1$complexity)
## PoblacionActiva             FLM 
##               1               1
empoderamiento1$scores
##                                                               MR1
## Afghanistan                                          -0.218081911
## Albania                                              -0.747419191
## Algeria                                              -1.224632385
## Angola                                                1.296292143
## Arab World                                           -1.979997621
## Argentina                                             0.004582650
## Armenia                                              -0.310238745
## Aruba                                                 0.367840847
## Australia                                             0.498514225
## Austria                                               0.105783795
## Azerbaijan                                            0.302854548
## Bahamas, The                                          0.623402726
## Bahrain                                              -0.853641697
## Bangladesh                                           -1.472732756
## Barbados                                              0.960750286
## Belarus                                               0.329622731
## Belgium                                              -0.306988194
## Belize                                               -0.867062954
## Benin                                                 1.580277249
## Bhutan                                                0.567385718
## Bolivia                                               0.743099218
## Bosnia and Herzegovina                               -1.034565215
## Botswana                                              0.336834077
## Brazil                                                0.394759215
## Brunei Darussalam                                     0.195202744
## Bulgaria                                             -0.243377536
## Burkina Faso                                          1.389544683
## Burundi                                               1.045368902
## Cabo Verde                                            0.136991681
## Cambodia                                              1.808782549
## Cameroon                                              1.760772259
## Canada                                                0.819332764
## Caribbean small states                                0.072862091
## Cayman Islands                                        1.053765461
## Central African Republic                              0.509861315
## Central Europe and the Baltics                       -0.125440772
## Chad                                                  0.448841779
## Channel Islands                                       0.001251200
## Chile                                                -0.593441335
## China                                                 0.546450719
## Colombia                                              0.227261289
## Comoros                                              -1.114769780
## Congo, Dem. Rep.                                      1.415986742
## Congo, Rep.                                           1.166573364
## Costa Rica                                           -0.397352481
## Cote d'Ivoire                                        -0.061868183
## Croatia                                              -0.336865361
## Cuba                                                 -0.959734638
## Cyprus                                                0.310985908
## Czech Republic                                        0.069977696
## Denmark                                               0.739197542
## Djibouti                                             -0.037241149
## Dominican Republic                                   -0.655151160
## Early-demographic dividend                           -0.865927088
## East Asia & Pacific                                   0.386330446
## East Asia & Pacific (excluding high income)           0.442014163
## East Asia & Pacific (IDA & IBRD countries)            0.436908551
## Ecuador                                               0.176081095
## Egypt, Arab Rep.                                     -2.005033677
## El Salvador                                          -0.264923711
## Equatorial Guinea                                     0.060289066
## Eritrea                                               0.744175438
## Estonia                                               0.277800750
## Eswatini                                             -0.498152426
## Ethiopia                                              1.679320454
## Euro area                                            -0.106349196
## Europe & Central Asia                                -0.006807899
## Europe & Central Asia (excluding high income)        -0.001337942
## Europe & Central Asia (IDA & IBRD countries)         -0.019361503
## European Union                                       -0.039837413
## Fiji                                                 -0.946866807
## Finland                                               0.515624322
## Fragile and conflict affected situations             -0.034553476
## France                                                0.052207623
## French Polynesia                                     -0.151777904
## Gabon                                                -0.271022288
## Gambia, The                                          -0.054741891
## Georgia                                               0.411265626
## Germany                                               0.092597943
## Ghana                                                 1.324422734
## Greece                                               -0.488210709
## Guam                                                  0.340044186
## Guatemala                                            -0.378624796
## Guinea                                                0.416189510
## Guinea-Bissau                                         0.491520630
## Guyana                                               -0.513258095
## Haiti                                                 0.195356957
## Heavily indebted poor countries (HIPC)                0.485561463
## High income                                           0.149685853
## Honduras                                             -0.589130873
## Hong Kong SAR, China                                  0.171289897
## Hungary                                              -0.456806438
## IBRD only                                            -0.023631135
## Iceland                                               1.693784620
## IDA & IBRD total                                     -0.018782865
## IDA blend                                            -0.806941564
## IDA only                                              0.161754091
## IDA total                                             0.001778396
## India                                                -1.185765411
## Indonesia                                            -0.162841980
## Iran, Islamic Rep.                                   -2.112360416
## Iraq                                                 -2.536029376
## Ireland                                               0.238920337
## Isle of Man                                           0.256001551
## Israel                                                0.377123027
## Italy                                                -0.782635384
## Jamaica                                               0.421407379
## Japan                                                -0.072704909
## Jordan                                               -2.490151045
## Kazakhstan                                            1.027408228
## Kenya                                                 0.735505219
## Kiribati                                             -0.985310951
## Korea, Dem. People’s Rep.                             0.830878402
## Korea, Rep.                                           0.034976626
## Kosovo                                               -0.698268280
## Kuwait                                                0.046047582
## Kyrgyz Republic                                       0.300847727
## Lao PDR                                               1.999875482
## Late-demographic dividend                             0.388485135
## Latin America & Caribbean                             0.041142445
## Latin America & Caribbean (excluding high income)     0.075280389
## Latin America & the Caribbean (IDA & IBRD countries)  0.065569377
## Latvia                                                0.128623266
## Least developed countries: UN classification          0.216709160
## Lebanon                                              -1.946961775
## Lesotho                                              -0.137693307
## Liberia                                               0.765510910
## Libya                                                -0.941884570
## Liechtenstein                                         0.141807689
## Lithuania                                             0.134496532
## Low & middle income                                  -0.014293141
## Low income                                            0.508704767
## Lower middle income                                  -0.818704121
## Luxembourg                                           -0.227072385
## Macao SAR, China                                      0.539375369
## Madagascar                                            2.273801315
## Malawi                                                1.975846557
## Malaysia                                             -0.280719425
## Maldives                                             -0.319897128
## Mali                                                  0.730988288
## Malta                                                -1.298600132
## Mauritania                                           -0.703685818
## Mauritius                                            -0.575270084
## Mexico                                               -0.573230839
## Middle East & North Africa                           -1.975443501
## Middle East & North Africa (excluding high income)   -2.028850299
## Middle East & North Africa (IDA & IBRD countries)    -2.025291777
## Middle income                                        -0.060565269
## Moldova                                              -0.238247760
## Mongolia                                              0.432687495
## Montenegro                                           -0.414569055
## Morocco                                              -1.568033163
## Mozambique                                            2.542142687
## Myanmar                                               0.199796113
## Namibia                                              -0.249277877
## Nepal                                                 2.538850436
## Netherlands                                           0.521080833
## New Caledonia                                         0.334361949
## New Zealand                                           0.725181542
## Nicaragua                                            -0.361433382
## Niger                                                 0.251317114
## Nigeria                                              -0.091427247
## North America                                         0.648117672
## North Macedonia                                      -0.468344263
## Northern Mariana Islands                              1.125439692
## Norway                                                1.054652072
## OECD members                                          0.039050741
## Oman                                                 -1.671541746
## Other small states                                   -0.024994858
## Pacific island small states                          -0.169651496
## Pakistan                                             -2.086227681
## Palau                                                 0.321096783
## Panama                                               -0.182764593
## Papua New Guinea                                      0.305338522
## Paraguay                                              0.319355648
## Peru                                                  0.900286201
## Philippines                                          -0.147202953
## Poland                                               -0.151082728
## Portugal                                              0.382453534
## Post-demographic dividend                             0.202798162
## Pre-demographic dividend                              0.260775226
## Puerto Rico                                          -0.831745121
## Qatar                                                -0.272388758
## Romania                                              -0.120953027
## Russian Federation                                    0.597349047
## Rwanda                                                2.350623422
## Samoa                                                -1.374880549
## San Marino                                            0.172208561
## Sao Tome and Principe                                -1.019860577
## Saudi Arabia                                         -2.129877574
## Senegal                                              -1.054152738
## Serbia                                               -0.308830749
## Sierra Leone                                          1.023502680
## Singapore                                             0.186636237
## Slovak Republic                                       0.138050914
## Slovenia                                              0.203810232
## Small states                                         -0.010767330
## Solomon Islands                                       0.444523960
## Somalia                                              -1.074265326
## South Africa                                         -0.416041508
## South Asia                                           -1.199783982
## South Asia (IDA & IBRD)                              -1.199783982
## South Sudan                                           0.664178656
## Spain                                                -0.221935582
## Sri Lanka                                            -0.897814432
## St. Lucia                                             0.649728560
## St. Vincent and the Grenadines                        0.131420593
## Sub-Saharan Africa                                    0.379954847
## Sub-Saharan Africa (excluding high income)            0.379954847
## Sub-Saharan Africa (IDA & IBRD countries)             0.379954847
## Sudan                                                -0.843744066
## Suriname                                             -0.436831030
## Sweden                                                0.641036800
## Switzerland                                           0.680393591
## Syrian Arab Republic                                 -2.245588328
## Tajikistan                                           -0.674952343
## Tanzania                                              2.512556173
## Thailand                                              1.073992684
## Timor-Leste                                          -0.395653700
## Togo                                                  2.104439749
## Tonga                                                -0.658657852
## Trinidad and Tobago                                   0.152339251
## Tunisia                                              -1.785198120
## Turkey                                               -1.729348682
## Turkmenistan                                          0.063497873
## Uganda                                                0.677071249
## Ukraine                                               0.250958153
## United Arab Emirates                                 -0.805208024
## United Kingdom                                        0.368314436
## United States                                         0.628777497
## Upper middle income                                   0.246886943
## Uruguay                                               0.147303509
## Uzbekistan                                           -0.351101194
## Vanuatu                                               0.365019405
## Venezuela, RB                                        -0.001698803
## Vietnam                                               1.399045475
## Virgin Islands (U.S.)                                 0.282411076
## West Bank and Gaza                                   -2.388327075
## World                                                -0.003717115
## Yemen, Rep.                                          -2.505323817
## Zambia                                                0.760219351
## Zimbabwe                                              1.866854539

Ponemos el índice en una nueva data.frame.

pearson1=as.data.frame(empoderamiento1$scores)
names(pearson1) = c("Empoderamiento")
head(pearson1)
##             Empoderamiento
## Afghanistan    -0.21808191
## Albania        -0.74741919
## Algeria        -1.22463238
## Angola          1.29629214
## Arab World     -1.97999762
## Argentina       0.00458265
pearson1$Pais=row.names(pearson1)
row.names(pearson1) = NULL

El análisis factorial exploratorio sugiere que los componentes de Población Activa Mujeres y Participación en la fuerza laboral mujeres están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice.

SEGUNDA DATA: variables independientes del 2008 al 20012
  • Para crear esta variable independiente de la primera hipótesis usamos dos datas: Tasa de Población Activa y Fuerza Laboral.

Creamos una copia de la data y ponemos a los países como índice.

empoderamiento2_x=empoderamiento2
row.names(empoderamiento2) = empoderamiento2$Pais
empoderamiento2$Pais = NULL
head(empoderamiento2)
##             PoblacionActiva      FLM
## Afghanistan        43.15240 29.90230
## Albania            46.56340 47.99584
## Algeria            14.75860 14.63667
## Angola             75.30100 80.61500
## Arab World         20.13167 20.88708
## Argentina          48.21300 48.44430

Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.

empoderamiento2[is.na(empoderamiento2$PoblacionActiva), "PoblacionActiva"]=mean(empoderamiento2$PoblacionActiva, na.rm=T)
empoderamiento2[is.na(empoderamiento2$FLM), "FLM"]=mean(empoderamiento2$FLM, na.rm=T)

Estandarizamos:

empoderamiento2=as.data.frame(scale(empoderamiento2[,c(1,2)]))
head(empoderamiento2)
##             PoblacionActiva        FLM
## Afghanistan      -0.5011848 -1.4197678
## Albania          -0.2705588 -0.1427890
## Algeria          -2.4209582 -2.4971627
## Angola            1.6724597  2.1593574
## Arab World       -2.0576717 -2.0560302
## Argentina        -0.1590254 -0.1111382

Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.

library(psych)
pearson2 = cor(empoderamiento2) #sacar la correlación de los puntajes estandarizadas
pearson2
##                 PoblacionActiva      FLM
## PoblacionActiva        1.000000 0.864506
## FLM                    0.864506 1.000000
cor.plot(pearson2, 
         numbers=T, 
         upper=FALSE, 
         main = "Correlation", 
         show.legend = FALSE) #verlo en un gráfico

KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. El Overall MSA sale 0.5.

KMO(empoderamiento2) #Que tan buena idea es juntarlos en un indice. Ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = empoderamiento2)
## Overall MSA =  0.5
## MSA for each item = 
## PoblacionActiva             FLM 
##             0.5             0.5

Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial.

#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(empoderamiento2, n=nrow(empoderamiento2)) 
## R was not square, finding R from data
## $chisq
## [1] 333.6392
## 
## $p.value
## [1] 1.549413e-74
## 
## $df
## [1] 1

La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.

¿Cuántos índices debería crear? El R nos sugiere 1 índice.

fa.parallel(pearson2, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(empoderamiento2)) #cuantos indices deberia formar

## Parallel analysis suggests that the number of factors =  1  and the number of components =  NA
empoderamiento2 = fa(empoderamiento2, 
                     nfactors=1, 
                     rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
empoderamiento2$loadings
## 
## Loadings:
##                 MR1 
## PoblacionActiva 0.93
## FLM             0.93
## 
##                  MR1
## SS loadings    1.729
## Proportion Var 0.865

Ambas variables aportan de igual modo al índice. Se logró resumir el 86.5% de los componentes PoblacionActiva y FLM.

El MR1 está compuesto por ambas variables.

fa.diagram(empoderamiento2)

Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.

#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(empoderamiento2$communalities)
## PoblacionActiva             FLM 
##        0.864506        0.864506

Ambas variables aportan de igual modo al modelo.

Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial. En este caso, ninguna de las variables tiene menor relevancia.

# mientras mas grande peor (lo que mantiene)
sort(empoderamiento2$uniquenesses)
## PoblacionActiva             FLM 
##        0.135494        0.135494

La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores.

sort(empoderamiento2$complexity)
## PoblacionActiva             FLM 
##               1               1

Ninguna variable está cerca a otro factor.

empoderamiento2$scores
##                                                               MR1
## Afghanistan                                          -0.957936814
## Albania                                              -0.206127451
## Algeria                                              -2.452558785
## Angola                                                1.910842948
## Arab World                                           -2.051412705
## Argentina                                            -0.134724627
## Armenia                                              -0.003203348
## Aruba                                                 0.321716349
## Australia                                             0.583245223
## Austria                                               0.248409257
## Azerbaijan                                            0.724065533
## Bahamas, The                                          1.293475038
## Bahrain                                              -0.504468467
## Bangladesh                                           -1.208854798
## Barbados                                              0.853973567
## Belarus                                               0.410514455
## Belgium                                              -0.223791856
## Belize                                                0.176865679
## Benin                                                 1.388095882
## Bermuda                                               1.055179121
## Bhutan                                                0.972773007
## Bolivia                                               0.758604626
## Bosnia and Herzegovina                               -1.081725092
## Botswana                                              0.363650970
## Brazil                                                0.290391135
## Brunei Darussalam                                     0.439111288
## Bulgaria                                             -0.169381193
## Burkina Faso                                          0.308629824
## Burundi                                               1.713822749
## Cabo Verde                                            0.276720231
## Cambodia                                              1.913624610
## Cameroon                                              1.456609287
## Canada                                                0.811835599
## Caribbean small states                                0.322600325
## Cayman Islands                                        1.049759068
## Central African Republic                              0.505677673
## Central Europe and the Baltics                       -0.174184424
## Chad                                                  0.455223801
## Channel Islands                                      -0.027021182
## Chile                                                -0.249707952
## China                                                 0.935866021
## Colombia                                              0.344824362
## Comoros                                              -0.522685446
## Congo, Dem. Rep.                                      0.889777222
## Congo, Rep.                                           0.380742695
## Costa Rica                                           -0.264711634
## Cote d'Ivoire                                         0.359120294
## Croatia                                              -0.324163072
## Cuba                                                 -0.469537629
## Cyprus                                                0.445661568
## Czech Republic                                       -0.052299602
## Denmark                                               0.671106942
## Djibouti                                              0.026426746
## Dominican Republic                                   -0.545707012
## Early-demographic dividend                           -1.148137378
## East Asia & Pacific                                   0.702412513
## East Asia & Pacific (excluding high income)           0.799843359
## East Asia & Pacific (IDA & IBRD countries)            0.794178274
## Ecuador                                              -0.025008402
## Egypt, Arab Rep.                                     -1.923753954
## El Salvador                                          -0.246904148
## Equatorial Guinea                                     0.111581975
## Eritrea                                               0.774818825
## Estonia                                               0.333192186
## Eswatini                                             -0.438737337
## Ethiopia                                              0.784165191
## Euro area                                            -0.032651759
## Europe & Central Asia                                 0.024644777
## Europe & Central Asia (excluding high income)         0.003059226
## Europe & Central Asia (IDA & IBRD countries)         -0.019337885
## European Union                                        0.005345216
## Fiji                                                 -0.430651323
## Finland                                               0.424036791
## Fragile and conflict affected situations             -0.121270395
## France                                                0.057534593
## French Polynesia                                     -0.110637088
## Gabon                                                -0.717002018
## Gambia, The                                           0.004341844
## Georgia                                               0.371760800
## Germany                                               0.196612219
## Ghana                                                 1.229293064
## Greece                                               -0.438754594
## Greenland                                             0.749668323
## Guam                                                  0.334856760
## Guatemala                                            -0.558469088
## Guinea                                                0.427164715
## Guinea-Bissau                                         0.521484133
## Guyana                                               -0.445049081
## Haiti                                                 0.495107476
## Heavily indebted poor countries (HIPC)                0.444674059
## High income                                           0.137513064
## Honduras                                             -0.601406995
## Hong Kong SAR, China                                  0.164568363
## Hungary                                              -0.459137089
## IBRD only                                            -0.350545563
## Iceland                                               1.614808242
## IDA & IBRD total                                     -0.222378554
## IDA blend                                            -0.659863816
## IDA only                                              0.137474868
## IDA total                                            -0.008244770
## India                                                -1.727627330
## Indonesia                                             0.038596582
## Iran, Islamic Rep.                                   -2.399518052
## Iraq                                                 -2.639221453
## Ireland                                               0.368276158
## Isle of Man                                           0.262940846
## Israel                                                0.467166412
## Italy                                                -0.816413641
## Jamaica                                               0.533835201
## Japan                                                -0.125779127
## Jordan                                               -2.444445892
## Kazakhstan                                            1.085802316
## Kenya                                                 1.132218882
## Kiribati                                              0.079575052
## Korea, Dem. People’s Rep.                             0.820720957
## Korea, Rep.                                          -0.041486864
## Kosovo                                               -0.927406405
## Kuwait                                                0.342453034
## Kyrgyz Republic                                       0.147533753
## Lao PDR                                               1.826360223
## Late-demographic dividend                             0.725821087
## Latin America & Caribbean                             0.051031735
## Latin America & Caribbean (excluding high income)     0.082640191
## Latin America & the Caribbean (IDA & IBRD countries)  0.067917711
## Latvia                                                0.263889255
## Least developed countries: UN classification          0.198790933
## Lebanon                                              -1.935468052
## Lesotho                                              -0.008994052
## Liberia                                               0.385196962
## Libya                                                -1.499071019
## Liechtenstein                                         0.117515231
## Lithuania                                             0.137755199
## Low & middle income                                  -0.221585361
## Low income                                            0.461308488
## Lower middle income                                  -1.062838706
## Luxembourg                                           -0.054823107
## Macao SAR, China                                      1.063540554
## Madagascar                                            2.162356901
## Malawi                                                1.392729132
## Malaysia                                             -0.305094473
## Maldives                                             -0.218579937
## Mali                                                  0.345872300
## Malta                                                -1.055523687
## Marshall Islands                                     -0.738355520
## Mauritania                                           -1.528646123
## Mauritius                                            -0.546916305
## Mexico                                               -0.492061217
## Middle East & North Africa                           -2.099511388
## Middle East & North Africa (excluding high income)   -2.212285671
## Middle East & North Africa (IDA & IBRD countries)    -2.210458196
## Middle income                                        -0.268700119
## Moldova                                              -0.754335065
## Mongolia                                              0.264793622
## Montenegro                                           -0.515949470
## Morocco                                              -1.749565070
## Mozambique                                            1.087663848
## Myanmar                                               0.104144013
## Namibia                                               0.134322117
## Nauru                                                -0.025657774
## Nepal                                                 2.004082360
## Netherlands                                           0.609649229
## New Caledonia                                         0.657928604
## New Zealand                                           0.782031149
## Nicaragua                                             0.064029970
## Niger                                                 1.221846237
## Nigeria                                               0.196544383
## North America                                         0.566246572
## North Macedonia                                      -0.508392052
## Northern Mariana Islands                              0.582158901
## Norway                                                1.066801298
## OECD members                                          0.043796360
## Oman                                                 -1.680785687
## Other small states                                    0.005153535
## Pacific island small states                          -0.071744448
## Pakistan                                             -1.994420826
## Panama                                               -0.226029029
## Papua New Guinea                                     -0.146946725
## Paraguay                                              0.504846850
## Peru                                                  1.142832351
## Philippines                                          -0.142069509
## Poland                                               -0.178585272
## Portugal                                              0.347406419
## Post-demographic dividend                             0.198455654
## Pre-demographic dividend                              0.236305410
## Puerto Rico                                          -1.056886094
## Qatar                                                 0.067587282
## Romania                                              -0.276402251
## Russian Federation                                    0.631587290
## Rwanda                                                1.903235199
## Samoa                                                -1.808000681
## Sao Tome and Principe                                -0.303977896
## Saudi Arabia                                         -2.178148313
## Senegal                                              -0.747793201
## Serbia                                               -0.586548626
## Seychelles                                            0.418502462
## Sierra Leone                                          0.334665957
## Singapore                                             0.441575795
## Slovak Republic                                       0.018743478
## Slovenia                                              0.186890300
## Small states                                          0.018817799
## Solomon Islands                                       0.852451946
## Somalia                                              -1.113485168
## South Africa                                         -0.304471943
## South Asia                                           -1.673057853
## South Asia (IDA & IBRD)                              -1.673057853
## South Sudan                                           1.441090425
## Spain                                                 0.097710499
## Sri Lanka                                            -1.079302538
## St. Lucia                                             0.586376124
## St. Vincent and the Grenadines                        0.199225502
## Sub-Saharan Africa                                    0.360199399
## Sub-Saharan Africa (excluding high income)            0.360199399
## Sub-Saharan Africa (IDA & IBRD countries)             0.360199399
## Sudan                                                -1.714188636
## Suriname                                             -0.408659681
## Sweden                                                0.808392777
## Switzerland                                           0.729499639
## Syrian Arab Republic                                 -2.526839852
## Tajikistan                                           -1.449616001
## Tanzania                                              2.207699847
## Thailand                                              1.016285752
## Timor-Leste                                          -1.619543488
## Togo                                                  1.826017425
## Tonga                                                -0.174323234
## Trinidad and Tobago                                   0.046667065
## Tunisia                                              -1.756480858
## Turkey                                               -1.619744506
## Turkmenistan                                          0.063090399
## Uganda                                                1.396774817
## Ukraine                                               0.207602776
## United Arab Emirates                                 -0.512920396
## United Kingdom                                        0.382580295
## United States                                         0.538173274
## Upper middle income                                   0.436073738
## Uruguay                                               0.371744132
## Uzbekistan                                            0.073360587
## Vanuatu                                               0.716404137
## Venezuela, RB                                        -0.007453655
## Vietnam                                               1.465705136
## Virgin Islands (U.S.)                                 0.240124002
## West Bank and Gaza                                   -2.362713114
## World                                                -0.140505894
## Yemen, Rep.                                          -2.781120503
## Zambia                                                1.011156411
## Zimbabwe                                              1.530300799

Ponemos el índice en una nueva data.frame.

pearson2=as.data.frame(empoderamiento2$scores)
names(pearson2) = c("Empoderamiento")
head(pearson2)
##             Empoderamiento
## Afghanistan     -0.9579368
## Albania         -0.2061275
## Algeria         -2.4525588
## Angola           1.9108429
## Arab World      -2.0514127
## Argentina       -0.1347246
pearson2$Pais=row.names(pearson2)
row.names(pearson2) = NULL

El análisis factorial exploratorio sugiere que los componentes de Población Activa Mujeres y Participación en la fuerza laboral mujeres están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice.

Análisis factorial calidad de vida
PRIMERA DATA: Variables independientes 2003-2007

Para este análisis factorial usamos la data Calidad1 compuesta por las datas est1, GAST1, ban1, DataTugurios1, DataGini1.

Dentro de la hipótesis de calidad de vida lo que queremos ver es que tanto porcentaje de personas no vive en barrios de tugurios y que tanta no desigualdad hay. Por ello, como las variables BarriosTugurios y Gini están midiendo lo contrario, las invertimos para que calcen con la hipótesis.

#Ponemos las variables en forma intuitiva restando con el mayor valor
Calidad1$BarriosTugurios= 100 - Calidad1$BarriosTugurios 
Calidad1$Gini= 65 - Calidad1$Gini

Creamos una copia de la data y ponemos a los países como índice.

Calidad1_X=Calidad1
row.names(Calidad1) = Calidad1$Pais
Calidad1$Pais = NULL
head(Calidad1)
##                BarriosTugurios Gini      EDU      ENER      GAST
## Afghanistan                 NA   NA       NA  22.79312        NA
## Albania                     NA 34.4       NA 100.00000 0.0873700
## Algeria                     NA   NA 72.64868  98.80855 0.1419467
## American Samoa              NA   NA       NA        NA 0.3170075
## Andorra                     NA   NA       NA 100.00000        NA
## Angola                   18.65   NA       NA  29.52772        NA
##                        ban
## Afghanistan     0.00137906
## Albania         0.16976576
## Algeria         0.38217637
## American Samoa          NA
## Andorra        13.34488004
## Angola          0.04626376

Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.

Calidad1[is.na(Calidad1$BarriosTugurios), "BarriosTugurios"]=mean(Calidad1$BarriosTugurios, na.rm=T)
Calidad1[is.na(Calidad1$Gini), "Gini"]=mean(Calidad1$Gini, na.rm=T)
Calidad1[is.na(Calidad1$EDU), "EDU"]=mean(Calidad1$EDU, na.rm=T)
Calidad1[is.na(Calidad1$ENER), "ENER"]=mean(Calidad1$ENER, na.rm=T)
Calidad1[is.na(Calidad1$GAST), "GAST"]=mean(Calidad1$GAST, na.rm=T)
Calidad1[is.na(Calidad1$ban), "ban"]=mean(Calidad1$ban, na.rm=T)

Estandarizamos:

Calidad1=as.data.frame(scale(Calidad1[,c(1:6)]))
head(Calidad1)
##                BarriosTugurios     Gini        EDU       ENER       GAST
## Afghanistan           0.000000 0.000000  0.0000000 -1.7233986  0.0000000
## Albania               0.000000 1.394347  0.0000000  0.7551778 -1.1905817
## Algeria               0.000000 0.000000 -0.2212941  0.7169287 -1.1038070
## American Samoa        0.000000 0.000000  0.0000000  0.0000000 -0.8254673
## Andorra               0.000000 0.000000  0.0000000  0.7551778  0.0000000
## Angola               -2.469433 0.000000  0.0000000 -1.5071972  0.0000000
##                       ban
## Afghanistan    -0.6777603
## Albania        -0.6512634
## Algeria        -0.6178389
## American Samoa  0.0000000
## Andorra         1.4219446
## Angola         -0.6706974

Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.

library(psych)
promedio1 = cor(Calidad1) #sacar la correlación de los puntajes estandarizadas
promedio1
##                 BarriosTugurios        Gini         EDU      ENER
## BarriosTugurios     1.000000000 -0.13270600  0.49417768 0.5779805
## Gini               -0.132706004  1.00000000 -0.09252552 0.2145609
## EDU                 0.494177679 -0.09252552  1.00000000 0.5721154
## ENER                0.577980511  0.21456087  0.57211541 1.0000000
## GAST               -0.007642321  0.27747953  0.04709207 0.1967345
## ban                 0.011836126  0.31819474  0.10412853 0.3545951
##                         GAST        ban
## BarriosTugurios -0.007642321 0.01183613
## Gini             0.277479531 0.31819474
## EDU              0.047092075 0.10412853
## ENER             0.196734526 0.35459509
## GAST             1.000000000 0.62000846
## ban              0.620008458 1.00000000
cor.plot(promedio1, 
         numbers=T, 
         upper=FALSE, 
         main = "Correlation", 
         show.legend = FALSE) #verlo en un gráfico

KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor.

KMO(Calidad1) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = Calidad1)
## Overall MSA =  0.6
## MSA for each item = 
## BarriosTugurios            Gini             EDU            ENER 
##            0.62            0.54            0.70            0.58 
##            GAST             ban 
##            0.59            0.58

Nos fijamos en el Overall MSA: sale 0.6.

Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial.

#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(Calidad1,n=nrow(Calidad1)) 
## R was not square, finding R from data
## $chisq
## [1] 466.7162
## 
## $p.value
## [1] 6.110613e-90
## 
## $df
## [1] 15

La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.

¿Cuántos índices debería crear? El R nos sugiere 3 índices.

fa.parallel(promedio1, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(Calidad1)) #cuantos indices deberia formar
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs
## = np.obs, : The estimated weights for the factor scores are probably
## incorrect. Try a different factor extraction method.

## Parallel analysis suggests that the number of factors =  3  and the number of components =  NA
Calidad1 = fa(Calidad1, 
                     nfactors=3, 
                     rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
## Warning in fac(r = r, nfactors = nfactors, n.obs = n.obs, rotate =
## rotate, : An ultra-Heywood case was detected. Examine the results carefully
Calidad1$loadings
## 
## Loadings:
##                 MR1    MR2    MR3   
## BarriosTugurios  0.717        -0.143
## Gini                    0.241  0.551
## EDU              0.677              
## ENER             0.888  0.157  0.432
## GAST                    0.863  0.118
## ban              0.121  0.673  0.313
## 
##                  MR1   MR2   MR3
## SS loadings    1.782 1.285 0.632
## Proportion Var 0.297 0.214 0.105
## Cumulative Var 0.297 0.511 0.616

Se logró resumir el 61.6% de los componentes BarriosTugurios, Gini, EDU, ENER, GAST y ban.

fa.diagram(Calidad1)

MR1 está compuesto por ENER, BarriosTugurios y EDU (dichos componentes son los que hacen referencia al rol del Estado). MR2 está compuesto por GAST y ban, que tienen en común lo tecnológico. Finalmente, MR3 está compuesto por Gini, el índice de desigualdad en el mundo (como lo invertimos, sería no desigualdad).

Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.

#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(Calidad1$communalities)
##            Gini             EDU BarriosTugurios             ban 
##       0.3668824       0.4712142       0.5351012       0.5657713 
##            GAST            ENER 
##       0.7585527       0.9950000

La variable que más aporta es ENER y la que menos aporta es Gini (por ello forma un índice distinto).

Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.

# mientras mas grande peor (lo que mantiene)
sort(Calidad1$uniquenesses)
##            ENER            GAST             ban BarriosTugurios 
##   -0.0006972736    0.2413269718    0.4340153963    0.4648857180 
##             EDU            Gini 
##    0.5288417029    0.6330720986

Nuevamente, Gini es la que menos relevancia tiene para el modelo y ENER la que mayor relevancia tiene.

La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. En este caso, casi todas tienden a estar cerca de otro factor, por esta razón el R sugirió formar 3 índices y no 1.

sort(Calidad1$complexity)
##            GAST             EDU BarriosTugurios            Gini 
##        1.038257        1.055293        1.080547        1.408544 
##             ban            ENER 
##        1.487721        1.520918
Calidad1$scores
##                                                              MR1
## Afghanistan                                          -1.28872296
## Albania                                               0.47328987
## Algeria                                               0.63538286
## American Samoa                                        0.02928735
## Andorra                                               0.45131879
## Angola                                               -1.54618516
## Antigua and Barbuda                                   0.87478567
## Arab World                                            0.37962060
## Argentina                                             1.26624404
## Armenia                                               0.52788649
## Aruba                                                 0.31144886
## Australia                                             0.29572552
## Austria                                               0.10617704
## Azerbaijan                                            0.58259044
## Bahamas, The                                          0.52927301
## Bahrain                                               0.61196199
## Bangladesh                                           -1.47593965
## Barbados                                              0.70408381
## Belarus                                               0.36794990
## Belgium                                               0.03415665
## Belize                                                0.69510370
## Benin                                                -1.98448749
## Bermuda                                               0.12295387
## Bhutan                                               -0.70295308
## Bolivia                                               0.58528978
## Bosnia and Herzegovina                                0.53055154
## Botswana                                             -0.84727758
## Brazil                                                1.35087042
## Brunei Darussalam                                     0.67504403
## Bulgaria                                              0.53877126
## Burkina Faso                                         -2.10020389
## Burundi                                              -2.17378997
## Cabo Verde                                            0.10482152
## Cambodia                                             -1.66772678
## Cameroon                                             -0.64171528
## Canada                                                0.12337850
## Caribbean small states                                0.55891719
## Cayman Islands                                        0.83042617
## Central African Republic                             -2.18979013
## Central Europe and the Baltics                        0.58641461
## Chad                                                 -2.81787378
## Channel Islands                                       0.59464125
## Chile                                                 1.29221255
## China                                                 0.73851168
## Colombia                                              1.47579858
## Comoros                                              -0.38736668
## Congo, Dem. Rep.                                     -2.03120474
## Congo, Rep.                                          -0.99528190
## Costa Rica                                            1.30392674
## Cote d'Ivoire                                        -0.63845748
## Croatia                                               0.60387032
## Cuba                                                  0.64590704
## Curacao                                               0.59464125
## Cyprus                                                0.39557968
## Czech Republic                                        0.19795345
## Denmark                                              -0.18758402
## Djibouti                                             -0.47181901
## Dominica                                              0.26900652
## Dominican Republic                                    1.21052802
## Early-demographic dividend                            0.07268648
## East Asia & Pacific                                   0.66249277
## East Asia & Pacific (excluding high income)           0.73458314
## East Asia & Pacific (IDA & IBRD countries)            0.75694924
## Ecuador                                               1.41726441
## Egypt, Arab Rep.                                      0.73174179
## El Salvador                                           0.88835512
## Equatorial Guinea                                    -0.50421759
## Eritrea                                              -1.06508883
## Estonia                                               0.30025367
## Eswatini                                             -1.05000765
## Ethiopia                                             -2.49421098
## Euro area                                             0.63086605
## Europe & Central Asia                                 0.70916626
## Europe & Central Asia (excluding high income)         0.84447754
## Europe & Central Asia (IDA & IBRD countries)          0.84506294
## European Union                                        0.65020917
## Faroe Islands                                         0.41899491
## Fiji                                                  0.22077322
## Finland                                              -0.11250373
## Fragile and conflict affected situations             -1.23880669
## France                                                0.12113052
## French Polynesia                                      0.59118472
## Gabon                                                 0.34357663
## Gambia, The                                          -0.73692487
## Georgia                                               0.61040154
## Germany                                               0.13578600
## Ghana                                                -0.35724373
## Gibraltar                                             0.59464125
## Greece                                                0.67609049
## Greenland                                             0.50864662
## Grenada                                               0.96658799
## Guam                                                  0.66853342
## Guatemala                                             0.64850773
## Guinea                                               -1.87316603
## Guinea-Bissau                                        -2.14797483
## Guyana                                                0.19093545
## Haiti                                                -1.60348315
## Heavily indebted poor countries (HIPC)               -1.74380376
## High income                                           0.34907271
## Honduras                                              0.57011946
## Hong Kong SAR, China                                  0.29062705
## Hungary                                               0.29210942
## IBRD only                                             0.57996366
## Iceland                                              -0.11265529
## IDA & IBRD total                                      0.21730463
## IDA blend                                            -0.44649028
## IDA only                                             -1.48465665
## IDA total                                            -1.13635754
## India                                                -0.30704108
## Indonesia                                             0.62143023
## Iran, Islamic Rep.                                    1.01081734
## Iraq                                                  0.26255170
## Ireland                                               0.34338351
## Isle of Man                                           0.59464125
## Israel                                                0.27011902
## Italy                                                 0.33678435
## Jamaica                                               0.33957689
## Japan                                                 0.25298583
## Jordan                                                0.96984775
## Kazakhstan                                            0.51310632
## Kenya                                                -1.25419578
## Kiribati                                             -0.31494032
## Korea, Dem. People’s Rep.                            -1.42845827
## Korea, Rep.                                          -0.05648612
## Kosovo                                                0.25791023
## Kuwait                                                0.86760922
## Kyrgyz Republic                                       0.53437903
## Lao PDR                                              -0.98977441
## Late-demographic dividend                             0.86466749
## Latin America & Caribbean                             0.86535543
## Latin America & Caribbean (excluding high income)     0.84915828
## Latin America & the Caribbean (IDA & IBRD countries)  0.85893282
## Latvia                                                0.54913602
## Least developed countries: UN classification         -1.69519780
## Lebanon                                               0.69299911
## Lesotho                                              -1.52439532
## Liberia                                              -2.31629524
## Libya                                                 0.67416460
## Liechtenstein                                         0.30930217
## Lithuania                                             0.43919362
## Low & middle income                                   0.19720627
## Low income                                           -1.75727091
## Lower middle income                                  -0.11636657
## Luxembourg                                            0.15262039
## Macao SAR, China                                      0.66434442
## Madagascar                                           -1.79495531
## Malawi                                               -1.94670000
## Malaysia                                              0.79011432
## Maldives                                              0.65082253
## Mali                                                 -2.15849881
## Malta                                                 0.37533013
## Marshall Islands                                     -0.05030317
## Mauritania                                           -1.50561264
## Mauritius                                             0.55225015
## Mexico                                                1.38852627
## Micronesia, Fed. Sts.                                -0.37486694
## Middle East & North Africa                            0.69788251
## Middle East & North Africa (excluding high income)    0.65634623
## Middle East & North Africa (IDA & IBRD countries)     0.65288652
## Middle income                                         0.39082017
## Moldova                                               0.55469328
## Monaco                                                0.27095935
## Mongolia                                             -0.09745198
## Montenegro                                            0.60195399
## Morocco                                               0.41115604
## Mozambique                                           -2.24022606
## Myanmar                                              -0.66759847
## Namibia                                              -0.03481467
## Nauru                                                 0.58503834
## Nepal                                                -0.75003491
## Netherlands                                          -0.03316193
## New Caledonia                                         0.59263892
## New Zealand                                           0.50010167
## Nicaragua                                             0.31084864
## Niger                                                -2.48974118
## Nigeria                                              -1.01291027
## North America                                         0.29694702
## North Macedonia                                       0.62233366
## Northern Mariana Islands                              0.59464125
## Norway                                                0.01619126
## OECD members                                          0.36242030
## Oman                                                  0.71428723
## Other small states                                   -0.37371102
## Pacific island small states                          -0.32538152
## Pakistan                                             -0.19247573
## Palau                                                 0.61747321
## Panama                                                0.97063199
## Papua New Guinea                                     -1.56504359
## Paraguay                                              1.45990858
## Peru                                                  0.67546043
## Philippines                                           0.43908948
## Poland                                                0.47860696
## Portugal                                              0.47708332
## Post-demographic dividend                             0.33697908
## Pre-demographic dividend                             -1.54547211
## Puerto Rico                                           0.61309036
## Qatar                                                 0.76566564
## Romania                                               0.61917325
## Russian Federation                                    0.67829303
## Rwanda                                               -1.58772460
## Samoa                                                 0.47755835
## San Marino                                            0.59846417
## Sao Tome and Principe                                -0.45879920
## Saudi Arabia                                          1.07603800
## Senegal                                              -1.02471482
## Serbia                                                0.46794911
## Seychelles                                            0.56230626
## Sierra Leone                                         -2.58758124
## Singapore                                             0.35540711
## Sint Maarten (Dutch part)                             0.59464125
## Slovak Republic                                       0.28001107
## Slovenia                                              0.32304036
## Small states                                         -0.18116503
## Solomon Islands                                      -1.28031868
## Somalia                                              -1.94086688
## South Africa                                          1.22630549
## South Asia                                           -0.29271171
## South Asia (IDA & IBRD)                              -0.29271171
## South Sudan                                          -1.92960790
## Spain                                                 0.52657555
## Sri Lanka                                             0.31471714
## St. Kitts and Nevis                                   0.34076772
## St. Lucia                                             0.77375456
## St. Martin (French part)                             -0.43812641
## St. Vincent and the Grenadines                        0.26280349
## Sub-Saharan Africa                                   -1.44087447
## Sub-Saharan Africa (excluding high income)           -1.44110644
## Sub-Saharan Africa (IDA & IBRD countries)            -1.44087447
## Sudan                                                -0.99364835
## Suriname                                              1.10695892
## Sweden                                               -0.18950717
## Switzerland                                           0.08076505
## Syrian Arab Republic                                  0.78990348
## Tajikistan                                            0.51670612
## Tanzania                                             -1.72998746
## Thailand                                              0.97906030
## Timor-Leste                                          -1.59996695
## Togo                                                 -1.50179459
## Tonga                                                 0.62244336
## Trinidad and Tobago                                   0.80215679
## Tunisia                                               0.60999492
## Turkey                                                1.08646735
## Turkmenistan                                          0.58593378
## Turks and Caicos Islands                              0.42401618
## Tuvalu                                                0.52636842
## Uganda                                               -1.74553044
## Ukraine                                               0.34677614
## United Arab Emirates                                  0.75863772
## United Kingdom                                        0.26678538
## United States                                         0.35139421
## Upper middle income                                   0.90063013
## Uruguay                                               1.02914988
## Uzbekistan                                            0.58813642
## Vanuatu                                              -1.10820402
## Venezuela, RB                                         1.27890147
## Vietnam                                               0.46795125
## Virgin Islands (U.S.)                                 0.65726233
## West Bank and Gaza                                    0.72894882
## World                                                 0.23193789
## Yemen, Rep.                                          -1.13072094
## Zambia                                               -1.17865742
## Zimbabwe                                             -0.68533868
##                                                               MR2
## Afghanistan                                           0.038673556
## Albania                                              -1.141039814
## Algeria                                              -1.066187218
## American Samoa                                       -0.596071750
## Andorra                                               0.283324544
## Angola                                               -0.057611355
## Antigua and Barbuda                                  -0.036392766
## Arab World                                           -0.183969970
## Argentina                                            -0.457542618
## Armenia                                              -0.943961150
## Aruba                                                 0.177247485
## Australia                                             1.460774186
## Austria                                               1.968257989
## Azerbaijan                                           -0.872896588
## Bahamas, The                                         -0.078658359
## Bahrain                                              -0.142086253
## Bangladesh                                           -0.225756689
## Barbados                                              0.360420947
## Belarus                                              -0.422674500
## Belgium                                               1.633200756
## Belize                                               -0.119811492
## Benin                                                -0.230122721
## Bermuda                                               0.501509377
## Bhutan                                               -0.018350604
## Bolivia                                              -0.088063431
## Bosnia and Herzegovina                               -1.184580709
## Botswana                                             -0.340734870
## Brazil                                                0.130761512
## Brunei Darussalam                                    -1.116576217
## Bulgaria                                             -0.555813083
## Burkina Faso                                         -0.892291173
## Burundi                                              -0.479159014
## Cabo Verde                                           -0.093544371
## Cambodia                                             -0.041797330
## Cameroon                                             -0.082428270
## Canada                                                1.891593845
## Caribbean small states                               -0.073788621
## Cayman Islands                                        0.003016415
## Central African Republic                              0.191304163
## Central Europe and the Baltics                       -0.168878154
## Chad                                                  0.005344313
## Channel Islands                                      -0.096217949
## Chile                                                -0.593597253
## China                                                 0.385816828
## Colombia                                             -0.846490324
## Comoros                                              -0.101454119
## Congo, Dem. Rep.                                     -0.648856511
## Congo, Rep.                                           0.179012241
## Costa Rica                                           -0.665401900
## Cote d'Ivoire                                        -0.110569877
## Croatia                                              -0.083026606
## Cuba                                                 -0.631253489
## Curacao                                              -0.096217949
## Cyprus                                               -0.661495798
## Czech Republic                                        0.415452766
## Denmark                                               2.594244773
## Djibouti                                             -0.091467854
## Dominica                                             -0.005702867
## Dominican Republic                                   -0.083529206
## Early-demographic dividend                           -0.371289965
## East Asia & Pacific                                   1.799223841
## East Asia & Pacific (excluding high income)           0.309168324
## East Asia & Pacific (IDA & IBRD countries)            0.305156655
## Ecuador                                              -0.952885612
## Egypt, Arab Rep.                                     -0.910446395
## El Salvador                                          -0.962811287
## Equatorial Guinea                                    -0.169953945
## Eritrea                                               0.172340320
## Estonia                                               0.412675050
## Eswatini                                              0.169900059
## Ethiopia                                             -0.949868930
## Euro area                                             1.479329669
## Europe & Central Asia                                 1.126543872
## Europe & Central Asia (excluding high income)        -0.143604277
## Europe & Central Asia (IDA & IBRD countries)         -0.173638980
## European Union                                        1.402028670
## Faroe Islands                                         0.393879398
## Fiji                                                 -0.162821343
## Finland                                               3.445077161
## Fragile and conflict affected situations              0.083130493
## France                                                1.783262297
## French Polynesia                                     -0.087064473
## Gabon                                                -0.659268842
## Gambia, The                                           0.014934555
## Georgia                                              -0.975507084
## Germany                                               2.141283612
## Ghana                                                -0.775304309
## Gibraltar                                            -0.096217949
## Greece                                               -0.399083943
## Greenland                                            -0.127756291
## Grenada                                               0.118049191
## Guam                                                 -0.867542228
## Guatemala                                            -1.057025754
## Guinea                                                0.029361244
## Guinea-Bissau                                         0.201196511
## Guyana                                               -0.147604999
## Haiti                                                 0.032591706
## Heavily indebted poor countries (HIPC)               -0.090908368
## High income                                           1.940143363
## Honduras                                             -0.804265058
## Hong Kong SAR, China                                  0.617148333
## Hungary                                               0.148211597
## IBRD only                                            -0.103249413
## Iceland                                               2.912597749
## IDA & IBRD total                                     -0.113469380
## IDA blend                                            -0.717257212
## IDA only                                             -0.111048709
## IDA total                                            -0.126674662
## India                                                -0.223974750
## Indonesia                                            -0.130333434
## Iran, Islamic Rep.                                   -0.505986899
## Iraq                                                 -1.204075513
## Ireland                                               0.474287072
## Isle of Man                                          -0.096217949
## Israel                                                4.178094497
## Italy                                                 0.453768093
## Jamaica                                              -0.178293277
## Japan                                                 3.143684121
## Jordan                                               -0.135870655
## Kazakhstan                                           -0.942233950
## Kenya                                                -0.529287367
## Kiribati                                             -0.113211581
## Korea, Dem. People’s Rep.                             0.231136548
## Korea, Rep.                                           2.920839185
## Kosovo                                               -0.092597574
## Kuwait                                               -0.991964148
## Kyrgyz Republic                                      -0.991741225
## Lao PDR                                              -0.179464201
## Late-demographic dividend                             0.136836954
## Latin America & Caribbean                            -0.358214098
## Latin America & Caribbean (excluding high income)    -0.337341831
## Latin America & the Caribbean (IDA & IBRD countries) -0.356369239
## Latvia                                               -0.448307153
## Least developed countries: UN classification         -0.112001232
## Lebanon                                              -0.222165075
## Lesotho                                              -0.801214149
## Liberia                                               0.166900102
## Libya                                                -0.047277648
## Liechtenstein                                         0.659408947
## Lithuania                                            -0.035043486
## Low & middle income                                  -0.089096894
## Low income                                           -0.091611216
## Lower middle income                                  -0.407146159
## Luxembourg                                            1.233445607
## Macao SAR, China                                     -0.490710996
## Madagascar                                           -0.720709798
## Malawi                                                0.065261626
## Malaysia                                             -0.439603013
## Maldives                                             -0.089877854
## Mali                                                 -0.903897635
## Malta                                                -0.118937774
## Marshall Islands                                      0.008139475
## Mauritania                                           -0.095554341
## Mauritius                                            -0.770523574
## Mexico                                               -0.557484070
## Micronesia, Fed. Sts.                                -0.087187079
## Middle East & North Africa                           -0.189530020
## Middle East & North Africa (excluding high income)   -0.219404712
## Middle East & North Africa (IDA & IBRD countries)    -0.220215144
## Middle income                                        -0.093949608
## Moldova                                              -0.756074758
## Monaco                                               -0.036862855
## Mongolia                                             -0.900740075
## Montenegro                                            0.109209165
## Morocco                                              -0.461744104
## Mozambique                                           -0.537220431
## Myanmar                                              -0.065475439
## Namibia                                               0.022964864
## Nauru                                                -0.094664119
## Nepal                                                -0.078425541
## Netherlands                                           1.806020389
## New Caledonia                                        -0.090915436
## New Zealand                                           0.459543824
## Nicaragua                                            -0.143254254
## Niger                                                -0.176345947
## Nigeria                                              -0.902908831
## North America                                         2.350717020
## North Macedonia                                      -0.891880407
## Northern Mariana Islands                             -0.096217949
## Norway                                                1.382424532
## OECD members                                          1.878486670
## Oman                                                 -0.235193576
## Other small states                                    0.032677782
## Pacific island small states                          -0.095241171
## Pakistan                                             -0.670270791
## Palau                                                -0.251454186
## Panama                                               -0.763408637
## Papua New Guinea                                      0.253237200
## Paraguay                                             -0.976977489
## Peru                                                 -0.856131578
## Philippines                                          -0.925876097
## Poland                                               -0.408627324
## Portugal                                              0.173693825
## Post-demographic dividend                             2.031560590
## Pre-demographic dividend                             -0.104061880
## Puerto Rico                                          -0.145074361
## Qatar                                                -0.070090611
## Romania                                              -0.600563764
## Russian Federation                                    0.134042632
## Rwanda                                                0.066749205
## Samoa                                                -0.245410754
## San Marino                                           -0.106341704
## Sao Tome and Principe                                -0.090399048
## Saudi Arabia                                         -1.064260348
## Senegal                                              -0.187050785
## Serbia                                               -0.618589436
## Seychelles                                           -0.730837807
## Sierra Leone                                         -0.015009675
## Singapore                                             1.851834413
## Sint Maarten (Dutch part)                            -0.096217949
## Slovak Republic                                      -0.507357440
## Slovenia                                              0.866347934
## Small states                                          0.015180312
## Solomon Islands                                       0.083274903
## Somalia                                               0.203971234
## South Africa                                         -0.046605946
## South Asia                                           -0.254725198
## South Asia (IDA & IBRD)                              -0.254725198
## South Sudan                                           0.312226770
## Spain                                                 0.605472539
## Sri Lanka                                            -0.867624443
## St. Kitts and Nevis                                   0.279233760
## St. Lucia                                            -0.025436339
## St. Martin (French part)                              0.070892534
## St. Vincent and the Grenadines                       -0.069702830
## Sub-Saharan Africa                                   -0.476288869
## Sub-Saharan Africa (excluding high income)           -0.476296136
## Sub-Saharan Africa (IDA & IBRD countries)            -0.476288869
## Sudan                                                -0.605447725
## Suriname                                             -0.098510133
## Sweden                                                3.637355430
## Switzerland                                           2.739352668
## Syrian Arab Republic                                 -0.177805992
## Tajikistan                                           -1.147706733
## Tanzania                                             -0.527397330
## Thailand                                             -0.797765656
## Timor-Leste                                          -0.123815067
## Togo                                                 -0.085046474
## Tonga                                                -0.113593468
## Trinidad and Tobago                                  -1.024744966
## Tunisia                                              -0.432702257
## Turkey                                               -0.351652098
## Turkmenistan                                         -0.094809008
## Turks and Caicos Islands                             -0.068609380
## Tuvalu                                               -0.185046003
## Uganda                                               -0.596488142
## Ukraine                                              -0.051874817
## United Arab Emirates                                 -0.082306122
## United Kingdom                                        1.236198046
## United States                                         2.390895483
## Upper middle income                                  -0.017229040
## Uruguay                                              -0.563391821
## Uzbekistan                                           -0.960016648
## Vanuatu                                               0.026823609
## Venezuela, RB                                        -0.773894179
## Vietnam                                              -0.223627404
## Virgin Islands (U.S.)                                -1.065345509
## West Bank and Gaza                                   -0.900469413
## World                                                 1.321749952
## Yemen, Rep.                                          -0.242455987
## Zambia                                               -0.952795992
## Zimbabwe                                              0.039555393
##                                                               MR3
## Afghanistan                                          -1.383960928
## Albania                                               1.178861819
## Algeria                                               0.754605654
## American Samoa                                        0.128088771
## Andorra                                               0.683137249
## Angola                                               -0.236433583
## Antigua and Barbuda                                  -0.683118279
## Arab World                                           -0.179963663
## Argentina                                            -0.942786035
## Armenia                                               0.963556281
## Aruba                                                 0.459208943
## Australia                                             0.651910080
## Austria                                               0.831483487
## Azerbaijan                                            0.786529608
## Bahamas, The                                          0.526419633
## Bahrain                                               0.574474833
## Bangladesh                                            0.764994519
## Barbados                                              0.128232469
## Belarus                                               1.160071049
## Belgium                                               1.038849324
## Belize                                               -0.370858809
## Benin                                                 0.522825990
## Bermuda                                               1.091048380
## Bhutan                                                0.015232477
## Bolivia                                              -1.234556271
## Bosnia and Herzegovina                                1.024539946
## Botswana                                             -1.069705024
## Brazil                                               -1.221833260
## Brunei Darussalam                                     0.762116022
## Bulgaria                                              0.841523706
## Burkina Faso                                         -0.149873263
## Burundi                                              -0.819435531
## Cabo Verde                                           -0.845431725
## Cambodia                                             -0.382786898
## Cameroon                                             -0.801709174
## Canada                                                0.769278501
## Caribbean small states                               -0.105548614
## Cayman Islands                                        0.054513173
## Central African Republic                             -0.632472148
## Central Europe and the Baltics                        0.618695037
## Chad                                                  0.470415508
## Channel Islands                                       0.586190945
## Chile                                                -0.852608812
## China                                                -0.040508722
## Colombia                                             -1.328451123
## Comoros                                              -0.943916083
## Congo, Dem. Rep.                                     -0.581961726
## Congo, Rep.                                          -1.354452257
## Costa Rica                                           -0.786354981
## Cote d'Ivoire                                        -0.292241319
## Croatia                                               0.569214302
## Cuba                                                  0.583579714
## Curacao                                               0.586190945
## Cyprus                                                1.152618643
## Czech Republic                                        1.184434735
## Denmark                                               1.132539236
## Djibouti                                             -0.577301661
## Dominica                                              0.290470676
## Dominican Republic                                   -1.345349390
## Early-demographic dividend                           -0.316100657
## East Asia & Pacific                                  -0.716923160
## East Asia & Pacific (excluding high income)          -0.437616863
## East Asia & Pacific (IDA & IBRD countries)           -0.412530805
## Ecuador                                              -1.143672951
## Egypt, Arab Rep.                                      0.431403759
## El Salvador                                          -0.603729738
## Equatorial Guinea                                     0.217032222
## Eritrea                                              -1.049953113
## Estonia                                               0.936862620
## Eswatini                                             -1.035086251
## Ethiopia                                              1.004805727
## Euro area                                            -0.078829412
## Europe & Central Asia                                -0.105810970
## Europe & Central Asia (excluding high income)         0.046998852
## Europe & Central Asia (IDA & IBRD countries)          0.057283047
## European Union                                       -0.086086701
## Faroe Islands                                         0.697883506
## Fiji                                                  0.132666700
## Finland                                               0.748508138
## Fragile and conflict affected situations             -0.355859383
## France                                                0.846353003
## French Polynesia                                      0.588529012
## Gabon                                                -0.179273317
## Gambia, The                                          -1.687206678
## Georgia                                               0.770867295
## Germany                                               0.718331186
## Ghana                                                -0.679193777
## Gibraltar                                             0.586190945
## Greece                                                0.500045908
## Greenland                                             0.718312028
## Grenada                                              -1.276780628
## Guam                                                  0.700404055
## Guatemala                                            -0.689192163
## Guinea                                               -0.326705660
## Guinea-Bissau                                        -0.650666462
## Guyana                                               -0.335769989
## Haiti                                                 0.113529884
## Heavily indebted poor countries (HIPC)               -0.362488848
## High income                                           0.345650041
## Honduras                                             -1.444686610
## Hong Kong SAR, China                                  0.817993167
## Hungary                                               1.076314940
## IBRD only                                            -0.349395494
## Iceland                                               0.889037429
## IDA & IBRD total                                     -0.364471552
## IDA blend                                             0.138062611
## IDA only                                             -0.237938503
## IDA total                                            -0.185638204
## India                                                -0.033948424
## Indonesia                                            -0.323572689
## Iran, Islamic Rep.                                   -0.252916997
## Iraq                                                  1.449952559
## Ireland                                               0.869974599
## Isle of Man                                           0.586190945
## Israel                                               -0.202936334
## Italy                                                 0.871391219
## Jamaica                                               0.342901540
## Japan                                                 0.151225406
## Jordan                                               -0.298676127
## Kazakhstan                                            0.988832083
## Kenya                                                -1.364526917
## Kiribati                                             -0.253662086
## Korea, Dem. People’s Rep.                            -1.408158796
## Korea, Rep.                                           0.762875295
## Kosovo                                                0.967715353
## Kuwait                                                0.324087068
## Kyrgyz Republic                                       0.977190058
## Lao PDR                                               0.619132617
## Late-demographic dividend                            -0.345568118
## Latin America & Caribbean                            -0.392300789
## Latin America & Caribbean (excluding high income)    -0.396025578
## Latin America & the Caribbean (IDA & IBRD countries) -0.391042338
## Latvia                                                0.778301578
## Least developed countries: UN classification         -0.151443646
## Lebanon                                               0.441057518
## Lesotho                                              -1.649729968
## Liberia                                              -1.006682271
## Libya                                                 0.320822834
## Liechtenstein                                         0.779200255
## Lithuania                                             0.843147136
## Low & middle income                                  -0.375756194
## Low income                                           -0.356444171
## Lower middle income                                  -0.198881175
## Luxembourg                                            0.960119455
## Macao SAR, China                                      0.471478055
## Madagascar                                           -0.517044049
## Malawi                                               -1.253257793
## Malaysia                                              0.183166587
## Maldives                                             -0.186738700
## Mali                                                  0.358788767
## Malta                                                 0.937184926
## Marshall Islands                                     -0.049588321
## Mauritania                                           -0.704343048
## Mauritius                                             0.816614067
## Mexico                                               -1.045446428
## Micronesia, Fed. Sts.                                -0.760889089
## Middle East & North Africa                           -0.033870126
## Middle East & North Africa (excluding high income)    0.020981082
## Middle East & North Africa (IDA & IBRD countries)     0.023876188
## Middle income                                        -0.326434824
## Moldova                                               0.831938072
## Monaco                                                1.032701150
## Mongolia                                              0.671252783
## Montenegro                                            0.454084268
## Morocco                                              -0.217708272
## Mozambique                                           -0.004036439
## Myanmar                                              -0.732649978
## Namibia                                              -2.562420851
## Nauru                                                 0.576724508
## Nepal                                                -0.656085832
## Netherlands                                           1.077840606
## New Caledonia                                         0.587545363
## New Zealand                                           0.563026743
## Nicaragua                                            -0.641379681
## Niger                                                 0.250479955
## Nigeria                                               0.378940499
## North America                                         0.314466352
## North Macedonia                                       0.683715113
## Northern Mariana Islands                              0.586190945
## Norway                                                1.141598448
## OECD members                                          0.336713186
## Oman                                                  0.413776918
## Other small states                                   -0.560287944
## Pacific island small states                          -0.419627022
## Pakistan                                              1.178012067
## Palau                                                 0.507388095
## Panama                                               -1.064040118
## Papua New Guinea                                     -1.542803135
## Paraguay                                             -1.308855259
## Peru                                                 -0.980928543
## Philippines                                          -0.417693447
## Poland                                                0.907377573
## Portugal                                              0.688788610
## Post-demographic dividend                             0.346218254
## Pre-demographic dividend                             -0.260756521
## Puerto Rico                                           0.573711582
## Qatar                                                 0.224126264
## Romania                                               0.700843001
## Russian Federation                                    0.371514089
## Rwanda                                               -1.770416315
## Samoa                                                 0.358366615
## San Marino                                            0.583605041
## Sao Tome and Principe                                -0.562343942
## Saudi Arabia                                         -0.129714659
## Senegal                                              -0.117831889
## Serbia                                                0.988274980
## Seychelles                                            0.586335510
## Sierra Leone                                          0.688862756
## Singapore                                             0.373064303
## Sint Maarten (Dutch part)                             0.586190945
## Slovak Republic                                       1.330889297
## Slovenia                                              0.737181709
## Small states                                         -0.444235755
## Solomon Islands                                      -1.952007208
## Somalia                                              -0.810146772
## South Africa                                         -2.135850646
## South Asia                                           -0.129643613
## South Asia (IDA & IBRD)                              -0.129643613
## South Sudan                                          -1.902186720
## Spain                                                 0.412542452
## Sri Lanka                                            -0.281662162
## St. Kitts and Nevis                                   0.559463640
## St. Lucia                                            -0.497928704
## St. Martin (French part)                             -0.431900302
## St. Vincent and the Grenadines                        0.240898853
## Sub-Saharan Africa                                   -0.326364007
## Sub-Saharan Africa (excluding high income)           -0.326425128
## Sub-Saharan Africa (IDA & IBRD countries)            -0.326364007
## Sudan                                                -0.991866448
## Suriname                                             -1.021303372
## Sweden                                                0.826477655
## Switzerland                                           0.583417148
## Syrian Arab Republic                                 -0.317970857
## Tajikistan                                            1.037788850
## Tanzania                                             -1.028535221
## Thailand                                             -0.489601496
## Timor-Leste                                           0.039750570
## Togo                                                 -0.571379380
## Tonga                                                -0.256525312
## Trinidad and Tobago                                   0.090949028
## Tunisia                                               0.623837993
## Turkey                                               -0.607938503
## Turkmenistan                                          0.577607216
## Turks and Caicos Islands                              0.417990591
## Tuvalu                                                0.452118712
## Uganda                                               -1.127900527
## Ukraine                                               1.057440069
## United Arab Emirates                                  0.244735236
## United Kingdom                                        0.730646427
## United States                                         0.198425817
## Upper middle income                                  -0.324783747
## Uruguay                                              -0.259468252
## Uzbekistan                                            0.877257285
## Vanuatu                                              -1.295507926
## Venezuela, RB                                        -0.704418912
## Vietnam                                               0.394349770
## Virgin Islands (U.S.)                                 0.772962562
## West Bank and Gaza                                    0.519147512
## World                                                -0.611312688
## Yemen, Rep.                                           0.871877662
## Zambia                                               -1.424985708
## Zimbabwe                                             -1.744006562

Ponemos los indices en una nueva data.frame.

promedio1=as.data.frame(Calidad1$scores)
names(promedio1) = c("Densidad","DesarrolloTec", "NoDesigualdad")
head(promedio1)
##                   Densidad DesarrolloTec NoDesigualdad
## Afghanistan    -1.28872296    0.03867356    -1.3839609
## Albania         0.47328987   -1.14103981     1.1788618
## Algeria         0.63538286   -1.06618722     0.7546057
## American Samoa  0.02928735   -0.59607175     0.1280888
## Andorra         0.45131879    0.28332454     0.6831372
## Angola         -1.54618516   -0.05761135    -0.2364336
promedio1$Pais=row.names(promedio1)
row.names(promedio1) = NULL

El análisis factorial exploratorio sugiere, por un lado, que los componentes ENER, EDU y Barrios Tugurios están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice. Por otro lado, los componentes ban y GAST también se encuentran correlacionados entre ellos, pues el análisis factorial sugiere que deben formar una sola dimensión. Y esto tiene sentido al ser dos variables que se relacionan con el aspecto de desarrollo tecnológico. Finalmente, la variable Gini debe ir en un solo índice como sugiere el análisis factorial. Por ello, se conservará como tal.

SEGUNDA DATA: variables independientes 2008-2012

Para este análisis factorial usamos la data Calidad1 compuesta de las datas est1, GAST1, ban1 y DataTugurios1. Para este análisis no introducimos a la variable Gini porque en un análisis anterior (donde entraron todas las variables independientes al modelo) el índice de Gini altera el modelo y la forma como se juntan el resto de variables. Por ello optamos por añadirlo junto a los scores ya formados.

Dentro de la hipótesis de calidad de vida lo que queremos ver es que tanto porcentaje de personas no vive en barrios de tugurios. Por ello, como la variable BarriosTugurios está midiendo lo contrario, la invertimos para que calce con la hipótesis.

#Ponemos las variables en forma intuitiva restando con el mayor valor
Calidad2$BarriosTugurios= 100 - Calidad2$BarriosTugurios 

Creamos una copia de la data y ponemos a los países como índice.

Calidad2_X=Calidad2
row.names(Calidad2) = Calidad2$Pais
Calidad2$Pais = NULL
head(Calidad2)
##                          ENER BarriosTugurios      EDU    GAST
## Afghanistan          48.45538              NA 31.74112      NA
## Albania             100.00000              NA 96.67697 0.15412
## Algeria              98.94692              NA 75.13605      NA
## Andorra             100.00000              NA       NA      NA
## Angola               33.51748            34.2       NA      NA
## Antigua and Barbuda  94.22346              NA       NA      NA
##                              ban
## Afghanistan          0.003874254
## Albania              3.739381479
## Algeria              2.385431981
## Andorra             28.845289134
## Angola               0.070203059
## Antigua and Barbuda  9.959628841

Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.

Calidad2[is.na(Calidad2$BarriosTugurios), "BarriosTugurios"]=mean(Calidad2$BarriosTugurios, na.rm=T)
Calidad2[is.na(Calidad2$EDU), "EDU"]=mean(Calidad2$EDU, na.rm=T)
Calidad2[is.na(Calidad2$ENER), "ENER"]=mean(Calidad2$ENER, na.rm=T)
Calidad2[is.na(Calidad2$GAST), "GAST"]=mean(Calidad2$GAST, na.rm=T)
Calidad2[is.na(Calidad2$ban), "ban"]=mean(Calidad2$ban, na.rm=T)

Estandarizamos:

Calidad2=as.data.frame(scale(Calidad2[,c(1:5)]))
head(Calidad2)
##                           ENER BarriosTugurios        EDU      GAST
## Afghanistan         -1.0591265        0.000000 -3.3708303  0.000000
## Albania              0.7089823        0.000000  1.0350593 -1.122095
## Algeria              0.6728591        0.000000 -0.4264896  0.000000
## Andorra              0.7089823        0.000000  0.0000000  0.000000
## Angola              -1.5715337       -1.762928  0.0000000  0.000000
## Antigua and Barbuda  0.5108327        0.000000  0.0000000  0.000000
##                             ban
## Afghanistan         -0.83285151
## Albania             -0.49709541
## Algeria             -0.61879155
## Andorra              1.75948211
## Angola              -0.82688972
## Antigua and Barbuda  0.06199493

Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.

library(psych)
promedio2 = cor(Calidad2) #sacar la correlación de los puntajes estandarizadas
promedio2
##                      ENER BarriosTugurios         EDU        GAST
## ENER            1.0000000      0.50865945  0.61842801  0.19623497
## BarriosTugurios 0.5086595      1.00000000  0.38641647  0.03744230
## EDU             0.6184280      0.38641647  1.00000000 -0.01961126
## GAST            0.1962350      0.03744230 -0.01961126  1.00000000
## ban             0.5218063      0.09207125  0.28765543  0.56726309
##                        ban
## ENER            0.52180626
## BarriosTugurios 0.09207125
## EDU             0.28765543
## GAST            0.56726309
## ban             1.00000000
cor.plot(promedio2, 
         numbers=T, 
         upper=FALSE, 
         main = "Correlation", 
         show.legend = FALSE) #verlo en un gráfico

KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.6.

KMO(Calidad2) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = Calidad2)
## Overall MSA =  0.6
## MSA for each item = 
##            ENER BarriosTugurios             EDU            GAST 
##            0.62            0.61            0.70            0.50 
##             ban 
##            0.54

Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial. La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.

#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(Calidad2,n=nrow(Calidad2)) 
## R was not square, finding R from data
## $chisq
## [1] 418.9267
## 
## $p.value
## [1] 8.785799e-84
## 
## $df
## [1] 10

¿Cuántos índices debería crear? El R nos sugiere 2 índices.

fa.parallel(promedio2, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(Calidad2)) #cuantos indices deberia formar
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs
## = np.obs, : The estimated weights for the factor scores are probably
## incorrect. Try a different factor extraction method.

## Parallel analysis suggests that the number of factors =  2  and the number of components =  NA
Calidad2 = fa(Calidad2, 
                     nfactors=2, 
                     rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
Calidad2$loadings
## 
## Loadings:
##                 MR1    MR2   
## ENER             0.878  0.314
## BarriosTugurios  0.570       
## EDU              0.688       
## GAST                    0.588
## ban              0.257  0.965
## 
##                  MR1   MR2
## SS loadings    1.636 1.381
## Proportion Var 0.327 0.276
## Cumulative Var 0.327 0.603

Se logró resumir el 60.3% de los componentes ENER, BarriosTugurios, EDU, GAST y ban.

fa.diagram(Calidad2)

MR1 junta a ENER, EDU y BarriosTugurios (justo los que explican sobre ek rol del Estado)

Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.

#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(Calidad2$communalities)
## BarriosTugurios            GAST             EDU            ENER 
##       0.3257767       0.3453905       0.4789444       0.8697739 
##             ban 
##       0.9950000

ENER y ban son las que más aportan al modelo.

Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.

# mientras mas grande peor (lo que mantiene)
sort(Calidad2$uniquenesses)
##             ban            ENER             EDU            GAST 
##     0.003056918     0.130226072     0.521055347     0.654609544 
## BarriosTugurios 
##     0.674223671

EDU, GAST y BarriosTugurios son las menos relevantes para el modelo, por ello son agrupadas en un índice diferente.

La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. Casi todas las variables están cerca a otro factor, de ahí que el R nos sugiriera más de 1 índice.

sort(Calidad2$complexity)
##            GAST BarriosTugurios             EDU             ban 
##        1.000052        1.002502        1.022702        1.141761 
##            ENER 
##        1.252351
Calidad2$scores
##                                                               MR1
## Afghanistan                                          -1.377330863
## Albania                                               0.950491375
## Algeria                                               0.604573720
## Andorra                                               0.204009577
## Angola                                               -1.284084321
## Antigua and Barbuda                                   0.408988703
## Arab World                                            0.202621757
## Argentina                                             1.031217695
## Armenia                                               0.979954340
## Aruba                                                 0.435479338
## Australia                                             0.197932999
## Austria                                               0.201088263
## Azerbaijan                                            0.932718798
## Bahamas, The                                          0.563522400
## Bahrain                                               0.642411553
## Bangladesh                                           -0.926983955
## Barbados                                              0.359192301
## Belarus                                               0.707920541
## Belgium                                               0.099303659
## Belize                                                0.453707459
## Benin                                                -1.963586052
## Bermuda                                              -0.346170551
## Bhutan                                               -0.199912893
## Bolivia                                               0.567757965
## Bosnia and Herzegovina                                0.853480296
## Botswana                                             -0.670481864
## Brazil                                                0.884082164
## British Virgin Islands                               -0.339406508
## Brunei Darussalam                                     0.866823099
## Bulgaria                                              0.730388247
## Burkina Faso                                         -1.610298156
## Burundi                                              -2.321758289
## Cabo Verde                                            0.218652861
## Cambodia                                             -1.177003247
## Cameroon                                             -0.703531977
## Canada                                                0.095611835
## Caribbean small states                                0.557833094
## Cayman Islands                                        0.112545782
## Central African Republic                             -2.816112862
## Central Europe and the Baltics                        0.433185610
## Chad                                                 -2.261142307
## Channel Islands                                       0.586329725
## Chile                                                 0.805812490
## China                                                 0.862702484
## Colombia                                              1.047609264
## Comoros                                              -0.714718742
## Congo, Dem. Rep.                                     -1.863548199
## Congo, Rep.                                          -0.967331388
## Costa Rica                                            0.860192467
## Cote d'Ivoire                                        -1.094544731
## Croatia                                               0.666265218
## Cuba                                                  1.042226104
## Curacao                                               0.334040430
## Cyprus                                                0.586479054
## Czech Republic                                        0.319342870
## Denmark                                              -0.090713262
## Djibouti                                             -0.565529713
## Dominica                                              0.400504649
## Dominican Republic                                    1.030369071
## Early-demographic dividend                            0.186699461
## East Asia & Pacific                                   0.703838558
## East Asia & Pacific (excluding high income)           0.775468852
## East Asia & Pacific (IDA & IBRD countries)            0.798429752
## Ecuador                                               0.809731376
## Egypt, Arab Rep.                                      0.931450237
## El Salvador                                           0.577140972
## Equatorial Guinea                                    -0.212350998
## Eritrea                                              -1.171906082
## Estonia                                               0.486346426
## Eswatini                                             -0.679298673
## Ethiopia                                             -1.594889032
## Euro area                                             0.402174844
## Europe & Central Asia                                 0.582367994
## Europe & Central Asia (excluding high income)         0.827158700
## Europe & Central Asia (IDA & IBRD countries)          0.816946189
## European Union                                        0.436313333
## Faroe Islands                                         0.129421088
## Fiji                                                  0.429812042
## Finland                                               0.021471456
## Fragile and conflict affected situations             -1.150910645
## France                                                0.036055209
## French Polynesia                                      0.525202090
## Gabon                                                 0.383110633
## Gambia, The                                          -0.876619917
## Georgia                                               0.646707377
## Germany                                               0.034425268
## Ghana                                                -0.291092528
## Gibraltar                                             0.137258357
## Greece                                                0.608568801
## Greenland                                             0.352176247
## Grenada                                               0.224584586
## Guam                                                  0.731809297
## Guatemala                                             0.366503263
## Guinea                                               -2.116866037
## Guinea-Bissau                                        -1.822072232
## Guyana                                                0.326336778
## Haiti                                                -1.244912366
## Heavily indebted poor countries (HIPC)               -1.767177585
## High income                                           0.176690871
## Honduras                                              0.249249163
## Hong Kong SAR, China                                  0.183118098
## Hungary                                               0.336185769
## IBRD only                                             0.625999012
## Iceland                                              -0.001109328
## IDA & IBRD total                                      0.240211912
## IDA blend                                            -0.401454380
## IDA only                                             -1.463007982
## IDA total                                            -1.094957138
## India                                                 0.006042714
## Indonesia                                             0.998484290
## Iran, Islamic Rep.                                    0.762619197
## Iraq                                                  0.724188741
## Ireland                                               0.299916357
## Isle of Man                                           0.586329725
## Israel                                                0.099739121
## Italy                                                 0.571505241
## Jamaica                                               0.466003657
## Japan                                                 0.113520296
## Jordan                                                1.144735440
## Kazakhstan                                            0.948131340
## Kenya                                                -1.411079091
## Kiribati                                             -0.118545894
## Korea, Dem. People’s Rep.                            -1.190214037
## Korea, Rep.                                          -0.061883004
## Kosovo                                               -0.007270755
## Kuwait                                                0.969430973
## Kyrgyz Republic                                       1.031886519
## Lao PDR                                              -0.402676447
## Late-demographic dividend                             0.872365406
## Latin America & Caribbean                             0.673874041
## Latin America & Caribbean (excluding high income)     0.667169244
## Latin America & the Caribbean (IDA & IBRD countries)  0.666469625
## Latvia                                                0.628090372
## Least developed countries: UN classification         -1.636435408
## Lebanon                                               0.768319904
## Lesotho                                              -1.614869097
## Liberia                                              -2.133409124
## Libya                                                 0.706442539
## Liechtenstein                                        -0.044058331
## Lithuania                                             0.598994628
## Low & middle income                                   0.223286461
## Low income                                           -1.791311259
## Lower middle income                                   0.024980366
## Luxembourg                                            0.111993246
## Macao SAR, China                                      0.534542432
## Madagascar                                           -1.992600857
## Malawi                                               -2.315971021
## Malaysia                                              0.761305215
## Maldives                                              0.617984904
## Mali                                                 -2.183982785
## Malta                                                 0.383582798
## Marshall Islands                                      0.376550565
## Mauritania                                           -1.144651991
## Mauritius                                             0.752944649
## Mexico                                                0.756750157
## Micronesia, Fed. Sts.                                -0.264435017
## Middle East & North Africa                            0.533146026
## Middle East & North Africa (excluding high income)    0.538272408
## Middle East & North Africa (IDA & IBRD countries)     0.534144610
## Middle income                                         0.437402474
## Moldova                                               0.907991474
## Monaco                                                0.003233212
## Mongolia                                              0.335830420
## Montenegro                                            0.832683446
## Morocco                                               0.512991177
## Mozambique                                           -2.262550446
## Myanmar                                              -0.617424342
## Namibia                                              -0.532763168
## Nauru                                                 0.558455342
## Nepal                                                -0.497487108
## Netherlands                                          -0.020284823
## New Caledonia                                         0.476823871
## New Zealand                                           0.259010941
## Nicaragua                                             0.172244424
## Niger                                                -2.700544803
## Nigeria                                              -1.150985722
## North America                                         0.118450557
## North Macedonia                                       0.557243888
## Northern Mariana Islands                              0.586329725
## Norway                                                0.036377181
## OECD members                                          0.197394953
## Oman                                                  0.846569563
## Other small states                                   -0.327899607
## Pacific island small states                          -0.150826870
## Pakistan                                              0.162301595
## Palau                                                 0.684912280
## Panama                                                0.513688145
## Papua New Guinea                                     -1.811642255
## Paraguay                                              0.888507517
## Peru                                                  0.581482192
## Philippines                                           0.582268253
## Poland                                                0.713895967
## Portugal                                              0.534092705
## Post-demographic dividend                             0.155170493
## Pre-demographic dividend                             -1.604953272
## Puerto Rico                                           0.668475868
## Qatar                                                 0.807323285
## Romania                                               0.740125801
## Russian Federation                                    0.799297674
## Rwanda                                               -2.109260450
## Samoa                                                 0.915524539
## San Marino                                            0.357579554
## Sao Tome and Principe                                -0.431159873
## Saudi Arabia                                          0.667211497
## Senegal                                              -0.854951055
## Serbia                                                0.781839628
## Seychelles                                            0.718378044
## Sierra Leone                                         -1.870931154
## Singapore                                             0.393804833
## Sint Maarten (Dutch part)                             0.586329725
## Slovak Republic                                       0.479245013
## Slovenia                                              0.247051739
## Small states                                         -0.139300241
## Solomon Islands                                      -1.214688694
## Somalia                                              -1.729333218
## South Africa                                          0.649135712
## South Asia                                           -0.099795697
## South Asia (IDA & IBRD)                              -0.099795697
## South Sudan                                          -2.737857651
## Spain                                                 0.529035318
## Sri Lanka                                             0.512746416
## St. Kitts and Nevis                                   0.216054689
## St. Lucia                                             0.376345892
## St. Martin (French part)                             -0.415175900
## St. Vincent and the Grenadines                        0.360231636
## Sub-Saharan Africa                                   -1.509636418
## Sub-Saharan Africa (excluding high income)           -1.509869506
## Sub-Saharan Africa (IDA & IBRD countries)            -1.509636418
## Sudan                                                -1.481419341
## Suriname                                              0.618456102
## Sweden                                               -0.001361372
## Switzerland                                          -0.078168490
## Syrian Arab Republic                                  0.624526171
## Tajikistan                                            0.795584416
## Tanzania                                             -1.917651602
## Thailand                                              1.046195553
## Timor-Leste                                          -1.113921209
## Togo                                                 -1.350157109
## Tonga                                                 0.763436426
## Trinidad and Tobago                                   0.813399705
## Tunisia                                               0.656312179
## Turkey                                                1.032862777
## Turkmenistan                                          0.763126469
## Turks and Caicos Islands                              0.412159281
## Tuvalu                                                0.628698018
## Uganda                                               -1.894678543
## Ukraine                                               0.912624168
## United Arab Emirates                                  0.608907194
## United Kingdom                                        0.126554451
## United States                                         0.121178194
## Upper middle income                                   0.892369454
## Uruguay                                               0.773677139
## Uzbekistan                                            0.801762657
## Vanuatu                                              -1.037167058
## Venezuela, RB                                         0.857118087
## Vietnam                                               0.934133282
## Virgin Islands (U.S.)                                 0.611327090
## West Bank and Gaza                                    0.899095741
## World                                                 0.232848878
## Yemen, Rep.                                          -0.285153467
## Zambia                                               -1.435602486
## Zimbabwe                                             -0.777274576
##                                                               MR2
## Afghanistan                                          -0.253587060
## Albania                                              -0.820002466
## Algeria                                              -0.751228096
## Andorra                                               1.806943944
## Angola                                               -0.664141776
## Antigua and Barbuda                                  -0.028293050
## Arab World                                           -0.639164795
## Argentina                                            -0.161874162
## Armenia                                              -0.860115543
## Aruba                                                 0.681295264
## Australia                                             1.389119396
## Austria                                               1.261886593
## Azerbaijan                                           -0.575084494
## Bahamas, The                                         -0.093261077
## Bahrain                                               0.374214018
## Bangladesh                                           -0.566797736
## Barbados                                              1.019041419
## Belarus                                               0.424637148
## Belgium                                               1.973482533
## Belize                                               -0.717151979
## Benin                                                -0.205510883
## Bermuda                                               4.816667570
## Bhutan                                               -0.567428387
## Bolivia                                              -0.972043784
## Bosnia and Herzegovina                               -0.253947759
## Botswana                                             -0.643128629
## Brazil                                               -0.351452232
## British Virgin Islands                                1.723253964
## Brunei Darussalam                                    -0.672866814
## Bulgaria                                              0.280510399
## Burkina Faso                                         -0.486283280
## Burundi                                              -0.122622652
## Cabo Verde                                           -0.650912099
## Cambodia                                             -0.555437632
## Cameroon                                             -0.647050952
## Canada                                                2.068517657
## Caribbean small states                               -0.422042407
## Cayman Islands                                        2.271329106
## Central African Republic                             -0.179778403
## Central Europe and the Baltics                        0.649666705
## Chad                                                 -0.548577040
## Channel Islands                                      -0.134193587
## Chile                                                -0.146265062
## China                                                -0.198180716
## Colombia                                             -0.459092671
## Comoros                                              -0.508327606
## Congo, Dem. Rep.                                     -0.461974040
## Congo, Rep.                                          -0.655361163
## Costa Rica                                           -0.520295296
## Cote d'Ivoire                                        -0.412443017
## Croatia                                               0.568896607
## Cuba                                                 -1.217949644
## Curacao                                               1.146743926
## Cyprus                                                1.060695525
## Czech Republic                                        1.057007458
## Denmark                                               2.667963096
## Djibouti                                             -0.656066416
## Dominica                                              0.074289966
## Dominican Republic                                   -0.665387643
## Early-demographic dividend                           -0.635542009
## East Asia & Pacific                                  -0.166139392
## East Asia & Pacific (excluding high income)          -0.375688498
## East Asia & Pacific (IDA & IBRD countries)           -0.380523776
## Ecuador                                              -0.851417036
## Egypt, Arab Rep.                                     -0.707018688
## El Salvador                                          -0.736489107
## Equatorial Guinea                                    -0.820793567
## Eritrea                                              -0.505232434
## Estonia                                               1.232062717
## Eswatini                                             -0.705689475
## Ethiopia                                             -0.633779529
## Euro area                                             1.503087101
## Europe & Central Asia                                 0.640136175
## Europe & Central Asia (excluding high income)        -0.353494744
## Europe & Central Asia (IDA & IBRD countries)         -0.285838170
## European Union                                        1.366163591
## Faroe Islands                                         2.185648845
## Fiji                                                 -0.787089319
## Finland                                               1.883247250
## Fragile and conflict affected situations             -0.473760866
## France                                                2.264221947
## French Polynesia                                      0.176167106
## Gabon                                                -0.940735143
## Gambia, The                                          -0.657038821
## Georgia                                              -0.502659828
## Germany                                               2.093858828
## Ghana                                                -0.688652391
## Gibraltar                                             2.145857019
## Greece                                                0.696281563
## Greenland                                             1.054663727
## Grenada                                               0.271559890
## Guam                                                 -0.872830716
## Guatemala                                            -0.758893240
## Guinea                                               -0.044220219
## Guinea-Bissau                                        -0.454848978
## Guyana                                               -0.725507169
## Haiti                                                -0.699553556
## Heavily indebted poor countries (HIPC)               -0.372884948
## High income                                           1.473228219
## Honduras                                             -0.912766320
## Hong Kong SAR, China                                  1.970658173
## Hungary                                               1.066466290
## IBRD only                                            -0.458960704
## Iceland                                               2.334822620
## IDA & IBRD total                                     -0.468406108
## IDA blend                                            -0.717046278
## IDA only                                             -0.463925811
## IDA total                                            -0.547426428
## India                                                -0.641442921
## Indonesia                                            -0.963440904
## Iran, Islamic Rep.                                   -0.862011541
## Iraq                                                 -1.051810959
## Ireland                                               1.123969837
## Isle of Man                                          -0.134193587
## Israel                                                1.326989623
## Italy                                                 0.899680576
## Jamaica                                              -0.602977186
## Japan                                                 1.537109574
## Jordan                                               -0.759663178
## Kazakhstan                                           -0.666378976
## Kenya                                                -0.581696018
## Kiribati                                             -0.777869435
## Korea, Dem. People’s Rep.                             0.157014115
## Korea, Rep.                                           2.333497814
## Kosovo                                                0.001664061
## Kuwait                                               -1.022585272
## Kyrgyz Republic                                      -1.155932089
## Lao PDR                                              -0.633710495
## Late-demographic dividend                            -0.249342498
## Latin America & Caribbean                            -0.447997594
## Latin America & Caribbean (excluding high income)    -0.492271420
## Latin America & the Caribbean (IDA & IBRD countries) -0.438275878
## Latvia                                                0.870219018
## Least developed countries: UN classification         -0.425293973
## Lebanon                                              -0.484953836
## Lesotho                                              -0.482055956
## Liberia                                              -0.487427717
## Libya                                                -0.941193669
## Liechtenstein                                         3.066448387
## Lithuania                                             0.937712872
## Low & middle income                                  -0.481625102
## Low income                                           -0.384392512
## Lower middle income                                  -0.674282548
## Luxembourg                                            2.088958393
## Macao SAR, China                                      1.259039423
## Madagascar                                           -0.452244532
## Malawi                                               -0.323209455
## Malaysia                                             -0.429980774
## Maldives                                             -0.594353196
## Mali                                                 -0.148985808
## Malta                                                 1.704249038
## Marshall Islands                                     -0.190806557
## Mauritania                                           -0.599407030
## Mauritius                                            -0.365596292
## Mexico                                               -0.273592591
## Micronesia, Fed. Sts.                                -0.726059864
## Middle East & North Africa                           -0.699270330
## Middle East & North Africa (excluding high income)   -0.771020651
## Middle East & North Africa (IDA & IBRD countries)    -0.769403555
## Middle income                                        -0.497000850
## Moldova                                              -0.560670546
## Monaco                                                2.826337084
## Mongolia                                             -0.801579322
## Montenegro                                           -0.202399262
## Morocco                                              -0.553176858
## Mozambique                                           -0.302058421
## Myanmar                                              -0.732784209
## Namibia                                              -0.676231395
## Nauru                                                -0.108268118
## Nepal                                                -0.636416037
## Netherlands                                           2.674905142
## New Caledonia                                         0.421795746
## New Zealand                                           1.426431617
## Nicaragua                                            -0.774455194
## Niger                                                -0.102880992
## Nigeria                                              -0.494484040
## North America                                         1.690402297
## North Macedonia                                       0.166907865
## Northern Mariana Islands                             -0.134193587
## Norway                                                2.433102142
## OECD members                                          1.364208136
## Oman                                                 -0.895756547
## Other small states                                   -0.292832845
## Pacific island small states                          -0.736063195
## Pakistan                                             -0.697068821
## Palau                                                -0.859265268
## Panama                                               -0.401489164
## Papua New Guinea                                     -0.332056025
## Paraguay                                             -1.008282911
## Peru                                                 -0.740392505
## Philippines                                          -0.884998051
## Poland                                                0.326942844
## Portugal                                              0.743421173
## Post-demographic dividend                             1.569307286
## Pre-demographic dividend                             -0.415939432
## Puerto Rico                                           0.233564644
## Qatar                                                -0.335584516
## Romania                                               0.259363853
## Russian Federation                                   -0.167085188
## Rwanda                                               -0.385803854
## Samoa                                                -1.175614995
## San Marino                                            1.027229749
## Sao Tome and Principe                                -0.738262493
## Saudi Arabia                                         -0.429779229
## Senegal                                              -0.391058998
## Serbia                                               -0.126954247
## Seychelles                                           -0.402048045
## Sierra Leone                                          0.428200978
## Singapore                                             1.332486331
## Sint Maarten (Dutch part)                            -0.134193587
## Slovak Republic                                       0.509518156
## Slovenia                                              1.216552499
## Small states                                         -0.346266477
## Solomon Islands                                      -0.561910335
## Somalia                                              -0.575123936
## South Africa                                         -0.852635006
## South Asia                                           -0.627574402
## South Asia (IDA & IBRD)                              -0.627574402
## South Sudan                                           0.087935795
## Spain                                                 1.014615036
## Sri Lanka                                            -0.923862389
## St. Kitts and Nevis                                   1.438850236
## St. Lucia                                             0.139200305
## St. Martin (French part)                              0.095021522
## St. Vincent and the Grenadines                        0.083622377
## Sub-Saharan Africa                                   -0.426509093
## Sub-Saharan Africa (excluding high income)           -0.426510689
## Sub-Saharan Africa (IDA & IBRD countries)            -0.426509093
## Sudan                                                -0.358459926
## Suriname                                             -0.803429691
## Sweden                                                2.086815652
## Switzerland                                           2.599001453
## Syrian Arab Republic                                 -0.976780987
## Tajikistan                                           -1.036945275
## Tanzania                                             -0.447691586
## Thailand                                             -0.644741956
## Timor-Leste                                          -0.475574389
## Togo                                                 -0.382852984
## Tonga                                                -1.061948716
## Trinidad and Tobago                                  -0.082560007
## Tunisia                                              -0.624435259
## Turkey                                               -0.120290779
## Turkmenistan                                         -1.051063444
## Turks and Caicos Islands                             -0.094331107
## Tuvalu                                               -0.747612951
## Uganda                                               -0.427928552
## Ukraine                                              -0.649126020
## United Arab Emirates                                 -0.111665277
## United Kingdom                                        1.969030540
## United States                                         1.648144795
## Upper middle income                                  -0.297473668
## Uruguay                                              -0.027181200
## Uzbekistan                                           -1.004148087
## Vanuatu                                              -0.625606841
## Venezuela, RB                                        -0.621641703
## Vietnam                                              -0.723424473
## Virgin Islands (U.S.)                                -0.261111624
## West Bank and Gaza                                   -0.770972653
## World                                                -0.161697970
## Yemen, Rep.                                          -0.777899021
## Zambia                                               -0.585572199
## Zimbabwe                                             -0.581057220

Ponemos los índices en una nueva data.frame.

promedio2=as.data.frame(Calidad2$scores)
names(promedio2) = c("Densidad", "DesarrolloTec")
head(promedio2)
##                       Densidad DesarrolloTec
## Afghanistan         -1.3773309   -0.25358706
## Albania              0.9504914   -0.82000247
## Algeria              0.6045737   -0.75122810
## Andorra              0.2040096    1.80694394
## Angola              -1.2840843   -0.66414178
## Antigua and Barbuda  0.4089887   -0.02829305
promedio2$Pais=row.names(promedio2)
row.names(promedio2) = NULL
head(promedio2)
##     Densidad DesarrolloTec                Pais
## 1 -1.3773309   -0.25358706         Afghanistan
## 2  0.9504914   -0.82000247             Albania
## 3  0.6045737   -0.75122810             Algeria
## 4  0.2040096    1.80694394             Andorra
## 5 -1.2840843   -0.66414178              Angola
## 6  0.4089887   -0.02829305 Antigua and Barbuda

El análisis factorial exploratorio sugiere, por un lado, que los componentes ENER, EDU y Barrios Tugurios están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice. Por otro lado, los componentes ban y GAST también se encuentran correlacionados entre ellos, pues el análisis factorial sugiere que deben formar una sola dimensión. Y esto tiene sentido al ser dos variables que se relacionan con el aspecto de desarrollo tecnológico.

Análisis factorial de salud
PRIMERA DATA: variables independientes del 2003-2007

Para este análisis factorial usamos la data salud2 compuesta por las variables VidaM y CobRet.

Creamos una copia de la data y ponemos a los países como índice.

salud1_X=salud1
row.names(salud1) = salud1$Pais
salud1$Pais = NULL
head(salud1)
##                        VidaM CobARet
## Afghanistan         59.71540      NA
## Albania             78.16240     6.2
## Algeria             74.10120    14.6
## Angola              55.38620     1.4
## Antigua and Barbuda 76.90380      NA
## Arab World          70.78677      NA

Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.

salud1[is.na(salud1$VidaM), "VidaM"]=mean(salud1$VidaM, na.rm=T)
salud1[is.na(salud1$CobARet), "CobARet"]=mean(salud1$CobARet, na.rm=T)

Estandarizamos:

salud1=as.data.frame(scale(salud1[,c(1,2)]))
head(salud1)
##                            VidaM     CobARet
## Afghanistan         -1.133702486  0.00000000
## Albania              0.739051823 -0.64026360
## Algeria              0.326755526 -0.05502504
## Angola              -1.573206359 -0.97468563
## Antigua and Barbuda  0.611277737  0.00000000
## Arab World          -0.009727659  0.00000000

Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.

library(psych)
puntaje1 = cor(salud1) #sacar la correlación de los puntajes estandarizadas
puntaje1
##             VidaM   CobARet
## VidaM   1.0000000 0.4826546
## CobARet 0.4826546 1.0000000
cor.plot(puntaje1, 
         numbers=T, 
         upper=FALSE, 
         main = "Correlation", 
         show.legend = FALSE) #verlo en un gráfico

KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.5

KMO(salud1) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = salud1)
## Overall MSA =  0.5
## MSA for each item = 
##   VidaM CobARet 
##     0.5     0.5

Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial. La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.

#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(salud1,n=nrow(salud1)) 
## R was not square, finding R from data
## $chisq
## [1] 65.10916
## 
## $p.value
## [1] 7.086207e-16
## 
## $df
## [1] 1

¿Cuántos índices debería crear? El R nos sugiere 1 índice.

fa.parallel(puntaje1, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(salud1)) #cuantos indices deberia formar

## Parallel analysis suggests that the number of factors =  1  and the number of components =  NA
salud1 = fa(salud1, 
                     nfactors=1, 
                     rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
salud1$loadings
## 
## Loadings:
##         MR1  
## VidaM   0.695
## CobARet 0.695
## 
##                  MR1
## SS loadings    0.965
## Proportion Var 0.483

El índice logra resumir el 48.3% de los componentes VidaM y CobARet.

fa.diagram(salud1)

MR1 junta a ambos componentes.

Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.

#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(salud1$communalities)
##     VidaM   CobARet 
## 0.4826546 0.4826546

Ambos componentes aportan de igual forma al factorial.

Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.

# mientras mas grande peor (lo que mantiene)
sort(salud1$uniquenesses)
##     VidaM   CobARet 
## 0.5173454 0.5173454

Ambos componentes tienen menor relevancia para el análisis factorial.

La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. En este caso, ninguna variable está cerca a otro factor.

sort(salud1$complexity)
##   VidaM CobARet 
##       1       1
salud1$scores
##                                                               MR1
## Afghanistan                                          -0.531223568
## Albania                                               0.046289599
## Algeria                                               0.127325856
## Angola                                               -1.193876075
## Antigua and Barbuda                                   0.286428886
## Arab World                                           -0.004558128
## Argentina                                             1.136605835
## Armenia                                              -0.250722761
## Aruba                                                 0.277495237
## Australia                                             1.816622019
## Austria                                               1.746740690
## Azerbaijan                                           -0.446383479
## Bahamas, The                                          0.435434166
## Bahrain                                               0.263627063
## Bangladesh                                           -0.594973180
## Barbados                                              0.976052458
## Belarus                                              -0.037640984
## Belgium                                               0.526952398
## Belize                                               -0.084709744
## Benin                                                -1.077452549
## Bermuda                                               0.499361789
## Bhutan                                               -0.279283252
## Bolivia                                              -0.678960846
## Bosnia and Herzegovina                                0.329260928
## Botswana                                             -0.695994685
## Brazil                                                0.825928745
## Brunei Darussalam                                     0.337909157
## Bulgaria                                              0.492009979
## Burkina Faso                                         -1.065722512
## Burundi                                              -1.079721209
## Cabo Verde                                           -0.195891973
## Cambodia                                             -0.248401824
## Cameroon                                             -1.165292105
## Canada                                                0.554543007
## Caribbean small states                                0.153951841
## Central African Republic                             -1.648226807
## Central Europe and the Baltics                        0.336295082
## Chad                                                 -1.441149955
## Channel Islands                                       0.487478799
## Chile                                                 2.008619424
## China                                                 0.221505329
## Colombia                                             -0.048372110
## Comoros                                              -0.868593956
## Congo, Dem. Rep.                                     -1.188587936
## Congo, Rep.                                          -1.110690571
## Costa Rica                                            0.745081791
## Cote d'Ivoire                                        -1.347554179
## Croatia                                               0.383481231
## Cuba                                                  0.679105473
## Curacao                                               0.374252648
## Cyprus                                                1.123172427
## Czech Republic                                        1.442572154
## Denmark                                               1.516128510
## Djibouti                                             -0.950432434
## Dominican Republic                                   -0.219300325
## Early-demographic dividend                           -0.150445711
## East Asia & Pacific                                   0.213396793
## East Asia & Pacific (excluding high income)           0.160686354
## East Asia & Pacific (IDA & IBRD countries)            0.162369841
## Ecuador                                              -0.045767225
## Egypt, Arab Rep.                                     -0.405086485
## El Salvador                                           0.176765861
## Equatorial Guinea                                    -1.152752955
## Eritrea                                              -0.832730127
## Estonia                                               0.093521685
## Eswatini                                             -1.289354093
## Ethiopia                                             -0.991857074
## Euro area                                             0.557465684
## Europe & Central Asia                                 0.348775182
## Europe & Central Asia (excluding high income)         0.136991308
## Europe & Central Asia (IDA & IBRD countries)          0.162594996
## European Union                                        0.506593020
## Faroe Islands                                         0.526000998
## Fiji                                                  0.021397302
## Finland                                               0.548834605
## Fragile and conflict affected situations             -0.522476279
## France                                                2.233242721
## French Polynesia                                      0.281196184
## Gabon                                                -0.621277868
## Gambia, The                                          -1.015193583
## Georgia                                              -0.086135140
## Germany                                               2.014868172
## Ghana                                                -0.991006365
## Greece                                                1.522321820
## Greenland                                             0.043545901
## Grenada                                               0.139171146
## Guam                                                  0.406923735
## Guatemala                                             0.058762705
## Guinea                                               -1.228136671
## Guinea-Bissau                                        -1.264182912
## Guyana                                                0.030613334
## Haiti                                                -0.788298757
## Heavily indebted poor countries (HIPC)               -0.671600820
## High income                                           0.509147448
## Honduras                                              0.049510519
## Hong Kong SAR, China                                  0.668711044
## Hungary                                               0.944261599
## IBRD only                                             0.053640720
## Iceland                                               0.581182216
## IDA & IBRD total                                     -0.078103905
## IDA blend                                            -0.607383275
## IDA only                                             -0.489339559
## IDA total                                            -0.527963387
## India                                                -0.701492628
## Indonesia                                            -0.562927395
## Iran, Islamic Rep.                                   -0.358385842
## Iraq                                                  0.008334576
## Ireland                                               1.857774963
## Israel                                                0.541223403
## Italy                                                 1.484023077
## Jamaica                                              -0.118597895
## Japan                                                 1.871170737
## Jordan                                                0.157533172
## Kazakhstan                                           -0.388250968
## Kenya                                                -0.951841847
## Kiribati                                             -0.144555454
## Korea, Dem. People’s Rep.                             0.034288776
## Korea, Rep.                                           0.511729993
## Kosovo                                                0.003682228
## Kuwait                                                2.062804848
## Kyrgyz Republic                                      -0.423014465
## Lao PDR                                              -0.707901162
## Late-demographic dividend                             0.223937384
## Latin America & Caribbean                             0.256480255
## Latin America & Caribbean (excluding high income)     0.237142353
## Latin America & the Caribbean (IDA & IBRD countries)  0.250725234
## Latvia                                                0.286248120
## Least developed countries: UN classification         -0.519093785
## Lebanon                                               0.429039473
## Lesotho                                              -1.408489722
## Liberia                                              -1.177488693
## Libya                                                 0.130580001
## Liechtenstein                                         0.600210222
## Lithuania                                            -0.012289095
## Low & middle income                                  -0.086007665
## Low income                                           -0.605906529
## Lower middle income                                  -0.236671017
## Luxembourg                                            1.805112027
## Macao SAR, China                                      0.636116069
## Madagascar                                           -0.887243354
## Malawi                                               -1.266635266
## Malaysia                                              0.011518846
## Maldives                                              0.224378558
## Mali                                                 -1.194080502
## Malta                                                 0.506021591
## Mauritania                                           -0.830770549
## Mauritius                                             0.237155864
## Mexico                                                0.641142284
## Micronesia, Fed. Sts.                                -0.106309162
## Middle East & North Africa                            0.099066974
## Middle East & North Africa (excluding high income)    0.078120053
## Middle East & North Africa (IDA & IBRD countries)     0.077658702
## Middle income                                        -0.027404434
## Moldova                                              -0.357086387
## Mongolia                                             -0.505037002
## Montenegro                                            0.593335394
## Morocco                                              -0.157634214
## Mozambique                                           -1.278797091
## Myanmar                                              -0.694994564
## Namibia                                              -0.848907283
## Nepal                                                -0.653252364
## Netherlands                                           1.679844135
## New Caledonia                                         0.387096553
## New Zealand                                           1.470218565
## Nicaragua                                            -0.233348239
## Niger                                                -1.237056537
## Nigeria                                              -1.436488093
## North America                                         0.452428819
## North Macedonia                                       0.013030596
## Norway                                                2.579758332
## OECD members                                          0.491026088
## Oman                                                  0.271177939
## Other small states                                   -0.364012688
## Pacific island small states                          -0.017075781
## Pakistan                                             -0.707142970
## Palau                                                 0.057912046
## Panama                                                0.430264157
## Papua New Guinea                                     -0.642356878
## Paraguay                                             -0.263644117
## Peru                                                 -0.109136401
## Philippines                                          -0.419045173
## Poland                                                0.403270358
## Portugal                                              1.121744350
## Post-demographic dividend                             0.507833903
## Pre-demographic dividend                             -0.760460376
## Puerto Rico                                           0.549405445
## Qatar                                                 1.609931278
## Romania                                               2.189087140
## Russian Federation                                   -0.299733353
## Rwanda                                               -0.845681366
## Samoa                                                 0.170472216
## Sao Tome and Principe                                -0.209773945
## Saudi Arabia                                          0.183972587
## Senegal                                              -0.792198828
## Serbia                                                1.342320787
## Seychelles                                            0.271025715
## Sierra Leone                                         -1.716780444
## Singapore                                             0.178774408
## Sint Maarten (Dutch part)                             0.286248120
## Slovak Republic                                       1.040259842
## Slovenia                                              0.920420235
## Small states                                         -0.232259117
## Solomon Islands                                      -0.162213444
## Somalia                                              -1.293614968
## South Africa                                         -1.110207003
## South Asia                                           -0.241991799
## South Asia (IDA & IBRD)                              -0.241991799
## South Sudan                                          -1.387028696
## Spain                                                 1.694730622
## Sri Lanka                                            -0.146130080
## St. Lucia                                             0.210706935
## St. Martin (French part)                              0.490799186
## St. Vincent and the Grenadines                        0.129229013
## Sub-Saharan Africa                                   -0.777661864
## Sub-Saharan Africa (excluding high income)           -0.777775639
## Sub-Saharan Africa (IDA & IBRD countries)            -0.777661864
## Sudan                                                -0.912118204
## Suriname                                             -0.104952250
## Sweden                                                0.565008410
## Switzerland                                           0.614481226
## Syrian Arab Republic                                  0.276610435
## Tajikistan                                           -0.501243844
## Tanzania                                             -1.014317989
## Thailand                                              0.242204151
## Timor-Leste                                          -0.256877774
## Togo                                                 -1.120817739
## Tonga                                                 0.154545775
## Trinidad and Tobago                                   0.107926134
## Tunisia                                               0.356074937
## Turkey                                                0.241798697
## Turkmenistan                                         -0.094644994
## Uganda                                               -1.040429046
## Ukraine                                              -0.304992281
## United Arab Emirates                                  0.282804051
## United Kingdom                                        0.489847786
## United States                                         0.441326370
## Upper middle income                                   0.190969536
## Uruguay                                               0.572336401
## Uzbekistan                                           -0.448759358
## Vanuatu                                               0.016278768
## Venezuela, RB                                         0.314019495
## Vietnam                                              -0.021868355
## Virgin Islands (U.S.)                                 0.479382383
## West Bank and Gaza                                    0.120485644
## World                                                -0.239476561
## Yemen, Rep.                                          -0.362502237
## Zambia                                               -1.163770229
## Zimbabwe                                             -1.545252176

Ponemos el índice en una nueva data.frame.

puntaje1=as.data.frame(salud1$scores)
names(puntaje1) = c("Salud")
head(puntaje1)
##                            Salud
## Afghanistan         -0.531223568
## Albania              0.046289599
## Algeria              0.127325856
## Angola              -1.193876075
## Antigua and Barbuda  0.286428886
## Arab World          -0.004558128
puntaje1$Pais=row.names(puntaje1)
row.names(puntaje1) = NULL

El análisis factorial exploratorio sugiere que los componentes Esperanza de vida en mujeres y Cobertura del tratamiento antirretroviral están efectivamente correlacionados, por cual es correcto juntarlos en un solo índice.

SEGUNDA DATA: variables independientes de 2008-2012

Para este análisis factorial usamos la data salud2 compuesta por las variables VidaM y CobRet.

Creamos una copia de la data y ponemos a los países como índice.

salud2_X=salud2
row.names(salud2) = salud2$Pais
salud2$Pais = NULL
head(salud2)
##                        VidaM CobARet
## Afghanistan         62.44780      NA
## Albania             79.21420    18.0
## Algeria             75.89040    28.8
## Angola              60.80120     9.8
## Antigua and Barbuda 77.79520      NA
## Arab World          71.90649      NA

Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.

salud2[is.na(salud2$VidaM), "VidaM"]=mean(salud2$VidaM, na.rm=T)
salud2[is.na(salud2$CobARet), "CobARet"]=mean(salud2$CobARet, na.rm=T)

Estandarizamos:

salud2=as.data.frame(scale(salud2[,c(1,2)]))
head(salud2)
##                          VidaM    CobARet
## Afghanistan         -1.1656446  0.0000000
## Albania              0.7174271 -0.7262289
## Algeria              0.3441237  0.0631689
## Angola              -1.3505779 -1.3255865
## Antigua and Barbuda  0.5580561  0.0000000
## Arab World          -0.1033177  0.0000000

Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.

library(psych)
puntaje2 = cor(salud2) #sacar la correlación de los puntajes estandarizadas
puntaje2
##             VidaM   CobARet
## VidaM   1.0000000 0.3953312
## CobARet 0.3953312 1.0000000
cor.plot(puntaje2, 
         numbers=T, 
         upper=FALSE, 
         main = "Correlation", 
         show.legend = FALSE) #verlo en un gráfico

KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.5.

KMO(salud2) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = salud2)
## Overall MSA =  0.5
## MSA for each item = 
##   VidaM CobARet 
##     0.5     0.5

Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial. La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.

#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(salud2,n=nrow(salud2)) 
## R was not square, finding R from data
## $chisq
## [1] 41.89086
## 
## $p.value
## [1] 9.651291e-11
## 
## $df
## [1] 1

¿Cuántos índices debería crear? El R nos sugiere 1 índice.

fa.parallel(puntaje2, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(salud2)) #cuantos indices deberia formar

## Parallel analysis suggests that the number of factors =  1  and the number of components =  NA
salud2 = fa(salud2, 
                     nfactors=1, 
                     rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
salud2$loadings
## 
## Loadings:
##         MR1  
## VidaM   0.629
## CobARet 0.629
## 
##                  MR1
## SS loadings    0.791
## Proportion Var 0.395

El modelo resume el 39.5% de los componentes VidaM y CobARet para este segundo periodo.

fa.diagram(salud2)

El MR1 junta a ambos componentes.

Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor. En este caso, ninguno de los componentes aporta mucho.

#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(salud2$communalities)
##     VidaM   CobARet 
## 0.3953312 0.3953312

Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial. Es posible afirmar que en este caso, ninguno de los componentes tiene mayor relevancia para el modelo.

# mientras mas grande peor (lo que mantiene)
sort(salud2$uniquenesses)
##     VidaM   CobARet 
## 0.6046688 0.6046688

La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. Nigún componente está cerca a otro factor en este caso.

sort(salud2$complexity)
##   VidaM CobARet 
##       1       1
salud2$scores
##                                                               MR1
## Afghanistan                                          -0.525254033
## Albania                                              -0.003966211
## Algeria                                               0.183531157
## Angola                                               -1.205913178
## Antigua and Barbuda                                   0.251467044
## Arab World                                           -0.046556236
## Argentina                                             1.113839189
## Armenia                                              -0.493835927
## Aruba                                                 0.232539168
## Australia                                             1.668689360
## Austria                                               1.766518457
## Azerbaijan                                           -0.489522683
## Bahamas, The                                          0.242197633
## Bahrain                                               0.164941789
## Bangladesh                                           -0.835551393
## Barbados                                              0.702308356
## Belarus                                               0.114545236
## Belgium                                               0.512853925
## Belize                                               -0.150894145
## Benin                                                -0.440830430
## Bermuda                                               0.531680583
## Bhutan                                               -0.249382772
## Bolivia                                              -0.873357083
## Bosnia and Herzegovina                                0.284150526
## Botswana                                              0.171549232
## Brazil                                                0.565174203
## Brunei Darussalam                                     0.284201136
## Bulgaria                                              0.091200473
## Burkina Faso                                         -0.670685296
## Burundi                                              -0.847462831
## Cabo Verde                                            0.012044930
## Cambodia                                              0.623487436
## Cameroon                                             -1.171192539
## Canada                                                0.537146387
## Caribbean small states                                0.113243573
## Cayman Islands                                        0.600914097
## Central African Republic                             -1.759328051
## Central Europe and the Baltics                        0.329657888
## Chad                                                 -1.111819538
## Channel Islands                                       0.468186163
## Chile                                                 1.696529561
## China                                                 0.202021764
## Colombia                                             -0.154708810
## Comoros                                              -1.108943528
## Congo, Dem. Rep.                                     -1.346127167
## Congo, Rep.                                          -0.932693059
## Costa Rica                                            0.804023461
## Cote d'Ivoire                                        -1.358032295
## Croatia                                               0.350904185
## Cuba                                                  0.688019445
## Curacao                                               0.370641810
## Cyprus                                                0.698208218
## Czech Republic                                        1.187016106
## Denmark                                               1.579167337
## Djibouti                                             -1.136876101
## Dominican Republic                                   -0.175246244
## Early-demographic dividend                           -0.156507262
## East Asia & Pacific                                   0.188080249
## East Asia & Pacific (excluding high income)           0.133967444
## East Asia & Pacific (IDA & IBRD countries)            0.135679689
## Ecuador                                               0.103322520
## Egypt, Arab Rep.                                     -0.686768677
## El Salvador                                           0.511151781
## Equatorial Guinea                                    -1.369142395
## Eritrea                                              -0.315059970
## Estonia                                               0.681322714
## Eswatini                                             -0.748431840
## Ethiopia                                             -0.359709550
## Euro area                                             0.553190188
## Europe & Central Asia                                 0.344983535
## Europe & Central Asia (excluding high income)         0.135216023
## Europe & Central Asia (IDA & IBRD countries)          0.159348217
## European Union                                        0.502147007
## Faroe Islands                                         0.523987970
## Fiji                                                 -0.020962785
## Finland                                               0.533097643
## Fragile and conflict affected situations             -0.539849697
## France                                                2.000510738
## French Polynesia                                      0.263299497
## Gabon                                                -0.508556573
## Gambia, The                                          -1.152878942
## Georgia                                              -0.228357151
## Germany                                               1.715893041
## Ghana                                                -1.005406067
## Greece                                                1.251217360
## Greenland                                             0.021943774
## Grenada                                               0.110854182
## Guam                                                  0.410400471
## Guatemala                                             0.181174461
## Guinea                                               -1.100175699
## Guinea-Bissau                                        -1.385799035
## Guyana                                                0.393568629
## Haiti                                                -0.628226762
## Heavily indebted poor countries (HIPC)               -0.626624262
## High income                                           0.491239739
## Honduras                                              0.181340532
## Hong Kong SAR, China                                  0.671767108
## Hungary                                               0.658155294
## IBRD only                                             0.037009168
## Iceland                                               0.561438848
## IDA & IBRD total                                     -0.094607364
## IDA blend                                            -0.619924032
## IDA only                                             -0.464057657
## IDA total                                            -0.514983179
## India                                                -0.573839043
## Indonesia                                            -0.924028440
## Iran, Islamic Rep.                                   -0.648707880
## Iraq                                                 -0.079102742
## Ireland                                               1.544109887
## Israel                                                0.535122015
## Italy                                                 1.636732956
## Jamaica                                              -0.123547729
## Japan                                                 1.687808037
## Jordan                                                0.114052689
## Kazakhstan                                           -0.551478399
## Kenya                                                -0.302403525
## Kiribati                                             -0.217782329
## Korea, Dem. People’s Rep.                             0.004493690
## Korea, Rep.                                           0.547268245
## Kosovo                                               -0.037775192
## Kuwait                                                1.236783463
## Kyrgyz Republic                                      -0.699030005
## Lao PDR                                              -0.719986319
## Late-demographic dividend                             0.209792546
## Latin America & Caribbean                             0.235081499
## Latin America & Caribbean (excluding high income)     0.218152799
## Latin America & the Caribbean (IDA & IBRD countries)  0.229846952
## Latvia                                                0.283087731
## Least developed countries: UN classification         -0.484638836
## Lebanon                                               0.562233592
## Lesotho                                              -0.844990251
## Liberia                                              -1.246536137
## Libya                                                 0.081763960
## Liechtenstein                                         0.593828796
## Lithuania                                            -0.236733382
## Low & middle income                                  -0.102124406
## Low income                                           -0.565529443
## Lower middle income                                  -0.250244406
## Luxembourg                                            1.653522694
## Macao SAR, China                                      0.644539308
## Madagascar                                           -1.277307191
## Malawi                                               -0.640374086
## Malaysia                                             -0.200674050
## Maldives                                              0.222275604
## Mali                                                 -1.082199825
## Malta                                                 0.510829554
## Mauritania                                           -0.992083276
## Mauritius                                             0.198975085
## Mexico                                                0.633065449
## Micronesia, Fed. Sts.                                -0.169045579
## Middle East & North Africa                            0.068101592
## Middle East & North Africa (excluding high income)    0.047793570
## Middle East & North Africa (IDA & IBRD countries)     0.047466511
## Middle income                                        -0.045670142
## Moldova                                              -0.489751547
## Mongolia                                             -0.746627289
## Montenegro                                            0.394644098
## Morocco                                              -0.164814912
## Mozambique                                           -1.334538185
## Myanmar                                              -0.706189861
## Namibia                                               0.116469833
## Nepal                                                -0.614896695
## Netherlands                                           1.664207073
## New Caledonia                                         0.356477122
## New Zealand                                           1.550199124
## Nicaragua                                            -0.209627773
## Niger                                                -1.043872103
## Nigeria                                              -1.595619350
## North America                                         0.424023693
## North Macedonia                                      -0.032712836
## Norway                                                2.487583484
## OECD members                                          0.473009210
## Oman                                                  0.269514318
## Other small states                                   -0.330597205
## Pacific island small states                          -0.041122400
## Pakistan                                             -1.168774803
## Panama                                                0.389814639
## Papua New Guinea                                     -0.532040252
## Paraguay                                             -0.278430351
## Peru                                                  0.155803629
## Philippines                                          -0.642988063
## Poland                                                0.392403806
## Portugal                                              1.320158854
## Post-demographic dividend                             0.493120513
## Pre-demographic dividend                             -0.735041435
## Puerto Rico                                           0.489249751
## Qatar                                                 1.091449637
## Romania                                               1.259171501
## Russian Federation                                   -0.351325370
## Rwanda                                                0.075983856
## Samoa                                                 0.182041215
## San Marino                                            0.707193614
## Sao Tome and Principe                                -0.253927487
## Saudi Arabia                                          0.120621776
## Senegal                                              -0.490444081
## Serbia                                                1.030159539
## Seychelles                                            0.281063359
## Sierra Leone                                         -1.811352162
## Singapore                                             0.330975672
## Sint Maarten (Dutch part)                             0.236527181
## Slovak Republic                                       0.685966222
## Slovenia                                              0.802286988
## Small states                                         -0.222874152
## Solomon Islands                                      -0.142222653
## Somalia                                              -1.599207394
## South Africa                                         -0.809724055
## South Asia                                           -0.241342515
## South Asia (IDA & IBRD)                              -0.241342515
## South Sudan                                          -1.794605027
## Spain                                                 1.794297141
## Sri Lanka                                            -0.452913069
## St. Lucia                                             0.219411117
## St. Martin (French part)                              0.465281189
## St. Vincent and the Grenadines                        0.081794325
## Sub-Saharan Africa                                   -0.730856374
## Sub-Saharan Africa (excluding high income)           -0.730954905
## Sub-Saharan Africa (IDA & IBRD countries)            -0.730856374
## Sudan                                                -1.177303955
## Suriname                                              0.084241723
## Sweden                                                0.540182944
## Switzerland                                           0.597877539
## Syrian Arab Republic                                  0.199977149
## Tajikistan                                           -0.798790681
## Tanzania                                             -0.796048513
## Thailand                                              0.642156574
## Timor-Leste                                          -0.207771811
## Togo                                                 -1.078055316
## Tonga                                                 0.117807899
## Trinidad and Tobago                                   0.438948077
## Tunisia                                               0.039449652
## Turkey                                                0.239573860
## Turkmenistan                                         -0.132809324
## Uganda                                               -0.923976989
## Ukraine                                              -0.484908812
## United Arab Emirates                                  0.251021682
## United Kingdom                                        0.484512721
## United States                                         0.411635338
## Upper middle income                                   0.176679969
## Uruguay                                               0.264041151
## Uzbekistan                                           -0.751807255
## Vanuatu                                               0.001912616
## Venezuela, RB                                         0.259250754
## Vietnam                                               0.140702909
## Virgin Islands (U.S.)                                 0.439976542
## West Bank and Gaza                                    0.076449984
## World                                                -0.101237568
## Yemen, Rep.                                          -0.402303815
## Zambia                                               -0.423634121
## Zimbabwe                                             -0.911656024

Ponemos el índice en una nueva data.frame.

puntaje2=as.data.frame(salud2$scores)
names(puntaje2) = c("Salud")
head(puntaje2)
##                            Salud
## Afghanistan         -0.525254033
## Albania             -0.003966211
## Algeria              0.183531157
## Angola              -1.205913178
## Antigua and Barbuda  0.251467044
## Arab World          -0.046556236
puntaje2$Pais=row.names(puntaje2)
row.names(puntaje2) = NULL

El análisis factorial exploratorio sugiere que los componentes Esperanza de vida en mujeres y Cobertura del tratamiento antirretroviral están efectivamente correlacionados, por cual es correcto juntarlos en un solo índice.

Merge final con los índices, las variables control y la variable dependiente
  • Para el primer periodo (2008-2012 de la variable dependiente y 2003-2007 de las variables independientes).

Juntamos los índices con las variables faltantes, eliminamos los casos que no son países y estandarizamos las variables faltantes.

responsabilidad1 = merge(pearson1, DataMetodos1, by= "Pais")
dendes1 = merge(responsabilidad1, promedio1, by= "Pais")
sal1 = merge(dendes1, puntaje1, by= "Pais")
movilidad1 = merge(sal1, migra1, by= "Pais")
movi1 = merge(movilidad1, ODA1, by= "Pais")
control1 = merge(movi1, women1, by= "Pais")
final1 = merge(control1, AFRICA, by= "Pais")
VIH1 = merge(final1, DataVIH1,by= "Pais")

VIH1=VIH1[-grep("San|high|Pacific|French|Caribbean|Early|Late|Island|Small|West|Sint|Other|OECD|North|World|Euro|Latin|Upper|High|Heavily|IBR|IDA|Least|Low|Middle|East|Central|Fragile|Post|Pre",VIH1$Pais),] #Eliminamos los casos que no son países
row.names(VIH1)=NULL

VIH1$Metodos=scale(VIH1$Metodos)
VIH1$Migracion=scale(VIH1$Migracion)
VIH1$ODA=scale(VIH1$ODA)
VIH1$Women=scale(VIH1$Women)
  • Para el segundo periodo (2013-2017 de la variable dependiente y 2008-2012 de las variables independientes).

Juntamos los índices con las variables faltantes, eliminamos los casos que no son países y estandarizamos las variables faltantes. Agregamos también el índice de Gini que no incluimos en el análisis factorial. Antes de ello, lo volteamos, pues al igual que BarriosTugurios, lo que queremos ver es que tanta no desigualdad hay. Asimismo, también imputamos a Gini para que esté de acuerdo a lo realizado en el primer periodo.

DataGini2$Gini= 65 - DataGini2$Gini

Hacemos el merge teniendo en cuenta a los NA’s para poder hacer la imputación en el índice de Gini. Luego de ello procederemos a quedarnos solo con los casos completos.

responsabilidad2 = merge(pearson2, DataMetodos2, all.x=T,all.y=T ) 
dendes2 = merge(responsabilidad2, promedio2,all.x=T,all.y=T )
gini2=merge(dendes2, DataGini2,all.x=T,all.y=T )
sal2 = merge(gini2, puntaje2, all.x=T,all.y=T )
movilidad2 = merge(sal2, migra2, all.x=T,all.y=T )
movi2 = merge(movilidad2, ODA2, all.x=T,all.y=T )
control2 = merge(movi2, women2,all.x=T,all.y=T )
final2 = merge(control2, AFRICA,all.x=T,all.y=T )
VIH2 = merge(final2, DataVIH2,all.x=T,all.y=T )

VIH2[is.na(VIH2$Gini), "Gini"]=mean(VIH2$Gini, na.rm=T) #Imputamos Gini
names(VIH2) = c("Pais","Empoderamiento", "Metodos", "Densidad", "DesarrolloTec", "NoDesigualdad", "Salud","Migracion", "ODA", "Women", "Africa", "VIH") #Cambiamos los nombres
VIH2=VIH2[complete.cases(VIH2),] #Nos quedamos con los casos completos

VIH2=VIH2[-grep("San|high|Pacific|French|Caribbean|Early|Late|Island|Small|West|Sint|Other|OECD|North|World|Euro|Latin|Upper|High|Heavily|IBR|IDA|Least|Low|Middle|East|Central|Fragile|Post|Pre",VIH2$Pais),] #Eliminamos los casos que no son países
row.names(VIH2)=NULL

VIH2$Metodos=scale(VIH2$Metodos) #Estandarizamos
VIH2$NoDesigualdad=scale(VIH2$NoDesigualdad)
VIH2$Migracion=scale(VIH2$Migracion)
VIH2$ODA=scale(VIH2$ODA)
VIH2$Women=scale(VIH2$Women)

5. Análisis de Cluster o Componentes Principales

Mapa de Similitudes

PARA LA PRIMERA DATA - Prevalencia del VIH (variable dependiente) 2008-2012 - Hipótesis (variables independientes) 2003-2007

Creamos una copia de la data final y ponemos a los países como índice.

VIH1_x=VIH1
row.names(VIH1_x) = VIH1_x$Pais
VIH1_x$Pais=NULL
head(VIH1_x) #resultado final
##            Empoderamiento   Metodos   Densidad DesarrolloTec NoDesigualdad
## Albania       -0.74741919 0.6522352  0.4732899    -1.1410398     1.1788618
## Algeria       -1.22463238 0.7085819  0.6353829    -1.0661872     0.7546057
## Argentina      0.00458265 1.4670948  1.2662440    -0.4575426    -0.9427860
## Armenia       -0.31023875 0.3488301  0.5278865    -0.9439612     0.9635563
## Azerbaijan     0.30285455 0.2621429  0.5825904    -0.8728966     0.7865296
## Bangladesh    -1.47273276 0.5243716 -1.4759396    -0.2257567     0.7649945
##                 Salud   Migracion        ODA      Women Africa VIH
## Albania     0.0462896  0.02353665 -0.3298818 -0.6711162     NO 0.1
## Algeria     0.1273259 -0.21783736 -0.8130527 -1.0651146     SI 0.1
## Argentina   1.1366058  0.25176788 -0.8475062  0.6409133     NO 0.1
## Armenia    -0.2507228  0.08215842 -0.1884567  2.6186155     NO 0.1
## Azerbaijan -0.4463835  0.49072094 -0.5866775  0.2886239     NO 0.1
## Bangladesh -0.5949732 -5.75914199 -0.6085870 -1.4134488     NO 0.1

Pedimos las distancias como criterio para establecer las similitudes entre los casos y eliminamos la variable categórica.

VIH1_x =dist(VIH1_x[-c(10)])

Al ser el GOF cercano a 1, entendemos que es adecuado vincular las variables introducidas.

VIH1_map = cmdscale(VIH1_x,eig=TRUE, k=2) # k sugiere dimensiones
VIH1_map$GOF # mientras mas cerca a 1 mejor.
## [1] 0.776212 0.776212

Podemos ver la posición de los puntos creados:

titulo="Mapa de Similitudes entre paises"
x = VIH1_map$points[,1]
y = VIH1_map$points[,2]
plot(x, y, main=titulo)

Podemos mostrar los nombres de las variables en lugar de los puntos:

plot(x, y, xlab="Dimensión 1", ylab="Dimensión 2", main=titulo, 
     type="n") # 'n' evita que se pongan los puntos.
# etiquetas y colores de los puntos
text(x, y,labels = rownames(VIH1_map$points),cex=1) 

Guardamos nuestras dimensiones en un data.frame.

VIH1_map_DF=as.data.frame(VIH1_map$points)

A partir de ello, para el primer periodo, podemos decir que los países africanos como South Africa, Botswana y Eswatini son más distantes en cuanto a las características representadas en las variables independientes. En sí, la mayoría de países africanos resultan más distantes en cuanto a similitud por las características de las variables.

PARA LA SEGUNDA DATA - Prevalencia del VIH (variable dependiente) 2013-2017 - Hipótesis (variables independientes) 2008-2012

Creamos una copia de la data final y ponemos a los países como índice.

VIH2_x=VIH2
row.names(VIH2_x) = VIH2_x$Pais
VIH2_x$Pais=NULL
head(VIH2_x) #resultado final
##            Empoderamiento    Metodos   Densidad DesarrolloTec
## Albania      -0.206127451  1.0896776  0.9504914    -0.8200025
## Algeria      -2.452558785  0.5068520  0.6045737    -0.7512281
## Angola        1.910842948 -1.1546359 -1.2840843    -0.6641418
## Argentina    -0.134724627  0.4851048  1.0312177    -0.1618742
## Armenia      -0.003203348  0.4633575  0.9799543    -0.8601155
## Azerbaijan    0.724065533  0.4633575  0.9327188    -0.5750845
##            NoDesigualdad        Salud  Migracion        ODA       Women
## Albania        1.4499741 -0.003966211 0.13288761 -0.3767134 -0.53049129
## Algeria        1.7181831  0.183531157 0.02155436 -0.8767881 -0.79896570
## Angola        -0.4133722 -1.205913178 0.53661832 -0.8458191  0.61733827
## Argentina     -0.4528978  1.113839189 0.40857939 -0.8966298  0.62830015
## Armenia        1.4866764 -0.493835927 0.27336366 -0.2582459  2.53020104
## Azerbaijan     0.2182703 -0.489522683 0.34156903 -0.8188119  0.05464474
##            Africa  VIH
## Albania        NO 0.10
## Algeria        SI 0.10
## Angola         SI 0.96
## Argentina      NO 0.10
## Armenia        NO 0.10
## Azerbaijan     NO 0.10

Pedimos las distancias como criterio para establecer las similitudes entre los casos y eliminamos la variable categórica.

VIH2_x =dist(VIH2_x[-c(10)])

Al ser el GOF cercano a 1, entendemos que es adecuado vincular las variables introducidas.

VIH2_map = cmdscale(VIH2_x,eig=TRUE, k=2) # k sugiere dimensiones
VIH2_map$GOF # mientras mas cerca a 1 mejor.
## [1] 0.7091426 0.7091426

Podemos ver la posición de los puntos creados:

titulo="Mapa de Similitudes entre paises"
x = VIH2_map$points[,1]
y = VIH2_map$points[,2]
plot(x, y, main=titulo)

Podemos mostrar los nombres de las variables en lugar de los puntos:

plot(x, y, xlab="Dimensión 1", ylab="Dimensión 2", main=titulo, 
     type="n") # 'n' evita que se pongan los puntos.
# etiquetas y colores de los puntos
text(x, y,labels = rownames(VIH2_map$points),cex=1) 

Guardamos nuestras dimensiones en un data.frame.

VIH2_map_DF=as.data.frame(VIH2_map$points)

A partir de ello, para el segundo periodo, podemos decir que los países africanos como Lesotho, Botswana y Eswatini son más distantes en cuanto a las características representadas en las variables independientes. Al igual que en el primero periodo, la mayoría de países africanos resultan más distantes en cuanto a similitud por las características de las variables.

Análisis de Clusters

PARA LA PRIMERA DATA

  • Prevalencia del VIH (variable dependiente) 2008-2012
  • Hipótesis (variables independientes) 2003-2007
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado

Creamos un subset de la data original y ponemos a los países como índice.

VIH1_d=VIH1[,c(-11)] #Eliminamos la variable categórica
row.names(VIH1_d) = VIH1_d$Pais
VIH1_d$Pais=NULL
VIH1_d = as.data.frame(scale(VIH1_d)) #Estandarizamos
VIH1gg=VIH1_d #Creamos una copia para hacer el aggregate

Pedimos las distancias como un criterio de agrupamiento.

VIH1_d=dist(VIH1_d[c(1:10)])

Con la función Kmeans separamos los casos en 5 centroides.

#Pedimos el numero de grupos:
VIH1_clus=kmeans(VIH1_d,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1_clus$cluster
##             Albania             Algeria           Argentina 
##                   5                   5                   1 
##             Armenia          Azerbaijan          Bangladesh 
##                   5                   5                   3 
##             Belarus              Belize               Benin 
##                   5                   1                   2 
##             Bolivia            Botswana              Brazil 
##                   1                   4                   1 
##        Burkina Faso             Burundi          Cabo Verde 
##                   2                   4                   1 
##            Cambodia            Cameroon                Chad 
##                   2                   2                   2 
##            Colombia    Congo, Dem. Rep.         Congo, Rep. 
##                   1                   2                   2 
##          Costa Rica       Cote d'Ivoire                Cuba 
##                   1                   2                   1 
##  Dominican Republic             Ecuador    Egypt, Arab Rep. 
##                   1                   1                   1 
##         El Salvador            Eswatini            Ethiopia 
##                   5                   3                   2 
##             Georgia               Ghana              Guinea 
##                   5                   2                   2 
##       Guinea-Bissau              Guyana               Haiti 
##                   2                   1                   2 
##            Honduras               India           Indonesia 
##                   1                   3                   1 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   1                   5                   2 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   5                   2                   1 
##             Lesotho             Liberia          Madagascar 
##                   4                   4                   2 
##              Malawi            Malaysia                Mali 
##                   4                   1                   2 
##          Mauritania              Mexico             Moldova 
##                   2                   1                   5 
##            Mongolia          Montenegro             Morocco 
##                   5                   1                   1 
##          Mozambique             Myanmar             Namibia 
##                   4                   2                   4 
##               Nepal           Nicaragua               Niger 
##                   2                   1                   2 
##             Nigeria            Pakistan    Papua New Guinea 
##                   2                   5                   2 
##            Paraguay                Peru         Philippines 
##                   1                   1                   1 
##              Rwanda             Senegal              Serbia 
##                   4                   2                   5 
##        Sierra Leone        South Africa           Sri Lanka 
##                   4                   4                   1 
##               Sudan            Suriname          Tajikistan 
##                   2                   1                   5 
##            Tanzania            Thailand                Togo 
##                   2                   1                   2 
## Trinidad and Tobago             Tunisia              Uganda 
##                   1                   1                   2 
##             Ukraine             Uruguay          Uzbekistan 
##                   5                   1                   5 
##             Vietnam              Zambia            Zimbabwe 
##                   1                   2                   4
table(VIH1_clus$cluster)
## 
##  1  2  3  4  5 
## 31 29  3 11 16
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1=as.data.frame(VIH1_clus$cluster)
grupos1
##                     VIH1_clus$cluster
## Albania                             5
## Algeria                             5
## Argentina                           1
## Armenia                             5
## Azerbaijan                          5
## Bangladesh                          3
## Belarus                             5
## Belize                              1
## Benin                               2
## Bolivia                             1
## Botswana                            4
## Brazil                              1
## Burkina Faso                        2
## Burundi                             4
## Cabo Verde                          1
## Cambodia                            2
## Cameroon                            2
## Chad                                2
## Colombia                            1
## Congo, Dem. Rep.                    2
## Congo, Rep.                         2
## Costa Rica                          1
## Cote d'Ivoire                       2
## Cuba                                1
## Dominican Republic                  1
## Ecuador                             1
## Egypt, Arab Rep.                    1
## El Salvador                         5
## Eswatini                            3
## Ethiopia                            2
## Georgia                             5
## Ghana                               2
## Guinea                              2
## Guinea-Bissau                       2
## Guyana                              1
## Haiti                               2
## Honduras                            1
## India                               3
## Indonesia                           1
## Iran, Islamic Rep.                  1
## Kazakhstan                          5
## Kenya                               2
## Kyrgyz Republic                     5
## Lao PDR                             2
## Lebanon                             1
## Lesotho                             4
## Liberia                             4
## Madagascar                          2
## Malawi                              4
## Malaysia                            1
## Mali                                2
## Mauritania                          2
## Mexico                              1
## Moldova                             5
## Mongolia                            5
## Montenegro                          1
## Morocco                             1
## Mozambique                          4
## Myanmar                             2
## Namibia                             4
## Nepal                               2
## Nicaragua                           1
## Niger                               2
## Nigeria                             2
## Pakistan                            5
## Papua New Guinea                    2
## Paraguay                            1
## Peru                                1
## Philippines                         1
## Rwanda                              4
## Senegal                             2
## Serbia                              5
## Sierra Leone                        4
## South Africa                        4
## Sri Lanka                           1
## Sudan                               2
## Suriname                            1
## Tajikistan                          5
## Tanzania                            2
## Thailand                            1
## Togo                                2
## Trinidad and Tobago                 1
## Tunisia                             1
## Uganda                              2
## Ukraine                             5
## Uruguay                             1
## Uzbekistan                          5
## Vietnam                             1
## Zambia                              2
## Zimbabwe                            4
names(grupos1)='cluster'
grupos1$NAME=row.names(grupos1)
head(grupos1)
##            cluster       NAME
## Albania          5    Albania
## Algeria          5    Algeria
## Argentina        1  Argentina
## Armenia          5    Armenia
## Azerbaijan       5 Azerbaijan
## Bangladesh       3 Bangladesh

Para poder apreciar visualmente qué países se encuentran dentro de los clusters generados procedemos a realizar mapas.

Mapa con todas las variables
MAPA DE TODAS LAS VARIABLES

MAPA DE TODAS LAS VARIABLES

Para ver las características de cada grupo generado por el análisis de clústers, empleamos la función aggregate. De acuerdo a ello podemos decir que en el clúster 1 pintando en rojo oscuro, la mayoría de países en América Latina ha obtenido los puntajes más altos en Metodos, Densidad y Salud. El clúster 5 ha obtenido el menor puntaje en VIH y el mayor puntaje en NoDesigualdad, y está conformado por países de Asia y África pintados de color coral. El clúster 3, pintado de color palo rosa y formado por la India básicamente es el que ha obtenidoel mayor puntaje en VIH y DesarrolloTecno, y los puntajesmás bajos en Migracion y Empoderamiento.

VIH1gg=merge(VIH1gg, grupos1[-2], by=0)
row.names(VIH1gg) = VIH1gg$Row.names
VIH1gg=VIH1gg[-1]
head(VIH1gg)
##            Empoderamiento   Metodos   Densidad DesarrolloTec NoDesigualdad
## Albania       -0.87499288 0.6522352  0.6448434   -1.73193391     1.6669040
## Algeria       -1.30656531 0.7085819  0.7768113   -1.54586396     1.1898866
## Argentina     -0.19491265 1.4670948  1.2904264   -0.03288414    -0.7185957
## Armenia       -0.47962446 0.3488301  0.6892932   -1.24203218     1.4248227
## Azerbaijan     0.07483247 0.2621429  0.7338304   -1.06537860     1.2257807
## Bangladesh    -1.53093732 0.5243716 -0.9421201    0.54329354     1.2015675
##                  Salud   Migracion        ODA      Women        VIH
## Albania     0.84559917  0.02353665 -0.3298818 -0.6711162 -0.4211864
## Algeria     0.97066296 -0.21783736 -0.8130527 -1.0651146 -0.4211864
## Argentina   2.52829135  0.25176788 -0.8475062  0.6409133 -0.4211864
## Armenia     0.38721806  0.08215842 -0.1884567  2.6186155 -0.4211864
## Azerbaijan  0.08525359  0.49072094 -0.5866775  0.2886239 -0.4211864
## Bangladesh -0.14406587 -5.75914199 -0.6085870 -1.4134488 -0.4211864
##            cluster
## Albania          5
## Algeria          5
## Argentina        1
## Armenia          5
## Azerbaijan       5
## Bangladesh       3
agg1=aggregate(cbind(Empoderamiento, Metodos, Densidad, NoDesigualdad, Salud, DesarrolloTec, Migracion, VIH )~ cluster, data=VIH1gg,FUN=mean)
names(agg1)=c("cluster","Empoderamiento", "Metodos", "Densidad", "NoDesigualdad", "Salud", "DesarrolloTec", "Migracion", "VIH")
agg1
##   cluster Empoderamiento    Metodos   Densidad NoDesigualdad      Salud
## 1       1     -0.5199245  0.8286017  0.9229373    -0.2039823  0.8919126
## 2       2      0.6121372 -0.9741211 -0.9677652    -0.1346964 -0.7791498
## 3       3     -1.1506396  0.3867557 -0.5093101     0.2274865 -0.5560775
## 4       4      0.7138261 -0.4918387 -0.8298047    -1.0207457 -1.0460935
## 5       5     -0.3771554  0.4258011  0.6318698     1.2984619  0.5075821
##   DesarrolloTec   Migracion         VIH
## 1   -0.08139526  0.06770615 -0.38576281
## 2    0.27843840  0.04532982 -0.04795972
## 3    0.87261365 -3.33240106  1.76496521
## 4    0.68449043  0.46698534  1.32997785
## 5   -0.98116850  0.09043182 -0.41094831

Podemos decir que las características de los países según los clústers son las siguientes:

  • Clúster 1: Bajo empoderamiento, uso de métodos anticonceptivos muy alto, nivel muy alto de densidad estatal, nivel medio de no desigualdad, muy alto nivel de salud, nivel de desarrollo tecnológico muy bajo, nivel medio de migración y bajo nivel de prevalencia de VIH en mujeres.
  • Clúster 2: Alto empoderamiento, muy bajo uso de métodos anticonceptivos, nivel muy bajo de densidad estatal, nivel bajo de no desigualdad, bajo nivel de salud, nivel de desarrollo tecnológico medio, nivel de migración bajo y nivel medio de prevalencia de VIH en mujeres.
  • Clúster 3: Nivel de empoderamiento muy bajo, uso de métodos anticonceptivos medio, nivel medio de densidad estatal, nivel bajo de no desigualdad, nivel de salud medio, nivel de desarrollo tecnológico muy alto, muy bajo nivel de migración y muy alta prevalencia de VIH en mujeres.
  • Clúster 4: Muy alto nivel de empoderamiento, bajo uso de métodos anticonceptivos, nivel bajo de densidad estatal, nivel muy bajo de no desigualdad, nivel de salud muy bajo, nivel de desarrollo tecnológico alto, muy alto nivel de migración y alta prevalencia de VIH en mujeres.
  • Clúster 5: Nivel de empoderamiento medio, alto uso de métodos anticonceptivos, nivel alto de densidad estatal, nivel muy alto de no desigualdad, alto nivel de salud, nivel de desarrollo tecnológico muy bajo, nivel de migración alto y muy bajo nivel de prevalencia de VIH en mujeres.
Mapa de reforzamiento de las capacidades femeninas
MAPA - HIPÓTESIS 1 Y VARIABLE DEPENDIENTE

MAPA - HIPÓTESIS 1 Y VARIABLE DEPENDIENTE

Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de reforzamiento de las capacidades femeninas con las variables Empoderamiento, Metodos y VIH.

agg1H1=aggregate(cbind(Empoderamiento, Metodos, VIH )~ cluster, data=VIH1gg,FUN=mean)
names(agg1H1)=c("cluster","Empoderamiento","Metodos", "VIH")
agg1H1
##   cluster Empoderamiento    Metodos         VIH
## 1       1     -0.5199245  0.8286017 -0.38576281
## 2       2      0.6121372 -0.9741211 -0.04795972
## 3       3     -1.1506396  0.3867557  1.76496521
## 4       4      0.7138261 -0.4918387  1.32997785
## 5       5     -0.3771554  0.4258011 -0.41094831

Así, tenemos que para esta hipótesis el clúster 3 que tiene mayor prevalencia del VIH también tiene el menor valor en la variable Empoderamiento. Por lo cual, concluimos con que la India (que conforma al clúster 3) tiene bajo Empoderamiento en relación al resto de países y es uno de los países que posee un valor alto en la prevalencia del VIH en mujeres. De alguna forma, el bajo empoderamiento puede explicar la prevalencia del VIH en mujeres. Esto se comprobará en la regresión.

Mapa de calidad de vida
MAPA - HIPÓTESIS 2 Y VARIABLE DEPENDIENTE

MAPA - HIPÓTESIS 2 Y VARIABLE DEPENDIENTE

Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de calidad de vida con las variables Densidad, NoDesigualdad, Salud y VIH.

agg1H2=aggregate(cbind(Densidad, NoDesigualdad, Salud, VIH) ~ cluster, data=VIH1gg,FUN=mean)
names(agg1H2)=c("cluster","Densidad", "NoDesigualdad", "Salud", "VIH")
agg1H2
##   cluster   Densidad NoDesigualdad      Salud         VIH
## 1       1  0.9229373    -0.2039823  0.8919126 -0.38576281
## 2       2 -0.9677652    -0.1346964 -0.7791498 -0.04795972
## 3       3 -0.5093101     0.2274865 -0.5560775  1.76496521
## 4       4 -0.8298047    -1.0207457 -1.0460935  1.32997785
## 5       5  0.6318698     1.2984619  0.5075821 -0.41094831

Los países de Asia y Africa del norte que conforman el clúster 5 pintado en naranja poseen el menor puntaje en VIH y el mayor puntaje en NoDesigualdad. Intuimos que a mayor no desigualdad, menor prevalencia del VIH en mujeres. Lo comprobaremos en la regresión.

Mapa de movilización para el desarrollo
MAPA - HIPÓTESIS 3 Y VD

MAPA - HIPÓTESIS 3 Y VD

Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de movilización para el desarrollo con las variables Salud, DesarrolloTec y VIH.

agg1H3=aggregate(cbind(Migracion, DesarrolloTec, VIH) ~ cluster, data=VIH1gg,FUN=mean)
names(agg1H3)=c("cluster", "Migracion", "DesarrolloTec", "VIH")
agg1H3
##   cluster   Migracion DesarrolloTec         VIH
## 1       1  0.06770615   -0.08139526 -0.38576281
## 2       2  0.04532982    0.27843840 -0.04795972
## 3       3 -3.33240106    0.87261365  1.76496521
## 4       4  0.46698534    0.68449043  1.32997785
## 5       5  0.09043182   -0.98116850 -0.41094831

El clúster 3 tiene el puntaje más alto en VIH, en DesarrolloTecno y el menor puntaje en Migracion, aquí tenemos a la India. El clúster 5 pintado de un verde pastel para las regiones de Asia y América del Sur, y que tiene a Perú (por ejemplo), posee los puntajes más bajos tanto en VIH como en DesarrolloTecno. Ello nos dice que puede haber una relación directa entre el desarrollo tecnológico y la prevalencia de VIH en mujeres: a mayor desarrollo tecnológico mayor prevalencia de VIH. Esto tiene sentido, pues el desarrollo tecnológico produce movilidad y aumenta las redes de contacto entre las personas (lo cual puede implicar la transmisión de muchas enfermedades e infecciones, entre ellas el VIH). Lo comprobaremos en la regresión.

PARA LA SEGUNDA DATA

  • Prevalencia del VIH (variable dependiente) 2013-2017
  • Hipótesis (variables independientes) 2008-2012
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado

Creamos un subset de la data original y ponemos a los países como índice.

VIH2_d=VIH2[,c(-11)] #Eliminamos la variable categórica
row.names(VIH2_d) = VIH2_d$Pais
VIH2_d$Pais=NULL
VIH2_d = as.data.frame(scale(VIH2_d)) #Estandarizamos
VIH2gg=VIH2_d #Creamos una copia para hacer el aggregate

Pedimos las distancias como un criterio de agrupamiento.

VIH2_d=dist(VIH2_d[c(1:10)])

Con la función Kmeans separamos los casos en 5 centroides.

#Pedimos el numero de grupos:
VIH2_clus=kmeans(VIH2_d,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2_clus$cluster
##             Albania             Algeria              Angola 
##                   3                   2                   1 
##           Argentina             Armenia          Azerbaijan 
##                   3                   2                   3 
##          Bangladesh            Barbados             Belarus 
##                   5                   4                   4 
##              Belize               Benin             Bolivia 
##                   3                   1                   3 
##            Botswana        Burkina Faso             Burundi 
##                   4                   1                   4 
##            Cambodia            Cameroon                Chad 
##                   3                   1                   1 
##            Colombia             Comoros    Congo, Dem. Rep. 
##                   3                   1                   1 
##         Congo, Rep.          Costa Rica       Cote d'Ivoire 
##                   1                   3                   1 
##                Cuba  Dominican Republic             Ecuador 
##                   2                   3                   3 
##    Egypt, Arab Rep.         El Salvador   Equatorial Guinea 
##                   2                   3                   4 
##             Eritrea            Eswatini            Ethiopia 
##                   1                   5                   1 
##               Gabon         Gambia, The             Georgia 
##                   3                   1                   3 
##               Ghana           Guatemala              Guinea 
##                   1                   3                   1 
##       Guinea-Bissau              Guyana               Haiti 
##                   1                   3                   1 
##            Honduras               India           Indonesia 
##                   3                   5                   3 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   2                   3                   1 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   3                   1                   2 
##             Lesotho          Madagascar              Malawi 
##                   4                   1                   1 
##                Mali          Mauritania              Mexico 
##                   1                   1                   3 
##             Moldova            Mongolia             Morocco 
##                   3                   3                   3 
##          Mozambique             Myanmar               Nepal 
##                   4                   3                   1 
##           Nicaragua               Niger             Nigeria 
##                   3                   1                   1 
##            Pakistan              Panama            Paraguay 
##                   2                   3                   3 
##                Peru         Philippines              Rwanda 
##                   3                   3                   1 
##             Senegal              Serbia        Sierra Leone 
##                   1                   2                   4 
##         South Sudan               Sudan            Suriname 
##                   4                   1                   3 
##          Tajikistan            Tanzania            Thailand 
##                   2                   1                   3 
##                Togo Trinidad and Tobago             Tunisia 
##                   1                   3                   3 
##              Uganda             Ukraine             Vietnam 
##                   1                   2                   3 
##            Zimbabwe 
##                   1
table(VIH2_clus$cluster)
## 
##  1  2  3  4  5 
## 32 10 34  9  3
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2=as.data.frame(VIH2_clus$cluster)
grupos2
##                     VIH2_clus$cluster
## Albania                             3
## Algeria                             2
## Angola                              1
## Argentina                           3
## Armenia                             2
## Azerbaijan                          3
## Bangladesh                          5
## Barbados                            4
## Belarus                             4
## Belize                              3
## Benin                               1
## Bolivia                             3
## Botswana                            4
## Burkina Faso                        1
## Burundi                             4
## Cambodia                            3
## Cameroon                            1
## Chad                                1
## Colombia                            3
## Comoros                             1
## Congo, Dem. Rep.                    1
## Congo, Rep.                         1
## Costa Rica                          3
## Cote d'Ivoire                       1
## Cuba                                2
## Dominican Republic                  3
## Ecuador                             3
## Egypt, Arab Rep.                    2
## El Salvador                         3
## Equatorial Guinea                   4
## Eritrea                             1
## Eswatini                            5
## Ethiopia                            1
## Gabon                               3
## Gambia, The                         1
## Georgia                             3
## Ghana                               1
## Guatemala                           3
## Guinea                              1
## Guinea-Bissau                       1
## Guyana                              3
## Haiti                               1
## Honduras                            3
## India                               5
## Indonesia                           3
## Iran, Islamic Rep.                  2
## Kazakhstan                          3
## Kenya                               1
## Kyrgyz Republic                     3
## Lao PDR                             1
## Lebanon                             2
## Lesotho                             4
## Madagascar                          1
## Malawi                              1
## Mali                                1
## Mauritania                          1
## Mexico                              3
## Moldova                             3
## Mongolia                            3
## Morocco                             3
## Mozambique                          4
## Myanmar                             3
## Nepal                               1
## Nicaragua                           3
## Niger                               1
## Nigeria                             1
## Pakistan                            2
## Panama                              3
## Paraguay                            3
## Peru                                3
## Philippines                         3
## Rwanda                              1
## Senegal                             1
## Serbia                              2
## Sierra Leone                        4
## South Sudan                         4
## Sudan                               1
## Suriname                            3
## Tajikistan                          2
## Tanzania                            1
## Thailand                            3
## Togo                                1
## Trinidad and Tobago                 3
## Tunisia                             3
## Uganda                              1
## Ukraine                             2
## Vietnam                             3
## Zimbabwe                            1
names(grupos2)='cluster'
grupos2$NAME=row.names(grupos2)
head(grupos2)
##            cluster       NAME
## Albania          3    Albania
## Algeria          2    Algeria
## Angola           1     Angola
## Argentina        3  Argentina
## Armenia          2    Armenia
## Azerbaijan       3 Azerbaijan

Para poder apreciar visualmente qué países se encuentran dentro de los clusters generados procedemos a realizar mapas.

Mapa con todas las variables
MAPA2 DE TODAS LAS VARIABLES

MAPA2 DE TODAS LAS VARIABLES

Para ver las características de cada grupo generado por el análisis de clústers, empleamos la función aggregate. De acuerdo a ello tenemos que el clúster 1 (color rojo oscuro), en el que se encuentran países de África, tienen el mayor puntaje en la variable Empoderamiento, y los menores valores en Metodos y Salud. El clúster 2 (color guinda), que abarca a algunos países de África del norte, Europa y Asia, tiene el mayor puntaje en Densidad y NoDesigualdad y tiene los peores puntajes en Empoderamiento y Desarrollo Tecnologico. El clúster 3 (color palo rosa) donde están los países de Centroamérica, América del Sur y Asia tiene altos puntajes en Metodos y Salud y el menor puntaje en VIH con lo cual parece relevante para la la variable dependiente. El clúster 4 pintado de rojo para algunos países del sur de África y Europa tiene los mayores puntajes en las variables Desarrollo Tecnologico y Migracion, y el menor puntaje en Densidad y NoDesigualdad. Finalmente el clúster 5 (que incluye a la India) tiene el mayor puntaje en VIH y el menor puntaje en migración.

VIH2gg=merge(VIH2gg, grupos2[-2], by=0)
row.names(VIH2gg) = VIH2gg$Row.names
VIH2gg=VIH2gg[-1]
head(VIH2gg)
##            Empoderamiento    Metodos   Densidad DesarrolloTec
## Albania        -0.3593492  1.0896776  1.0926545   -0.81028707
## Algeria        -2.3901891  0.5068520  0.7987106   -0.60553322
## Angola          1.5544542 -1.1546359 -0.8061785   -0.34626136
## Argentina      -0.2947989  0.4851048  1.1612518    1.14908096
## Armenia        -0.1758998  0.4633575  1.1176907   -0.92971102
## Azerbaijan      0.4815726  0.4633575  1.0775522   -0.08112159
##            NoDesigualdad       Salud  Migracion        ODA       Women
## Albania        1.4499741  0.69836064 0.13288761 -0.3767134 -0.53049129
## Algeria        1.7181831  0.97895567 0.02155436 -0.8767881 -0.79896570
## Angola        -0.4133722 -1.10038647 0.53661832 -0.8458191  0.61733827
## Argentina     -0.4528978  2.37118754 0.40857939 -0.8966298  0.62830015
## Armenia        1.4866764 -0.03474303 0.27336366 -0.2582459  2.53020104
## Azerbaijan     0.2182703 -0.02828814 0.34156903 -0.8188119  0.05464474
##                    VIH cluster
## Albania    -0.39207104       3
## Algeria    -0.39207104       2
## Angola     -0.08749358       1
## Argentina  -0.39207104       3
## Armenia    -0.39207104       2
## Azerbaijan -0.39207104       3
agg2=aggregate(cbind(Empoderamiento, Metodos, Densidad, NoDesigualdad, Salud, DesarrolloTec, Migracion, VIH)~ cluster, data=VIH2gg,FUN=mean)
names(agg2)=c("cluster","Empoderamiento", "Metodos", "Densidad", "NoDesigualdad", "Salud", "DesarrolloTec", "Migracion", "VIH")
agg2
##   cluster Empoderamiento    Metodos   Densidad NoDesigualdad      Salud
## 1       1      0.5620325 -0.8394144 -0.9303435   -0.09355822 -0.6455596
## 2       2     -1.3488770  0.5187405  0.9428077    1.17731254  0.4322509
## 3       3     -0.1491622  0.7200515  0.8032508   -0.15555364  0.6355666
## 4       4      0.4606172 -0.5254968 -0.7180808   -0.39041412 -0.4619460
## 5       5     -1.1901031  0.6405249 -0.1682950    0.00776287 -0.3721175
##   DesarrolloTec   Migracion         VIH
## 1     0.2149053  0.11044326  0.01720492
## 2    -0.5701318  0.06146149 -0.37436305
## 3    -0.4066616  0.06249828 -0.32623898
## 4     1.4951035  0.45746717  0.96475466
## 5    -0.2683632 -3.46364842  1.86746874

Podemos decir que las características de los países según los clústers son las siguientes:

  • Clúster 1: Muy alto empoderamiento, uso de métodos anticonceptivos muy bajo, nivel muy bajo de densidad estatal, nivel medio de no desigualdad, muy bajo nivel de salud, nivel de desarrollo tecnológico muy bajo, nivel alto de migración y nivel medio de prevalencia de VIH en mujeres.
  • Clúster 2: Muy bajo nivel de empoderamiento, uso de métodos anticonceptivos medio, nivel muy alto de densidad estatal, nivel muy alto de no desigualdad, alto nivel de salud, nivel de desarrollo tecnológico bajo, nivel de migración bajo y muy bajo nivel de prevalencia de VIH en mujeres.
  • Clúster 3: Nivel de empoderamiento medio, uso de métodos anticonceptivos muy alto, nivel alto de densidad estatal, nivel bajo de no desigualdad, nivel de salud muy alto, nivel de desarrollo tecnológico muy alto, nivel medio de migración y bajo nivel de prevalencia de VIH en mujeres.
  • Clúster 4: Alto nivel de empoderamiento, bajo uso de métodos anticonceptivos, nivel bajo de densidad estatal, nivel muy bajo de no desigualdad, nivel de salud bajo, nivel de desarrollo tecnológico muy alto, muy alto nivel de migración y alto nivel de prevalencia de VIH en mujeres.
  • Clúster 5: Nivel de empoderamiento bajo, bajo uso de métodos anticonceptivos, nivel medio de densidad estatal, nivel alto de no desigualdad, nivel medio de salud, nivel de desarrollo tecnológico medio, nivel de migración muy bajo y nivel muy alto de prevalencia de VIH en mujeres.
Mapa de reforzamiento de las capacidades femeninas
MAPA - HIPÓTESIS 1 Y VARIABLE DEPENDIENTE

MAPA - HIPÓTESIS 1 Y VARIABLE DEPENDIENTE

Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de reforzamiento de las capacidades femeninas con las variables Empoderamiento, Metodos y VIH.

agg2H1=aggregate(cbind(Empoderamiento, Metodos, VIH )~ cluster, data=VIH2gg,FUN=mean)
names(agg2H1)=c("cluster","Empoderamiento","Metodos", "VIH")
agg2H1
##   cluster Empoderamiento    Metodos         VIH
## 1       1      0.5620325 -0.8394144  0.01720492
## 2       2     -1.3488770  0.5187405 -0.37436305
## 3       3     -0.1491622  0.7200515 -0.32623898
## 4       4      0.4606172 -0.5254968  0.96475466
## 5       5     -1.1901031  0.6405249  1.86746874

Para esta hipotesis el clúster 1 es el que posee el mayor puntaje en la variable Empoderamiento y el peor puntaje en Metodos, estos países estan en África. El clúster 2, que contiene a algunos países de África del sur, tiene el menor puntaje en Empoderamiento y el menor puntaje en VIH. El clúster 3 tiene un puntaje alto en Metodos, aquí tenemos a la India. Finalmente el clúster 5 tiene un puntaje alto en VIH, en países de Centroamérica y de América del sur como Perú. En este segundo periodo, a diferencia del primero, vemos una relación directa entre empoderamiento y prevalencia del VIH en mujeres: a mayor empoderamiento mayor prevalencia de VIH. Esto no tiene mucho sentido; no obstante, lo comprobaremos en la hipótesis.

Mapa de calidad de vida
MAPA - HIPÓTESIS 2 Y VARIABLE DEPENDIENTE

MAPA - HIPÓTESIS 2 Y VARIABLE DEPENDIENTE

Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de calidad de vida con las variables Densidad, NoDesigualdad, Salud y VIH.

agg2H2=aggregate(cbind(Densidad, NoDesigualdad, Salud, VIH) ~cluster, data=VIH2gg,FUN=mean)
names(agg2H2)=c("cluster","Densidad", "NoDesigualdad", "Salud", "VIH")
agg2H2
##   cluster   Densidad NoDesigualdad      Salud         VIH
## 1       1 -0.9303435   -0.09355822 -0.6455596  0.01720492
## 2       2  0.9428077    1.17731254  0.4322509 -0.37436305
## 3       3  0.8032508   -0.15555364  0.6355666 -0.32623898
## 4       4 -0.7180808   -0.39041412 -0.4619460  0.96475466
## 5       5 -0.1682950    0.00776287 -0.3721175  1.86746874

El clúster 5 es el queha tenido mayor puntaje en VIH, está pintado en naranja y son países de Asia. Por otro lado, el clúster 2 pintado en amarillo tiene a países como la India y Bolivia que poseen el puntaje más alto en Densidad y los más bajos en NoDesigualdad y VIH. Al igual que en el primer periodo, la variable densidad puede explicar la prevalencia de VIH de forma negativa, a mayor densidad, menor prevalencia de VIH.

Mapa de movilización para el desarrollo
MAPA2 -HIPÓTESIS3 Y VD

MAPA2 -HIPÓTESIS3 Y VD

Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de movilización para el desarrollo con las variables Salud, DesarrolloTec y VIH.

agg2H3=aggregate(cbind(Migracion, DesarrolloTec, VIH )~ cluster, data=VIH2gg,FUN=mean)
names(agg2H3)=c("cluster", "Migracion", "DesarrolloTec", "VIH")
agg2H3
##   cluster   Migracion DesarrolloTec         VIH
## 1       1  0.11044326     0.2149053  0.01720492
## 2       2  0.06146149    -0.5701318 -0.37436305
## 3       3  0.06249828    -0.4066616 -0.32623898
## 4       4  0.45746717     1.4951035  0.96475466
## 5       5 -3.46364842    -0.2683632  1.86746874

El clúster 4 ha obtenido los puntajes más altos en DesarrolloTecno y Migracion, aquí tenemos a la India pintada de un verde chillón. El grupo que ha obtenido un mayor puntaje en VIH está en un verde pastel como Bolivia, que además ha obtenido el menor puntaje en migracion. Esto nos dice que hay una relación inversa entre migración y VIH: a menor migración mayor prevalencia de VIH. Lo pasaremos a comprobar en la regresión.

6. Análisis de regresión

PRIMERA DATA Prevalencia del VIH (variable dependiente) 2008-2012 Hipótesis (variables independientes) 2003-2007

Ahora podemos hacer la regresión para la primera data. Como la variable dependiente está en porcentaje, la convertimos a proporción dividiendola entre 100.

VIH1$VIH=VIH1$VIH/100

El modelo escogido contendrá a los índices resultantes del análisis factorial, las demás variables manifiestas que componen las hipótesis y las variables control. Se espera que a mayor reforzamiento de las capacidades femeninas (variables Empoderamiento y Metodos) exista menor prevalencia del VIH en mujeres y a mayor calidad de vida (variables Densidad, NoDesigualdad y Salud) menor prevalencia del VIH en mujeres. Con respecto a la tercera hipótesis, de movilidad para el desarrollo en la población en general, se espera que la variable Migración tenga un efecto directo sobre la variable dependiente: a mayor migración, mayor prevalencia de VIH en mujeres. Por otro lado, con respecto a la variable DesarrolloTec se espera que a mayor desarrollo tecnológico menor prevalencia de VIH en mujeres. En esta última hipótesis se espera que las variables no vayan en la misma dirección.

library(betareg)
modelo1=betareg(VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA + Women + Africa,data=VIH1)
summary(modelo1)
## 
## Call:
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + 
##     Salud + DesarrolloTec + Migracion + ODA + Women + Africa, data = VIH1)
## 
## Standardized weighted residuals 2:
##     Min      1Q  Median      3Q     Max 
## -2.4120 -0.6356 -0.0050  0.6321  3.9196 
## 
## Coefficients (mean model with logit link):
##                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    -5.93290    0.20335 -29.176  < 2e-16 ***
## Empoderamiento -0.16459    0.08228  -2.001 0.045443 *  
## Metodos         0.48347    0.15689   3.082 0.002059 ** 
## Densidad       -0.46753    0.13852  -3.375 0.000738 ***
## NoDesigualdad  -0.53010    0.09153  -5.791 6.98e-09 ***
## Salud          -1.45091    0.19841  -7.313 2.62e-13 ***
## DesarrolloTec  -0.05573    0.17983  -0.310 0.756655    
## Migracion       0.38883    0.10412   3.734 0.000188 ***
## ODA            -0.36996    0.10744  -3.444 0.000574 ***
## Women           0.29422    0.08837   3.329 0.000871 ***
## AfricaSI        0.07138    0.18483   0.386 0.699346    
## 
## Phi coefficients (precision model with identity link):
##       Estimate Std. Error z value Pr(>|z|)    
## (phi)   126.92      22.15    5.73    1e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
## 
## Type of estimator: ML (maximum likelihood)
## Log-likelihood: 352.4 on 12 Df
## Pseudo R-squared: 0.6222
## Number of iterations: 50 (BFGS) + 5 (Fisher scoring)

El summary del modelo revela que seis variables independientes (Empoderamiento, Metodos, Densidad, NoDesigualdad, Salud, DesarrolloTec y Migracion), sin contar las variables control, son estadísticamente significativas. Al tratarse de una regresión Beta, los coeficientes no son interpretables, por lo que es necesario generar los margins.

library(margins)
(modelo1M = margins(modelo1))
## Average marginal effects
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad +     NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA +     Women + Africa, data = VIH1)
##  Empoderamiento  Metodos  Densidad NoDesigualdad    Salud DesarrolloTec
##       -0.002342 0.006879 -0.006652     -0.007542 -0.02064    -0.0007929
##  Migracion       ODA    Women AfricaSI
##   0.005532 -0.005264 0.004186 0.001007
resultado = summary(modelo1M)
#salen los limites de el error 
bet=summary(modelo1M) 

library(ggplot2)
## Registered S3 methods overwritten by 'ggplot2':
##   method         from 
##   [.quosures     rlang
##   c.quosures     rlang
##   print.quosures rlang
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
ggplot(bet,aes(x=factor, y=AME)) + geom_point() + geom_errorbar(aes(ymin=lower, ymax=upper))

Los resultados del modelo muestran que la hipótesis con mayor efecto sobre la prevalencia del VIH en mujeres es la de calidad de vida (con las variables de Densidad, NoDesigualdad y Salud). Así, por cada punto adicional en la densidad estatal, la probabilidad de una disminución en la prevalencia de VIH en mujeres es de 0.7% en promedio. Luego, por cada punto adicional en la No desigualdad, la probabilidad de una disminución en la prevalencia de VIH es de 0.8% en promedio. Por último, por cada punto adicional en la salud, la probabilidad de una disminución en la prevalencia de VIH es de 2% en promedio. Además, en el caso de la variable Migración,por cada punto adicional en esta, la probabilidad de un aumento en la prevalencia de VIH es de 0.6% en promedio.

Por otro lado, la variable Empoderamiento parece tener un efecto negativo en la prevalencia de VIH (-0,2%); sin embargo la variable Uso de métodos anticonceptivos parece tener un efecto positivo en la prevalencia del VIH (0.06%). ¿Por qué sucede aquello? En la variable de Uso de métodos anticonceptivos se están considerando todos los tipos de métodos anticonceptivos, es decir, esto no incluye solo preservativos, sino también métodos como pastillas anticonceptivas, T de cobre, etc. Para evitar la transmisión de VIH, el único método anticonceptivo útil es el preservativo, por lo cual, al juntarlo con los demás métodos anticonceptivos se pierde el efecto (o en todo caso, este no se hace visible). La variable con menor efecto en la prevalencia de VIH en mujeres es la de Empoderamiento. De esta forma, en relación con las acciones individuales, se rescata que las acciones estatales y sociales son las que determinan mejor los niveles de VIH en mujeres por país de origen. Finalmente, guiandonos del gráfico de barras de error, al no existir una superposición de los intervalos en las variables significativas, los efectos son distinguibles entre sí. Observamos que las variables significativas son las únicas que no tienen un traslape con el O.

SEGUNDA DATA Prevalencia del VIH (variable dependiente) 2013-2017 Hipótesis (variables independientes) 2008-2012

Ahora podemos empezar la regresión de la segunda data. Como la variable dependiente está en porcentaje, la convertimos a proporción dividiendola entre 100.

VIH2$VIH=VIH2$VIH/100

El modelo escogido, al igual que el primer periodo, contendrá a los índices resultantes del análisis factorial, las demás variables manifiestas que componen las hipótesis y las variables control. El objetivo de realizar esta regresión es ver si las variables que antes eran significativas se siguen manteniendo o se han alterado. Si es lo último, queremos saber cuáles son las que lograron mantenerse (o cuáles se incluyeron) y qué conclusiones se puede determinar de ello.

library(betareg)
modelo2=betareg(VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA + Women + Africa,data=VIH2)
summary(modelo2)
## 
## Call:
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + 
##     Salud + DesarrolloTec + Migracion + ODA + Women + Africa, data = VIH2)
## 
## Standardized weighted residuals 2:
##     Min      1Q  Median      3Q     Max 
## -3.2018 -0.4481 -0.0119  0.5090  3.2154 
## 
## Coefficients (mean model with logit link):
##                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    -5.04927    0.27746 -18.198  < 2e-16 ***
## Empoderamiento -0.11467    0.10290  -1.114 0.265138    
## Metodos         0.20486    0.17797   1.151 0.249686    
## Densidad       -0.49370    0.18104  -2.727 0.006392 ** 
## NoDesigualdad  -0.36806    0.10158  -3.624 0.000291 ***
## Salud          -0.20423    0.20436  -0.999 0.317631    
## DesarrolloTec  -0.24710    0.34821  -0.710 0.477939    
## Migracion       0.08615    0.11453   0.752 0.451897    
## ODA            -0.11816    0.12412  -0.952 0.341140    
## Women           0.29724    0.11340   2.621 0.008761 ** 
## AfricaSI        0.15814    0.27579   0.573 0.566365    
## 
## Phi coefficients (precision model with identity link):
##       Estimate Std. Error z value Pr(>|z|)    
## (phi)    64.89      12.01   5.402  6.6e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
## 
## Type of estimator: ML (maximum likelihood)
## Log-likelihood: 329.9 on 12 Df
## Pseudo R-squared: 0.3641
## Number of iterations: 48 (BFGS) + 10 (Fisher scoring)

El summary del modelo revela que para este segundo periodo solo dos variables independientes (Densidad y NoDesigualdad) sin contar a la variable control son estadísticamente significativas. Al tratarse de una regresión Beta, los coeficientes no son interpretables, por lo que es necesario generar los margins.

library(margins)
(modelo2M = margins(modelo2))
## Average marginal effects
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad +     NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA +     Women + Africa, data = VIH2)
##  Empoderamiento  Metodos Densidad NoDesigualdad     Salud DesarrolloTec
##       -0.001387 0.002477 -0.00597      -0.00445 -0.002469     -0.002988
##  Migracion       ODA    Women AfricaSI
##   0.001042 -0.001429 0.003594 0.001897
resultado = summary(modelo2M)
#salen los limites de su error 
bet=summary(modelo2M) 

library(ggplot2)
ggplot(bet,aes(x=factor, y=AME)) + geom_point() + geom_errorbar(aes(ymin=lower, ymax=upper))

Los resultados del modelo muestran que la hipótesis que sigue teniendo mayor efecto sobre la prevalencia del VIH en mujeres es la de calidad de vida (con las variables de Densidad y NoDesigualdad). Así, por cada punto adicional en la densidad estatal, la probabilidad de una disminución en la prevalencia de VIH en mujeres es de 0.6% en promedio. Luego, por cada punto adicional en la No desigualdad, la probabilidad de una disminución en la prevalencia de VIH es de 0.5% en promedio. Guiandonos del gráfico de barras de error, al no existir una superposición de los intervalos en las variables significativas, los efectos son distinguibles entre sí. Observamos que Densidad y NoDesigualdad (además de la variable control women) son las únicas variables que no tienen un traslape con el 0, de ahí que sean las únicas significativas junto a la variable control.

Por todo ello podemos concluir con que las acciones estatales son las que siguen teniendo mayor predominancia en los niveles de VIH en mujeres (tanto en su aumento como en su disminución). En ambos periodos, las variables relacionadad al rol del Estado fueron las únicas que se mantuvieron significativas. Con esto, una vez más, se resalta la importancia del papel del Estado para el bienestar de la sociedad.

7. Anexos: códigos de conglomerados

Antes de correr los chunks de conglomerados, para que esta parte del trabajo sea replicable se deberá descargar este zip: [link] https://app.box.com/s/r7w52vsp44xmil8dwn307yf4raqoeusy

  • Si se está usando R Studio Cloud deberá subir el zip como está en su espacio de trabajo, pues el programa se encargará de descomprimirlo.
  • Si se está usando el programa R Studio, antes de colocarlo en su carpeta de trabajo deberá descomprimirlo, para posteriormente llamarlo.

Por favor no cambie el nombre del documento, de lo contrario no se podrá correr los chunks.

Primer periodo: 2008-2012
Mapa con todas las variables (incluyendo dependiente y variables control)
#Graficamos el mapa:
library(rgdal)
## Loading required package: sp
## rgdal: version: 1.4-4, (SVN revision 833)
##  Geospatial Data Abstraction Library extensions to R successfully loaded
##  Loaded GDAL runtime: GDAL 2.1.3, released 2017/20/01
##  Path to GDAL shared files: /usr/share/gdal/2.1
##  GDAL binary built with GEOS: TRUE 
##  Loaded PROJ.4 runtime: Rel. 4.9.2, 08 September 2015, [PJ_VERSION: 492]
##  Path to PROJ.4 shared files: (autodetected)
##  Linking to sp version: 1.3-1
folderMap='MapaMundo' #Nombre del archivo que contiene al mapa
fileName='world_map.shp' 
fileToRead=file.path(folderMap,fileName)

mapamundo = readOGR(fileToRead,stringsAsFactors=FALSE)
## OGR data source with driver: ESRI Shapefile 
## Source: "/cloud/project/MapaMundo/world_map.shp", layer: "world_map"
## with 246 features
## It has 11 fields
## Integer64 fields read as strings:  POP2005
plot(mapamundo, border='grey')

#Creamos el objeto final:
mapamundo_VIH1=merge(mapamundo,grupos1)
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==1,]
c2=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==2,]
c3=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==3,]
c4=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==4,]
c5=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="firebrick",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkred",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="indianred",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="red",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="tomato",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Mapa de las variables de reforzamiento de las capacidades femeninas

Creamos una nueva subset solo con las variables Empoderamiento, Metodos y VIH. Pedimos las distancias entre los casos según las variables independientes.

set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH1_H1=VIH1gg[c(1,2,10)]
VIH1_H1=dist(VIH1_H1[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento

Con la función Kmeans separamos en cinco centroides.

#Pedimos el numero de grupos:
VIH1H_clus=kmeans(VIH1_H1,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1H_clus$cluster
##             Albania             Algeria           Argentina 
##                   1                   3                   1 
##             Armenia          Azerbaijan          Bangladesh 
##                   5                   5                   3 
##             Belarus              Belize               Benin 
##                   1                   5                   2 
##             Bolivia            Botswana              Brazil 
##                   5                   4                   1 
##        Burkina Faso             Burundi          Cabo Verde 
##                   2                   2                   1 
##            Cambodia            Cameroon                Chad 
##                   2                   2                   2 
##            Colombia    Congo, Dem. Rep.         Congo, Rep. 
##                   1                   2                   5 
##          Costa Rica       Cote d'Ivoire                Cuba 
##                   3                   2                   3 
##  Dominican Republic             Ecuador    Egypt, Arab Rep. 
##                   1                   1                   3 
##         El Salvador            Eswatini            Ethiopia 
##                   1                   4                   2 
##             Georgia               Ghana              Guinea 
##                   5                   2                   2 
##       Guinea-Bissau              Guyana               Haiti 
##                   2                   5                   5 
##            Honduras               India           Indonesia 
##                   1                   3                   1 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   3                   5                   5 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   5                   2                   3 
##             Lesotho             Liberia          Madagascar 
##                   4                   2                   2 
##              Malawi            Malaysia                Mali 
##                   2                   5                   2 
##          Mauritania              Mexico             Moldova 
##                   2                   1                   1 
##            Mongolia          Montenegro             Morocco 
##                   1                   5                   3 
##          Mozambique             Myanmar             Namibia 
##                   2                   5                   5 
##               Nepal           Nicaragua               Niger 
##                   2                   1                   2 
##             Nigeria            Pakistan    Papua New Guinea 
##                   2                   3                   5 
##            Paraguay                Peru         Philippines 
##                   1                   1                   5 
##              Rwanda             Senegal              Serbia 
##                   2                   2                   5 
##        Sierra Leone        South Africa           Sri Lanka 
##                   2                   4                   1 
##               Sudan            Suriname          Tajikistan 
##                   2                   5                   5 
##            Tanzania            Thailand                Togo 
##                   2                   1                   2 
## Trinidad and Tobago             Tunisia              Uganda 
##                   5                   3                   2 
##             Ukraine             Uruguay          Uzbekistan 
##                   1                   1                   1 
##             Vietnam              Zambia            Zimbabwe 
##                   1                   2                   2
table(VIH1H_clus$cluster)
## 
##  1  2  3  4  5 
## 23 31 11  4 21

Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.

#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1H=as.data.frame(VIH1H_clus$cluster)
grupos1H
##                     VIH1H_clus$cluster
## Albania                              1
## Algeria                              3
## Argentina                            1
## Armenia                              5
## Azerbaijan                           5
## Bangladesh                           3
## Belarus                              1
## Belize                               5
## Benin                                2
## Bolivia                              5
## Botswana                             4
## Brazil                               1
## Burkina Faso                         2
## Burundi                              2
## Cabo Verde                           1
## Cambodia                             2
## Cameroon                             2
## Chad                                 2
## Colombia                             1
## Congo, Dem. Rep.                     2
## Congo, Rep.                          5
## Costa Rica                           3
## Cote d'Ivoire                        2
## Cuba                                 3
## Dominican Republic                   1
## Ecuador                              1
## Egypt, Arab Rep.                     3
## El Salvador                          1
## Eswatini                             4
## Ethiopia                             2
## Georgia                              5
## Ghana                                2
## Guinea                               2
## Guinea-Bissau                        2
## Guyana                               5
## Haiti                                5
## Honduras                             1
## India                                3
## Indonesia                            1
## Iran, Islamic Rep.                   3
## Kazakhstan                           5
## Kenya                                5
## Kyrgyz Republic                      5
## Lao PDR                              2
## Lebanon                              3
## Lesotho                              4
## Liberia                              2
## Madagascar                           2
## Malawi                               2
## Malaysia                             5
## Mali                                 2
## Mauritania                           2
## Mexico                               1
## Moldova                              1
## Mongolia                             1
## Montenegro                           5
## Morocco                              3
## Mozambique                           2
## Myanmar                              5
## Namibia                              5
## Nepal                                2
## Nicaragua                            1
## Niger                                2
## Nigeria                              2
## Pakistan                             3
## Papua New Guinea                     5
## Paraguay                             1
## Peru                                 1
## Philippines                          5
## Rwanda                               2
## Senegal                              2
## Serbia                               5
## Sierra Leone                         2
## South Africa                         4
## Sri Lanka                            1
## Sudan                                2
## Suriname                             5
## Tajikistan                           5
## Tanzania                             2
## Thailand                             1
## Togo                                 2
## Trinidad and Tobago                  5
## Tunisia                              3
## Uganda                               2
## Ukraine                              1
## Uruguay                              1
## Uzbekistan                           1
## Vietnam                              1
## Zambia                               2
## Zimbabwe                             2
names(grupos1H)='cluster'
grupos1H$NAME=row.names(grupos1H)
head(grupos1H)
##            cluster       NAME
## Albania          1    Albania
## Algeria          3    Algeria
## Argentina        1  Argentina
## Armenia          5    Armenia
## Azerbaijan       5 Azerbaijan
## Bangladesh       3 Bangladesh
#Creamos el objeto final:
mapamundo_VIH1H=merge(mapamundo,grupos1H)

Creamos una mapa interactivo:

#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==1,]
c2=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==2,]
c3=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==3,]
c4=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==4,]
c5=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="darkmagenta",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkorchid",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="deeppink",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="hotpink",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="mediumvioletred",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Mapa de las variables de calidad de vida

Creamos una nueva subset solo con las variables Densidad, NoDesigualdad, Salud y VIH. Pedimos las distancias entre los casos según las variables independientes.

set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH1_H2=VIH1gg[c(3,5,6,10)]
VIH1_H2=dist(VIH1_H2[c(1:4)]) #Pedimos las distancias como un criterio de agrupamiento

Con la función Kmeans separamos en cinco centroides.

#Pedimos el numero de grupos:
VIH1H2_clus=kmeans(VIH1_H2,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1H2_clus$cluster
##             Albania             Algeria           Argentina 
##                   5                   5                   1 
##             Armenia          Azerbaijan          Bangladesh 
##                   5                   5                   2 
##             Belarus              Belize               Benin 
##                   5                   3                   2 
##             Bolivia            Botswana              Brazil 
##                   3                   4                   1 
##        Burkina Faso             Burundi          Cabo Verde 
##                   2                   2                   3 
##            Cambodia            Cameroon                Chad 
##                   3                   2                   2 
##            Colombia    Congo, Dem. Rep.         Congo, Rep. 
##                   1                   2                   2 
##          Costa Rica       Cote d'Ivoire                Cuba 
##                   1                   2                   5 
##  Dominican Republic             Ecuador    Egypt, Arab Rep. 
##                   1                   1                   5 
##         El Salvador            Eswatini            Ethiopia 
##                   1                   4                   2 
##             Georgia               Ghana              Guinea 
##                   5                   3                   2 
##       Guinea-Bissau              Guyana               Haiti 
##                   2                   3                   2 
##            Honduras               India           Indonesia 
##                   1                   3                   3 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   3                   5                   2 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   5                   3                   5 
##             Lesotho             Liberia          Madagascar 
##                   4                   2                   2 
##              Malawi            Malaysia                Mali 
##                   2                   5                   2 
##          Mauritania              Mexico             Moldova 
##                   2                   1                   5 
##            Mongolia          Montenegro             Morocco 
##                   5                   5                   3 
##          Mozambique             Myanmar             Namibia 
##                   2                   3                   4 
##               Nepal           Nicaragua               Niger 
##                   3                   3                   2 
##             Nigeria            Pakistan    Papua New Guinea 
##                   2                   5                   2 
##            Paraguay                Peru         Philippines 
##                   1                   3                   3 
##              Rwanda             Senegal              Serbia 
##                   2                   3                   1 
##        Sierra Leone        South Africa           Sri Lanka 
##                   2                   4                   3 
##               Sudan            Suriname          Tajikistan 
##                   2                   1                   5 
##            Tanzania            Thailand                Togo 
##                   2                   1                   2 
## Trinidad and Tobago             Tunisia              Uganda 
##                   5                   5                   2 
##             Ukraine             Uruguay          Uzbekistan 
##                   5                   1                   5 
##             Vietnam              Zambia            Zimbabwe 
##                   5                   2                   4
table(VIH1H2_clus$cluster)
## 
##  1  2  3  4  5 
## 14 30 18  6 22

Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.

#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1H2=as.data.frame(VIH1H2_clus$cluster)
grupos1H2
##                     VIH1H2_clus$cluster
## Albania                               5
## Algeria                               5
## Argentina                             1
## Armenia                               5
## Azerbaijan                            5
## Bangladesh                            2
## Belarus                               5
## Belize                                3
## Benin                                 2
## Bolivia                               3
## Botswana                              4
## Brazil                                1
## Burkina Faso                          2
## Burundi                               2
## Cabo Verde                            3
## Cambodia                              3
## Cameroon                              2
## Chad                                  2
## Colombia                              1
## Congo, Dem. Rep.                      2
## Congo, Rep.                           2
## Costa Rica                            1
## Cote d'Ivoire                         2
## Cuba                                  5
## Dominican Republic                    1
## Ecuador                               1
## Egypt, Arab Rep.                      5
## El Salvador                           1
## Eswatini                              4
## Ethiopia                              2
## Georgia                               5
## Ghana                                 3
## Guinea                                2
## Guinea-Bissau                         2
## Guyana                                3
## Haiti                                 2
## Honduras                              1
## India                                 3
## Indonesia                             3
## Iran, Islamic Rep.                    3
## Kazakhstan                            5
## Kenya                                 2
## Kyrgyz Republic                       5
## Lao PDR                               3
## Lebanon                               5
## Lesotho                               4
## Liberia                               2
## Madagascar                            2
## Malawi                                2
## Malaysia                              5
## Mali                                  2
## Mauritania                            2
## Mexico                                1
## Moldova                               5
## Mongolia                              5
## Montenegro                            5
## Morocco                               3
## Mozambique                            2
## Myanmar                               3
## Namibia                               4
## Nepal                                 3
## Nicaragua                             3
## Niger                                 2
## Nigeria                               2
## Pakistan                              5
## Papua New Guinea                      2
## Paraguay                              1
## Peru                                  3
## Philippines                           3
## Rwanda                                2
## Senegal                               3
## Serbia                                1
## Sierra Leone                          2
## South Africa                          4
## Sri Lanka                             3
## Sudan                                 2
## Suriname                              1
## Tajikistan                            5
## Tanzania                              2
## Thailand                              1
## Togo                                  2
## Trinidad and Tobago                   5
## Tunisia                               5
## Uganda                                2
## Ukraine                               5
## Uruguay                               1
## Uzbekistan                            5
## Vietnam                               5
## Zambia                                2
## Zimbabwe                              4
names(grupos1H2)='cluster'
grupos1H2$NAME=row.names(grupos1H2)
head(grupos1H2)
##            cluster       NAME
## Albania          5    Albania
## Algeria          5    Algeria
## Argentina        1  Argentina
## Armenia          5    Armenia
## Azerbaijan       5 Azerbaijan
## Bangladesh       2 Bangladesh
#Creamos el objeto final:
mapamundo_VIH1H2=merge(mapamundo,grupos1H2)

Creamos un mapa interactivo:

#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==1,]
c2=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==2,]
c3=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==3,]
c4=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==4,]
c5=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="chocolate",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="gold",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="sienna",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="peru",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="orange",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Mapa de las variables de movilización para el desarrollo

Creamos una nueva subset solo con las variables DesarrolloTec, Migracion y VIH. Pedimos las distancias entre los casos según las variables independientes.

set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH1_H3=VIH1gg[c(4,7,10)]
VIH1_H3=dist(VIH1_H3[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento

Con la función Kmeans separamos en cinco centroides.

#Pedimos el numero de grupos:
VIH1H3_clus=kmeans(VIH1_H3,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1H3_clus$cluster
##             Albania             Algeria           Argentina 
##                   5                   5                   1 
##             Armenia          Azerbaijan          Bangladesh 
##                   5                   5                   3 
##             Belarus              Belize               Benin 
##                   1                   2                   2 
##             Bolivia            Botswana              Brazil 
##                   2                   4                   2 
##        Burkina Faso             Burundi          Cabo Verde 
##                   5                   1                   2 
##            Cambodia            Cameroon                Chad 
##                   2                   2                   2 
##            Colombia    Congo, Dem. Rep.         Congo, Rep. 
##                   5                   1                   2 
##          Costa Rica       Cote d'Ivoire                Cuba 
##                   1                   2                   1 
##  Dominican Republic             Ecuador    Egypt, Arab Rep. 
##                   2                   5                   5 
##         El Salvador            Eswatini            Ethiopia 
##                   5                   3                   5 
##             Georgia               Ghana              Guinea 
##                   5                   5                   2 
##       Guinea-Bissau              Guyana               Haiti 
##                   2                   2                   2 
##            Honduras               India           Indonesia 
##                   5                   3                   2 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   1                   5                   1 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   5                   2                   2 
##             Lesotho             Liberia          Madagascar 
##                   4                   2                   1 
##              Malawi            Malaysia                Mali 
##                   2                   1                   5 
##          Mauritania              Mexico             Moldova 
##                   2                   1                   5 
##            Mongolia          Montenegro             Morocco 
##                   5                   2                   1 
##          Mozambique             Myanmar             Namibia 
##                   4                   4                   2 
##               Nepal           Nicaragua               Niger 
##                   2                   2                   2 
##             Nigeria            Pakistan    Papua New Guinea 
##                   5                   4                   2 
##            Paraguay                Peru         Philippines 
##                   5                   5                   4 
##              Rwanda             Senegal              Serbia 
##                   2                   2                   1 
##        Sierra Leone        South Africa           Sri Lanka 
##                   2                   4                   5 
##               Sudan            Suriname          Tajikistan 
##                   1                   2                   5 
##            Tanzania            Thailand                Togo 
##                   1                   5                   2 
## Trinidad and Tobago             Tunisia              Uganda 
##                   5                   1                   1 
##             Ukraine             Uruguay          Uzbekistan 
##                   2                   1                   5 
##             Vietnam              Zambia            Zimbabwe 
##                   2                   4                   4
table(VIH1H3_clus$cluster)
## 
##  1  2  3  4  5 
## 18 34  3  9 26

Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.

#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1H3=as.data.frame(VIH1H3_clus$cluster)
grupos1H3
##                     VIH1H3_clus$cluster
## Albania                               5
## Algeria                               5
## Argentina                             1
## Armenia                               5
## Azerbaijan                            5
## Bangladesh                            3
## Belarus                               1
## Belize                                2
## Benin                                 2
## Bolivia                               2
## Botswana                              4
## Brazil                                2
## Burkina Faso                          5
## Burundi                               1
## Cabo Verde                            2
## Cambodia                              2
## Cameroon                              2
## Chad                                  2
## Colombia                              5
## Congo, Dem. Rep.                      1
## Congo, Rep.                           2
## Costa Rica                            1
## Cote d'Ivoire                         2
## Cuba                                  1
## Dominican Republic                    2
## Ecuador                               5
## Egypt, Arab Rep.                      5
## El Salvador                           5
## Eswatini                              3
## Ethiopia                              5
## Georgia                               5
## Ghana                                 5
## Guinea                                2
## Guinea-Bissau                         2
## Guyana                                2
## Haiti                                 2
## Honduras                              5
## India                                 3
## Indonesia                             2
## Iran, Islamic Rep.                    1
## Kazakhstan                            5
## Kenya                                 1
## Kyrgyz Republic                       5
## Lao PDR                               2
## Lebanon                               2
## Lesotho                               4
## Liberia                               2
## Madagascar                            1
## Malawi                                2
## Malaysia                              1
## Mali                                  5
## Mauritania                            2
## Mexico                                1
## Moldova                               5
## Mongolia                              5
## Montenegro                            2
## Morocco                               1
## Mozambique                            4
## Myanmar                               4
## Namibia                               2
## Nepal                                 2
## Nicaragua                             2
## Niger                                 2
## Nigeria                               5
## Pakistan                              4
## Papua New Guinea                      2
## Paraguay                              5
## Peru                                  5
## Philippines                           4
## Rwanda                                2
## Senegal                               2
## Serbia                                1
## Sierra Leone                          2
## South Africa                          4
## Sri Lanka                             5
## Sudan                                 1
## Suriname                              2
## Tajikistan                            5
## Tanzania                              1
## Thailand                              5
## Togo                                  2
## Trinidad and Tobago                   5
## Tunisia                               1
## Uganda                                1
## Ukraine                               2
## Uruguay                               1
## Uzbekistan                            5
## Vietnam                               2
## Zambia                                4
## Zimbabwe                              4
names(grupos1H3)='cluster'
grupos1H3$NAME=row.names(grupos1H3)
head(grupos1H3)
##            cluster       NAME
## Albania          5    Albania
## Algeria          5    Algeria
## Argentina        1  Argentina
## Armenia          5    Armenia
## Azerbaijan       5 Azerbaijan
## Bangladesh       3 Bangladesh
#Creamos el objeto final:
mapamundo_VIH1H3=merge(mapamundo,grupos1H3)

Creamos un mapa interactivo:

#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==1,]
c2=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==2,]
c3=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==3,]
c4=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==4,]
c5=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="darkgreen",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="yellowgreen",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="forestgreen",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="limegreen",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="lightgreen",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Segundo periodo: 2013-2014
Mapa con todas las variables (incluyendo la dependiente y las variables control)
#Creamos el objeto final:
mapamundo_VIH2=merge(mapamundo,grupos2)
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==1,]
c2=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==2,]
c3=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==3,]
c4=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==4,]
c5=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="firebrick",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkred",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="indianred",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="red",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="tomato",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Mapa de las variables de reforzamiento de las capacidades femeninas

Creamos una nueva subset solo con las variables Empoderamiento, Metodos y VIH. Pedimos las distancias entre los casos según las variables independientes.

set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH2_H1=VIH2gg[c(1,2,10)]
VIH2_H1=dist(VIH2_H1[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento

Con la función Kmeans separamos en cinco centroides.

#Pedimos el numero de grupos:
VIH2H_clus=kmeans(VIH2_H1,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2H_clus$cluster
##             Albania             Algeria              Angola 
##                   5                   3                   1 
##           Argentina             Armenia          Azerbaijan 
##                   4                   4                   4 
##          Bangladesh            Barbados             Belarus 
##                   3                   4                   4 
##              Belize               Benin             Bolivia 
##                   4                   1                   4 
##            Botswana        Burkina Faso             Burundi 
##                   2                   1                   1 
##            Cambodia            Cameroon                Chad 
##                   1                   1                   1 
##            Colombia             Comoros    Congo, Dem. Rep. 
##                   5                   1                   1 
##         Congo, Rep.          Costa Rica       Cote d'Ivoire 
##                   4                   5                   1 
##                Cuba  Dominican Republic             Ecuador 
##                   5                   5                   5 
##    Egypt, Arab Rep.         El Salvador   Equatorial Guinea 
##                   3                   5                   1 
##             Eritrea            Eswatini            Ethiopia 
##                   1                   2                   1 
##               Gabon         Gambia, The             Georgia 
##                   4                   1                   4 
##               Ghana           Guatemala              Guinea 
##                   1                   4                   1 
##       Guinea-Bissau              Guyana               Haiti 
##                   1                   4                   4 
##            Honduras               India           Indonesia 
##                   5                   3                   4 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   3                   4                   1 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   4                   1                   3 
##             Lesotho          Madagascar              Malawi 
##                   2                   1                   1 
##                Mali          Mauritania              Mexico 
##                   1                   3                   5 
##             Moldova            Mongolia             Morocco 
##                   5                   4                   3 
##          Mozambique             Myanmar               Nepal 
##                   1                   4                   1 
##           Nicaragua               Niger             Nigeria 
##                   5                   1                   1 
##            Pakistan              Panama            Paraguay 
##                   3                   4                   5 
##                Peru         Philippines              Rwanda 
##                   5                   4                   1 
##             Senegal              Serbia        Sierra Leone 
##                   1                   5                   1 
##         South Sudan               Sudan            Suriname 
##                   1                   3                   4 
##          Tajikistan            Tanzania            Thailand 
##                   3                   1                   5 
##                Togo Trinidad and Tobago             Tunisia 
##                   1                   4                   3 
##              Uganda             Ukraine             Vietnam 
##                   1                   5                   5 
##            Zimbabwe 
##                   1
table(VIH2H_clus$cluster)
## 
##  1  2  3  4  5 
## 34  3 12 22 17

Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.

#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2H=as.data.frame(VIH2H_clus$cluster)
grupos2H
##                     VIH2H_clus$cluster
## Albania                              5
## Algeria                              3
## Angola                               1
## Argentina                            4
## Armenia                              4
## Azerbaijan                           4
## Bangladesh                           3
## Barbados                             4
## Belarus                              4
## Belize                               4
## Benin                                1
## Bolivia                              4
## Botswana                             2
## Burkina Faso                         1
## Burundi                              1
## Cambodia                             1
## Cameroon                             1
## Chad                                 1
## Colombia                             5
## Comoros                              1
## Congo, Dem. Rep.                     1
## Congo, Rep.                          4
## Costa Rica                           5
## Cote d'Ivoire                        1
## Cuba                                 5
## Dominican Republic                   5
## Ecuador                              5
## Egypt, Arab Rep.                     3
## El Salvador                          5
## Equatorial Guinea                    1
## Eritrea                              1
## Eswatini                             2
## Ethiopia                             1
## Gabon                                4
## Gambia, The                          1
## Georgia                              4
## Ghana                                1
## Guatemala                            4
## Guinea                               1
## Guinea-Bissau                        1
## Guyana                               4
## Haiti                                4
## Honduras                             5
## India                                3
## Indonesia                            4
## Iran, Islamic Rep.                   3
## Kazakhstan                           4
## Kenya                                1
## Kyrgyz Republic                      4
## Lao PDR                              1
## Lebanon                              3
## Lesotho                              2
## Madagascar                           1
## Malawi                               1
## Mali                                 1
## Mauritania                           3
## Mexico                               5
## Moldova                              5
## Mongolia                             4
## Morocco                              3
## Mozambique                           1
## Myanmar                              4
## Nepal                                1
## Nicaragua                            5
## Niger                                1
## Nigeria                              1
## Pakistan                             3
## Panama                               4
## Paraguay                             5
## Peru                                 5
## Philippines                          4
## Rwanda                               1
## Senegal                              1
## Serbia                               5
## Sierra Leone                         1
## South Sudan                          1
## Sudan                                3
## Suriname                             4
## Tajikistan                           3
## Tanzania                             1
## Thailand                             5
## Togo                                 1
## Trinidad and Tobago                  4
## Tunisia                              3
## Uganda                               1
## Ukraine                              5
## Vietnam                              5
## Zimbabwe                             1
names(grupos2H)='cluster'
grupos2H$NAME=row.names(grupos2H)
head(grupos2H)
##            cluster       NAME
## Albania          5    Albania
## Algeria          3    Algeria
## Angola           1     Angola
## Argentina        4  Argentina
## Armenia          4    Armenia
## Azerbaijan       4 Azerbaijan
#Creamos el objeto final:
mapamundo_VIH2H=merge(mapamundo,grupos2H)

Creamos una mapa interactivo:

#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==1,]
c2=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==2,]
c3=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==3,]
c4=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==4,]
c5=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==5,]

title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="darkmagenta",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkorchid",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="deeppink",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="hotpink",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="mediumvioletred",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Mapa de las variables de calidad de vida

Creamos una nueva subset solo con las variables Densidad, NoDesigualdad, Salud y VIH. Pedimos las distancias entre los casos según las variables independientes.

set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH2_H2=VIH2gg[c(3,5,6,10)]
VIH2_H2=dist(VIH2_H2[c(1:4)]) #Pedimos las distancias como un criterio de agrupamiento

Con la función Kmeans separamos en cinco centroides.

#Pedimos el numero de grupos:
VIH2H2_clus=kmeans(VIH2_H2,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2H2_clus$cluster
##             Albania             Algeria              Angola 
##                   5                   5                   1 
##           Argentina             Armenia          Azerbaijan 
##                   3                   5                   2 
##          Bangladesh            Barbados             Belarus 
##                   2                   3                   5 
##              Belize               Benin             Bolivia 
##                   2                   1                   2 
##            Botswana        Burkina Faso             Burundi 
##                   4                   1                   1 
##            Cambodia            Cameroon                Chad 
##                   3                   2                   1 
##            Colombia             Comoros    Congo, Dem. Rep. 
##                   3                   2                   1 
##         Congo, Rep.          Costa Rica       Cote d'Ivoire 
##                   1                   3                   1 
##                Cuba  Dominican Republic             Ecuador 
##                   3                   3                   3 
##    Egypt, Arab Rep.         El Salvador   Equatorial Guinea 
##                   5                   3                   1 
##             Eritrea            Eswatini            Ethiopia 
##                   2                   4                   2 
##               Gabon         Gambia, The             Georgia 
##                   2                   1                   2 
##               Ghana           Guatemala              Guinea 
##                   2                   3                   1 
##       Guinea-Bissau              Guyana               Haiti 
##                   1                   3                   2 
##            Honduras               India           Indonesia 
##                   3                   2                   2 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   2                   5                   2 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   5                   2                   5 
##             Lesotho          Madagascar              Malawi 
##                   4                   1                   1 
##                Mali          Mauritania              Mexico 
##                   1                   2                   3 
##             Moldova            Mongolia             Morocco 
##                   5                   2                   2 
##          Mozambique             Myanmar               Nepal 
##                   1                   2                   2 
##           Nicaragua               Niger             Nigeria 
##                   2                   1                   1 
##            Pakistan              Panama            Paraguay 
##                   2                   3                   3 
##                Peru         Philippines              Rwanda 
##                   3                   2                   1 
##             Senegal              Serbia        Sierra Leone 
##                   2                   5                   1 
##         South Sudan               Sudan            Suriname 
##                   1                   1                   3 
##          Tajikistan            Tanzania            Thailand 
##                   5                   1                   3 
##                Togo Trinidad and Tobago             Tunisia 
##                   1                   3                   5 
##              Uganda             Ukraine             Vietnam 
##                   1                   5                   3 
##            Zimbabwe 
##                   1
table(VIH2H2_clus$cluster)
## 
##  1  2  3  4  5 
## 26 26 20  3 13

Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.

#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2H2=as.data.frame(VIH2H2_clus$cluster)
grupos2H2
##                     VIH2H2_clus$cluster
## Albania                               5
## Algeria                               5
## Angola                                1
## Argentina                             3
## Armenia                               5
## Azerbaijan                            2
## Bangladesh                            2
## Barbados                              3
## Belarus                               5
## Belize                                2
## Benin                                 1
## Bolivia                               2
## Botswana                              4
## Burkina Faso                          1
## Burundi                               1
## Cambodia                              3
## Cameroon                              2
## Chad                                  1
## Colombia                              3
## Comoros                               2
## Congo, Dem. Rep.                      1
## Congo, Rep.                           1
## Costa Rica                            3
## Cote d'Ivoire                         1
## Cuba                                  3
## Dominican Republic                    3
## Ecuador                               3
## Egypt, Arab Rep.                      5
## El Salvador                           3
## Equatorial Guinea                     1
## Eritrea                               2
## Eswatini                              4
## Ethiopia                              2
## Gabon                                 2
## Gambia, The                           1
## Georgia                               2
## Ghana                                 2
## Guatemala                             3
## Guinea                                1
## Guinea-Bissau                         1
## Guyana                                3
## Haiti                                 2
## Honduras                              3
## India                                 2
## Indonesia                             2
## Iran, Islamic Rep.                    2
## Kazakhstan                            5
## Kenya                                 2
## Kyrgyz Republic                       5
## Lao PDR                               2
## Lebanon                               5
## Lesotho                               4
## Madagascar                            1
## Malawi                                1
## Mali                                  1
## Mauritania                            2
## Mexico                                3
## Moldova                               5
## Mongolia                              2
## Morocco                               2
## Mozambique                            1
## Myanmar                               2
## Nepal                                 2
## Nicaragua                             2
## Niger                                 1
## Nigeria                               1
## Pakistan                              2
## Panama                                3
## Paraguay                              3
## Peru                                  3
## Philippines                           2
## Rwanda                                1
## Senegal                               2
## Serbia                                5
## Sierra Leone                          1
## South Sudan                           1
## Sudan                                 1
## Suriname                              3
## Tajikistan                            5
## Tanzania                              1
## Thailand                              3
## Togo                                  1
## Trinidad and Tobago                   3
## Tunisia                               5
## Uganda                                1
## Ukraine                               5
## Vietnam                               3
## Zimbabwe                              1
names(grupos2H2)='cluster'
grupos2H2$NAME=row.names(grupos2H2)
head(grupos2H2)
##            cluster       NAME
## Albania          5    Albania
## Algeria          5    Algeria
## Angola           1     Angola
## Argentina        3  Argentina
## Armenia          5    Armenia
## Azerbaijan       2 Azerbaijan
#Creamos el objeto final:
mapamundo_VIH2H2=merge(mapamundo,grupos2H2)

Creamos un mapa interactivo:

#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==1,]
c2=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==2,]
c3=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==3,]
c4=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==4,]
c5=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="chocolate",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="gold",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="sienna",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="peru",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="orange",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE)) 
Mapa de las variables de movilización para el desarrollo

Creamos una nueva subset solo con las variables DesarrolloTec, Migracion y VIH. Pedimos las distancias entre los casos según las variables independientes.

set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH2_H3=VIH2gg[c(4,7,10)]
VIH2_H3=dist(VIH2_H3[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento

Con la función Kmeans separamos en cinco centroides.

#Pedimos el numero de grupos:
VIH2H3_clus=kmeans(VIH2_H3,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2H3_clus$cluster
##             Albania             Algeria              Angola 
##                   3                   3                   3 
##           Argentina             Armenia          Azerbaijan 
##                   2                   3                   1 
##          Bangladesh            Barbados             Belarus 
##                   4                   4                   2 
##              Belize               Benin             Bolivia 
##                   3                   1                   5 
##            Botswana        Burkina Faso             Burundi 
##                   4                   1                   2 
##            Cambodia            Cameroon                Chad 
##                   1                   3                   1 
##            Colombia             Comoros    Congo, Dem. Rep. 
##                   1                   1                   1 
##         Congo, Rep.          Costa Rica       Cote d'Ivoire 
##                   3                   1                   1 
##                Cuba  Dominican Republic             Ecuador 
##                   5                   3                   3 
##    Egypt, Arab Rep.         El Salvador   Equatorial Guinea 
##                   3                   3                   3 
##             Eritrea            Eswatini            Ethiopia 
##                   1                   4                   3 
##               Gabon         Gambia, The             Georgia 
##                   5                   3                   1 
##               Ghana           Guatemala              Guinea 
##                   3                   3                   2 
##       Guinea-Bissau              Guyana               Haiti 
##                   1                   3                   3 
##            Honduras               India           Indonesia 
##                   3                   4                   5 
##  Iran, Islamic Rep.          Kazakhstan               Kenya 
##                   5                   3                   1 
##     Kyrgyz Republic             Lao PDR             Lebanon 
##                   5                   3                   2 
##             Lesotho          Madagascar              Malawi 
##                   4                   1                   2 
##                Mali          Mauritania              Mexico 
##                   2                   3                   1 
##             Moldova            Mongolia             Morocco 
##                   1                   3                   1 
##          Mozambique             Myanmar               Nepal 
##                   2                   3                   3 
##           Nicaragua               Niger             Nigeria 
##                   3                   2                   1 
##            Pakistan              Panama            Paraguay 
##                   5                   1                   5 
##                Peru         Philippines              Rwanda 
##                   3                   5                   1 
##             Senegal              Serbia        Sierra Leone 
##                   1                   2                   2 
##         South Sudan               Sudan            Suriname 
##                   2                   1                   3 
##          Tajikistan            Tanzania            Thailand 
##                   5                   1                   3 
##                Togo Trinidad and Tobago             Tunisia 
##                   1                   2                   3 
##              Uganda             Ukraine             Vietnam 
##                   1                   3                   3 
##            Zimbabwe 
##                   2
table(VIH2H3_clus$cluster)
## 
##  1  2  3  4  5 
## 26 14 32  6 10

Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.

#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2H3=as.data.frame(VIH2H3_clus$cluster)
grupos2H3
##                     VIH2H3_clus$cluster
## Albania                               3
## Algeria                               3
## Angola                                3
## Argentina                             2
## Armenia                               3
## Azerbaijan                            1
## Bangladesh                            4
## Barbados                              4
## Belarus                               2
## Belize                                3
## Benin                                 1
## Bolivia                               5
## Botswana                              4
## Burkina Faso                          1
## Burundi                               2
## Cambodia                              1
## Cameroon                              3
## Chad                                  1
## Colombia                              1
## Comoros                               1
## Congo, Dem. Rep.                      1
## Congo, Rep.                           3
## Costa Rica                            1
## Cote d'Ivoire                         1
## Cuba                                  5
## Dominican Republic                    3
## Ecuador                               3
## Egypt, Arab Rep.                      3
## El Salvador                           3
## Equatorial Guinea                     3
## Eritrea                               1
## Eswatini                              4
## Ethiopia                              3
## Gabon                                 5
## Gambia, The                           3
## Georgia                               1
## Ghana                                 3
## Guatemala                             3
## Guinea                                2
## Guinea-Bissau                         1
## Guyana                                3
## Haiti                                 3
## Honduras                              3
## India                                 4
## Indonesia                             5
## Iran, Islamic Rep.                    5
## Kazakhstan                            3
## Kenya                                 1
## Kyrgyz Republic                       5
## Lao PDR                               3
## Lebanon                               2
## Lesotho                               4
## Madagascar                            1
## Malawi                                2
## Mali                                  2
## Mauritania                            3
## Mexico                                1
## Moldova                               1
## Mongolia                              3
## Morocco                               1
## Mozambique                            2
## Myanmar                               3
## Nepal                                 3
## Nicaragua                             3
## Niger                                 2
## Nigeria                               1
## Pakistan                              5
## Panama                                1
## Paraguay                              5
## Peru                                  3
## Philippines                           5
## Rwanda                                1
## Senegal                               1
## Serbia                                2
## Sierra Leone                          2
## South Sudan                           2
## Sudan                                 1
## Suriname                              3
## Tajikistan                            5
## Tanzania                              1
## Thailand                              3
## Togo                                  1
## Trinidad and Tobago                   2
## Tunisia                               3
## Uganda                                1
## Ukraine                               3
## Vietnam                               3
## Zimbabwe                              2
names(grupos2H3)='cluster'
grupos2H3$NAME=row.names(grupos2H3)
head(grupos2H3)
##            cluster       NAME
## Albania          3    Albania
## Algeria          3    Algeria
## Angola           3     Angola
## Argentina        2  Argentina
## Armenia          3    Armenia
## Azerbaijan       1 Azerbaijan
#Creamos el objeto final:
mapamundo_VIH2H3=merge(mapamundo,grupos2H3)

Creamos un mapa interactivo:

#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)

#newMaps!
c1=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==1,]
c2=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==2,]
c3=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==3,]
c4=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==4,]
c5=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==5,]


title="Clusters"

# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron") 

layer1= base %>%
        addPolygons(data=c1,color="darkgreen",fillOpacity = 1,stroke = F,
                    group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="yellowgreen",fillOpacity = 1,stroke = F,
                              group = "2")

layer_123= layer_12%>%addPolygons(data=c3,color="forestgreen",fillOpacity = 1,stroke = F,
                              group = "3")

layer_1234= layer_123%>%addPolygons(data=c4,color="limegreen",fillOpacity = 1,stroke = F,
                              group = "4")

layer_12345= layer_1234%>%addPolygons(data=c5,color="lightgreen",fillOpacity = 1,stroke = F,
                              group = "5")
layer_12345
layer_12345%>% addLayersControl(
        overlayGroups = c("1", "2","3","4","5"),
        options = layersControlOptions(collapsed = FALSE))