Índice
El tema de investigación del proyecto aplicativo es la prevalencia del VIH en mujeres a nivel internacional. Este tema resulta relevante debido a que el VIH/SIDA según el PNUD (2002) ha sido la principal causa de fallecimiento en África subsahariana y representa la cuarta parte de todos los casos mortales. Además, ha tenido una rápida expansión en los países del Caribe y América Central, así como en Asia y Europa Oriental. En las últimas décadas, mientras más se ha expandido el virus, afectando a una proporción importante de la población adulta, la demanda de servicios de salud y bienestar social se han incrementado. De esta forma, se ha dado pase a que los gobiernos incluyan medidas para tratar y prevenir el VIH en su agenda y política nacional. Como cada país diseñó un plan de acción diferente basado en los informes proporcionados por organismos como la ONUSIDA, tenemos países que se han enfocado en la desigualdad y pobreza, otros han priorizado un enfoque de género, mejora en la atención médica, atención a grupos vulnerables como los migrantes, entre otros. Debido a ello, la pregunta de investigación del presente trabajo busca responder sobre qué factores son los que explican la variación en la prevalencia del VIH en mujeres para los periodos 2008-2012 y 2013-2017.
A continuación se detallan las partes de la investigación: en primer lugar, procedimos con la limpeza de datas diferenciando los dos periodos que entrarán en comparación (2008-2012 y 2013-2017). En segundo lugar, realizamos el merge de las variables que iban a ser resumidas con la técnica de análisis factorial. Después de ello, juntamos los índices formados con el resto de variables y obtuvimos la data final (para ambos periodos). En tercer lugar, realizamos cuatro mapas de conglomerados o clusters por cada periodo (uno con todas las variables y los otros tres por cada hipótesis) para apreciar visualmente las diferencias entre los grupos formados de acuerdo a las distancias según las características de las variables. Finalmente, realizamos una regresión beta (por cada periodo) debido a la naturaleza de la variable dependiente para saber cuáles variables resultaban significativas y a qué conclusiones podríamos llegar con las diferencias entre ambos periodos. La idea que más se rescata es sobre el rol del Estado en temas tan importantes como la prevalencia de VIH en mujeres.
Para este primer periodo (2008-2012), trabajamos con data de la variable dependiente de los quinquenios 2008-2012 y con datas de las variables independientes y de control de los quinquenios 2003-2007.
link1="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ51CAVKCjF_48ylMXr4FJkuVOHpXlUhaGmIA44cdQeWt4cBNjfekSgrPMjZMXrZg/pub?gid=14954305&single=true&output=csv"
DataVIH=read.csv(link1, stringsAsFactors = F)
DataVIH1 = DataVIH[,c(1,53:57)]
names(DataVIH1) = c("Pais","2008","2009","2010","2011","2012")
DataVIH1$`2009` = gsub("\\,", ".", DataVIH1$`2009`)
DataVIH1$`2010` = gsub("\\,", ".", DataVIH1$`2010`)
DataVIH1$`2008` = gsub("\\,", ".", DataVIH1$`2008`)
DataVIH1$`2011` = gsub("\\,", ".", DataVIH1$`2011`)
DataVIH1$`2012` = gsub("\\,", ".", DataVIH1$`2012`)
DataVIH1[,c(2:6)]=lapply(DataVIH1[,c(2:6)],as.numeric) #volver numerico en grupo
DataVIH1 = DataVIH1[complete.cases(DataVIH1),]
row.names(DataVIH1) = NULL
DataVIH1$VIH = rowMeans(DataVIH1[,2:6])
DataVIH1 = DataVIH1[,c (1,7)]
NOTA Todas las variables independientes en esta primera data son del periodo 2003 al 2007.
link2="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ-T56gOlA6lVVHHnrqUR6bc_doAmUewuvSlG4CcNgYyeZVUbPiozpcciPpDS3SyQ/pub?gid=1993384276&single=true&output=csv"
DataAct=read.csv(link2,stringsAsFactors = F)
DataAct1 = DataAct[,c(1,48:52)]
names(DataAct1) = c("Pais","2003","2004","2005", "2006", "2007")
DataAct1$`2003` = gsub("\\,", ".", DataAct1$`2003`)
DataAct1$`2004` = gsub("\\,", ".", DataAct1$`2004`)
DataAct1$`2005` = gsub("\\,", ".", DataAct1$`2005`)
DataAct1$`2006` = gsub("\\,", ".", DataAct1$`2006`)
DataAct1$`2007` = gsub("\\,", ".", DataAct1$`2007`)
DataAct1[,c(2:6)]=lapply(DataAct1[,c(2:6)],as.numeric) #volver numerico en grupo
DataAct1 = DataAct1[complete.cases(DataAct1),]
row.names(DataAct1) = NULL
DataAct1$PoblacionActiva = rowMeans(DataAct1[,2:6])
DataAct1= DataAct1[,c (1,7)]
link3="https://docs.google.com/spreadsheets/d/e/2PACX-1vTDcvi_z6RrnoATATdOGBLj2WlKRmVxqvx2hc4lUqkMwCcF3j9BLklmz0VjjIX4vA/pub?gid=1181245938&single=true&output=csv"
DataFLM= read.csv(link3, stringsAsFactors = F)
DataFLM1 = DataFLM[,c(1,48:52)]
names(DataFLM1) = c("Pais","2003","2004","2005", "2006", "2007")
DataFLM1$`2003` = gsub("\\,", ".", DataFLM1$`2003`)
DataFLM1$`2004` = gsub("\\,", ".", DataFLM1$`2004`)
DataFLM1$`2005` = gsub("\\,", ".", DataFLM1$`2005`)
DataFLM1$`2006` = gsub("\\,", ".", DataFLM1$`2006`)
DataFLM1$`2007` = gsub("\\,", ".", DataFLM1$`2007`)
DataFLM1[,c(2:6)]=lapply(DataFLM1[,c(2:6)],as.numeric)
DataFLM1$FLM = rowMeans(DataFLM1[,2:6],na.rm = TRUE)
DataFLM1= DataFLM1[,c (1,7)]
DataFLM1 = DataFLM1[complete.cases(DataFLM1),]
row.names(DataFLM1) = NULL
link4="https://docs.google.com/spreadsheets/d/e/2PACX-1vRI-hkw-v7fdeFY_c1aS0c_DD86WJ-0k_G9Ti2lE_0_P3nGcPHagckLPhVM9SzD5g/pub?gid=932337199&single=true&output=csv"
DataMetodos= read.csv(link4, stringsAsFactors = F)
DataMetodos1 = DataMetodos[,c(1,48:52)]
names(DataMetodos1) = c("Pais","2003","2004","2005", "2006", "2007")
DataMetodos1$`2003` = gsub("\\,", ".", DataMetodos1$`2003`)
DataMetodos1$`2004` = gsub("\\,", ".", DataMetodos1$`2004`)
DataMetodos1$`2005` = gsub("\\,", ".", DataMetodos1$`2005`)
DataMetodos1$`2006` = gsub("\\,", ".", DataMetodos1$`2006`)
DataMetodos1$`2007` = gsub("\\,", ".", DataMetodos1$`2007`)
DataMetodos1[,c(2:6)]=lapply(DataMetodos1[,c(2:6)],as.numeric)
DataMetodos1$Metodos = rowMeans(DataMetodos1[,2:6],na.rm = TRUE)
DataMetodos1= DataMetodos1[,c (1,7)]
DataMetodos1 = DataMetodos1[complete.cases(DataMetodos1),]
row.names(DataMetodos1) = NULL
link5="https://docs.google.com/spreadsheets/d/e/2PACX-1vQnghOacrnZH200jpcJc-Vym7n8rrfuQlupJ470spsBTvZ0WUWvl63x2AYL1W92sw/pub?gid=1538383881&single=true&output=csv"
DataTugurios= read.csv(link5, stringsAsFactors = F)
DataTugurios1 = DataTugurios[,c(1,48:52)]
names(DataTugurios1) = c("Pais","2003","2004","2005", "2006", "2007")
DataTugurios1$`2003` = gsub("\\,", ".", DataTugurios1$`2003`)
DataTugurios1$`2004` = gsub("\\,", ".", DataTugurios1$`2004`)
DataTugurios1$`2005` = gsub("\\,", ".", DataTugurios1$`2005`)
DataTugurios1$`2006` = gsub("\\,", ".", DataTugurios1$`2006`)
DataTugurios1$`2007` = gsub("\\,", ".", DataTugurios1$`2007`)
DataTugurios1[,c(2:6)]=lapply(DataTugurios1[,c(2:6)],as.numeric)
DataTugurios1$BarriosTugurios = rowMeans(DataTugurios1[,2:6],na.rm = TRUE)
DataTugurios1= DataTugurios1[,c (1,7)]
DataTugurios1 = DataTugurios1[complete.cases(DataTugurios1),]
row.names(DataTugurios1) = NULL
link6="https://docs.google.com/spreadsheets/d/e/2PACX-1vSOdz-vUkw9_yctGztLL_PS87cCS7GoU10PiLA3ywnO8-iNXG1OBi_8OBOpZ0r3AQ/pub?gid=826191890&single=true&output=csv"
DataGini= read.csv(link6, stringsAsFactors = F)
DataGini1 = DataGini[,c(1,48:52)]
names(DataGini1) = c("Pais","2003","2004","2005", "2006", "2007")
DataGini1$`2003` = gsub("\\,", ".", DataGini1$`2003`)
DataGini1$`2004` = gsub("\\,", ".", DataGini1$`2004`)
DataGini1$`2005` = gsub("\\,", ".", DataGini1$`2005`)
DataGini1$`2006` = gsub("\\,", ".", DataGini1$`2006`)
DataGini1$`2007` = gsub("\\,", ".", DataGini1$`2007`)
DataGini1[,c(2:6)]=lapply(DataGini1[,c(2:6)],as.numeric)
DataGini1$Gini = rowMeans(DataGini1[,2:6],na.rm = TRUE)
DataGini1= DataGini1[,c (1,7)]
DataGini1= DataGini1[complete.cases(DataGini1),]
row.names(DataGini1) = NULL
link7="https://docs.google.com/spreadsheets/d/e/2PACX-1vTTojodRJwkAu-98fKnnuzUCJZE-Wj4tDFm7F2XQLDeT3CSifu-yWiHZuZv-uzL2Q/pub?gid=1142139153&single=true&output=csv"
EDU=read.csv(link7,stringsAsFactors = F)
EDU1=EDU[,c(1,48:52)]
names(EDU1)=c("Pais","2003","2004","2005","2006","2007")
EDU1$`2003`= gsub("\\,", ".",EDU1$`2003`)
EDU1$`2004`= gsub("\\,", ".",EDU1$`2004`)
EDU1$`2005`= gsub("\\,", ".",EDU1$`2005`)
EDU1$`2006`= gsub("\\,", ".",EDU1$`2006`)
EDU1$`2007`= gsub("\\,", ".",EDU1$`2007`)
EDU1[c(2:6)] = lapply(EDU1[c(2:6)], as.numeric)
EDU1$EDU = rowMeans(EDU1[,2:6],na.rm = TRUE)
EDU1= EDU1[,c (1,7)]
EDU1= EDU1[complete.cases(EDU1),]
row.names(EDU1) = NULL
link8="https://docs.google.com/spreadsheets/d/e/2PACX-1vQrlQtEYBGaf0IhPz_H9oaM8uD1UaVoR1J_xP6bYe8ZqNAVSRJiLh4DXq52KomGsQ/pub?gid=2059415238&single=true&output=csv"
ENER=read.csv(link8,stringsAsFactors = F)
ENER1=ENER[,c(1,48:52)]
names(ENER1)=c("Pais","2003","2004","2005","2006","2007")
ENER1$`2003`= gsub("\\,", ".",ENER1$`2003`)
ENER1$`2004`= gsub("\\,", ".",ENER1$`2004`)
ENER1$`2005`= gsub("\\,", ".",ENER1$`2005`)
ENER1$`2006`= gsub("\\,", ".",ENER1$`2006`)
ENER1$`2007`= gsub("\\,", ".",ENER1$`2007`)
ENER1[c(2:6)] = lapply(ENER1[c(2:6)], as.numeric)
ENER1$ENER = rowMeans(ENER1[,2:6],na.rm = TRUE)
ENER1= ENER1[,c (1,7)]
ENER1= ENER1[complete.cases(ENER1),]
row.names(ENER1) = NULL
link9="https://docs.google.com/spreadsheets/d/e/2PACX-1vQ6hJgrir9ZBg6Qo5dfwQGluWp4oZLEfSVgz-sVzHEqav1pulMwix_2jNcjxcCkjw/pub?gid=1845220649&single=true&output=csv"
GAST=read.csv(link9,stringsAsFactors = F)
GAST1=GAST[,c(1,48:52)]
names(GAST1)=c("Pais","2003","2004","2005","2006","2007")
GAST1$`2003`= gsub("\\,", ".",GAST1$`2003`)
GAST1$`2004`= gsub("\\,", ".",GAST1$`2004`)
GAST1$`2005`= gsub("\\,", ".",GAST1$`2005`)
GAST1$`2006`= gsub("\\,", ".",GAST1$`2006`)
GAST1$`2007`= gsub("\\,", ".",GAST1$`2007`)
GAST1[c(2:6)] = lapply(GAST1[c(2:6)], as.numeric)
GAST1$GAST = rowMeans(GAST1[,2:6],na.rm = TRUE)
GAST1= GAST1[,c (1,7)]
GAST1= GAST1[complete.cases(GAST1),]
row.names(GAST1) = NULL
link10="https://docs.google.com/spreadsheets/d/e/2PACX-1vTJo2T8oxMssc3utiol3H4IZDOw4jq1sNu12vGh4LUz2aZU-BTtDvkhDaESiIwCJQ/pub?gid=508597872&single=true&output=csv"
ban=read.csv(link10,stringsAsFactors = F)
ban1=ban[,c(1,48:52)]
names(ban1)=c("Pais","2003","2004","2005","2006","2007")
ban1$`2003`= gsub("\\,", ".",ban1$`2003`)
ban1$`2004`= gsub("\\,", ".",ban1$`2004`)
ban1$`2005`= gsub("\\,", ".",ban1$`2005`)
ban1$`2006`= gsub("\\,", ".",ban1$`2006`)
ban1$`2007`= gsub("\\,", ".",ban1$`2007`)
ban1[c(2:6)] = lapply(ban1[c(2:6)], as.numeric)
ban1$ban = rowMeans(ban1[,2:6],na.rm = TRUE)
ban1= ban1[,c (1,7)]
ban1= ban1[complete.cases(ban1),]
row.names(ban1) = NULL
link12="https://docs.google.com/spreadsheets/d/e/2PACX-1vQoWu6HPrX8qbiqsewwImM89BxWol-bI-b_ubT6v_hxbPG9JTxXFxaxX5nUJTm-bg/pub?gid=72965045&single=true&output=csv"
EspVida=read.csv(link12, stringsAsFactors = F)
EspVida1=EspVida[,c(1,48:52)]
names(EspVida1) = c("Pais","2003","2004","2005", "2006", "2007")
EspVida1$`2003` = gsub("\\,", ".", EspVida1$`2003`)
EspVida1$`2004` = gsub("\\,", ".", EspVida1$`2004`)
EspVida1$`2005` = gsub("\\,", ".", EspVida1$`2005`)
EspVida1$`2006` = gsub("\\,", ".", EspVida1$`2006`)
EspVida1$`2007` = gsub("\\,", ".", EspVida1$`2007`)
EspVida1[,c(2:6)]=lapply(EspVida1[,c(2:6)],as.numeric) #volver numerico en grupo
EspVida1$VidaM = rowMeans(EspVida1[,2:6], na.rm = TRUE)
EspVida1= EspVida1[,c (1,7)]
EspVida1 = EspVida1[complete.cases(EspVida1),]
row.names(EspVida1) = NULL
link13="https://docs.google.com/spreadsheets/d/e/2PACX-1vSri2T-73zRzhVczOzNqkAKmQ_qLcWrQHzuVl7QIFUE7fJRUbtKoDCeJ1zixpCjRA/pub?gid=1968467072&single=true&output=csv"
neta=read.csv(link13, stringsAsFactors = F)
migra1=neta[,c(1,52)]
names(migra1) = c("Pais","Migracion")
migra1 = migra1[complete.cases(migra1),]
row.names(migra1) = NULL
migra1[,c(2)]=as.numeric(migra1[,c(2)]) #volver numerico
link14="https://docs.google.com/spreadsheets/d/e/2PACX-1vQMbPO51JV-DhQLOOX9GnTSN7Z4hlKuFjX6Ft9QRS07q1i28GeqAsAAhdfXkNq-uA/pub?gid=1457611805&single=true&output=csv"
ODA=read.csv(link14, stringsAsFactors = F)
ODA1=ODA[,c(1,48:52)]
names(ODA1) = c("Pais","2003","2004","2005", "2006", "2007")
ODA1$`2003` = gsub("\\,", ".", ODA1$`2003`)
ODA1$`2004` = gsub("\\,", ".", ODA1$`2004`)
ODA1$`2005` = gsub("\\,", ".", ODA1$`2005`)
ODA1$`2006` = gsub("\\,", ".", ODA1$`2006`)
ODA1$`2007` = gsub("\\,", ".", ODA1$`2007`)
ODA1[,c(2:6)]=lapply(ODA1[,c(2:6)],as.numeric) #volver numerico en grupo
ODA1$ODA = rowMeans(ODA1[,2:6], na.rm = TRUE)
ODA1= ODA1[,c (1,7)]
ODA1 = ODA1[complete.cases(ODA1),]
row.names(ODA1) = NULL
link15="https://docs.google.com/spreadsheets/d/e/2PACX-1vT-0H84cFoinLuU8HZaFS1Yln8HhKYcVtaKCbcKn3iShculk-vuU3QJ888lCbUd_Q/pub?gid=1165629081&single=true&output=csv"
AFRICA=read.csv(link15, stringsAsFactors = F)
names(AFRICA)=c("Pais", "Africa")
link16="https://docs.google.com/spreadsheets/d/e/2PACX-1vTnOQNQQsmZQ1Ru-bqF5mBAlnpbxQOOH_IUuMv7XylSyOIvQ_Ij1OB64-a-pXaSgg/pub?gid=871901844&single=true&output=csv"
women=read.csv(link16, stringsAsFactors = F)
women1=women[,c(1,48:52)]
names(women1) = c("Pais","2003","2004","2005", "2006", "2007")
women1$`2003` = gsub("\\,", ".", women1$`2003`)
women1$`2004` = gsub("\\,", ".", women1$`2004`)
women1$`2005` = gsub("\\,", ".", women1$`2005`)
women1$`2006` = gsub("\\,", ".", women1$`2006`)
women1$`2007` = gsub("\\,", ".", women1$`2007`)
women1[,c(2:6)]=lapply(women1[,c(2:6)],as.numeric) #volver numerico en grupo
women1$Women = rowMeans(women1[,2:6], na.rm = TRUE)
women1= women1[,c (1,7)]
women1 = women1[complete.cases(women1),]
row.names(women1) = NULL
Para este segundo periodo (2013-2017), trabajamos con data de la variable dependiente de los quinquenios 2013-2017 y con datas de las variables independientes y de control de los quinquenios 2008-2012.
DataVIH=read.csv(link1, stringsAsFactors = F)
DataVIH2 = DataVIH[,c(1,58:62)]
names(DataVIH2) = c("Pais","2013","2014","2015", "2016", "2017")
DataVIH2$`2013` = gsub("\\,", ".", DataVIH2$`2013`)
DataVIH2$`2014` = gsub("\\,", ".", DataVIH2$`2014`)
DataVIH2$`2015` = gsub("\\,", ".", DataVIH2$`2015`)
DataVIH2$`2016` = gsub("\\,", ".", DataVIH2$`2016`)
DataVIH2$`2017` = gsub("\\,", ".", DataVIH2$`2017`)
DataVIH2[,c(2:6)]=lapply(DataVIH2[,c(2:6)],as.numeric) #volver numerico en grupo
DataVIH2 = DataVIH2[complete.cases(DataVIH2),]
row.names(DataVIH2) = NULL
DataVIH2$VIH = rowMeans(DataVIH2[,2:6])
DataVIH2 = DataVIH2[,c (1,7)]
NOTA Todas las variables independientes en esta segunda data serán del periodo 2008 hasta el 2012, y son las mismas variables independientes de la primera data pero en otro periodo.
DataAct=read.csv(link2,stringsAsFactors = F)
DataAct2 = DataAct[,c(1,53:57)]
names(DataAct2) = c("Pais","2008","2009", "2010", "2011", "2012")
DataAct2$`2008` = gsub("\\,", ".", DataAct2$`2008`)
DataAct2$`2009` = gsub("\\,", ".", DataAct2$`2009`)
DataAct2$`2010` = gsub("\\,", ".", DataAct2$`2010`)
DataAct2$`2011` = gsub("\\,", ".", DataAct2$`2011`)
DataAct2$`2012` = gsub("\\,", ".", DataAct2$`2012`)
DataAct2[,c(2:6)]=lapply(DataAct2[,c(2:6)],as.numeric) #volver numerico en grupo
DataAct2 = DataAct2[complete.cases(DataAct2),]
row.names(DataAct2) = NULL
DataAct2$PoblacionActiva = rowMeans(DataAct2[,2:6])
DataAct2= DataAct2[,c (1,7)]
DataFLM= read.csv(link3, stringsAsFactors = F)
DataFLM2 = DataFLM[,c(1,53:57)]
names(DataFLM2) = c("Pais","2008","2009","2010", "2011", "2012")
DataFLM2$`2008` = gsub("\\,", ".", DataFLM2$`2008`)
DataFLM2$`2009` = gsub("\\,", ".", DataFLM2$`2009`)
DataFLM2$`2010` = gsub("\\,", ".", DataFLM2$`2010`)
DataFLM2$`2011` = gsub("\\,", ".", DataFLM2$`2011`)
DataFLM2$`2012` = gsub("\\,", ".", DataFLM2$`2012`)
DataFLM2[,c(2:6)]=lapply(DataFLM2[,c(2:6)],as.numeric)
DataFLM2$FLM = rowMeans(DataFLM2[,2:6],na.rm = TRUE)
DataFLM2= DataFLM2[,c (1,7)]
DataFLM2 = DataFLM2[complete.cases(DataFLM2),]
row.names(DataFLM2) = NULL
DataMetodos= read.csv(link4, stringsAsFactors = F)
DataMetodos2 = DataMetodos[,c(1,53:57)]
names(DataMetodos2) = c("Pais","2008","2009","2010", "2011", "2012")
DataMetodos2$`2008` = gsub("\\,", ".", DataMetodos2$`2008`)
DataMetodos2$`2009` = gsub("\\,", ".", DataMetodos2$`2009`)
DataMetodos2$`2010` = gsub("\\,", ".", DataMetodos2$`2010`)
DataMetodos2$`2011` = gsub("\\,", ".", DataMetodos2$`2011`)
DataMetodos2$`2012` = gsub("\\,", ".", DataMetodos2$`2012`)
DataMetodos2[,c(2:6)]=lapply(DataMetodos2[,c(2:6)],as.numeric)
DataMetodos2$Metodos = rowMeans(DataMetodos2[,2:6],na.rm = TRUE)
DataMetodos2= DataMetodos2[,c (1,7)]
DataMetodos2 = DataMetodos2[complete.cases(DataMetodos2),]
row.names(DataMetodos2) = NULL
DataTugurios= read.csv(link5, stringsAsFactors = F)
DataTugurios2 = DataTugurios[,c(1,53:57)]
names(DataTugurios2) = c("Pais","2008","2009","2010", "2011", "2012")
DataTugurios2$`2008` = gsub("\\,", ".", DataTugurios2$`2008`)
DataTugurios2$`2009` = gsub("\\,", ".", DataTugurios2$`2009`)
DataTugurios2$`2010` = gsub("\\,", ".", DataTugurios2$`2010`)
DataTugurios2$`2011` = gsub("\\,", ".", DataTugurios2$`2011`)
DataTugurios2$`2012` = gsub("\\,", ".", DataTugurios2$`2012`)
DataTugurios2[,c(2:6)]=lapply(DataTugurios2[,c(2:6)],as.numeric)
DataTugurios2$BarriosTugurios= rowMeans(DataTugurios2[,2:6],na.rm = TRUE)
DataTugurios2= DataTugurios2[,c (1,7)]
DataTugurios2 = DataTugurios2[complete.cases(DataTugurios2),]
row.names(DataTugurios2) = NULL
DataGini= read.csv(link6, stringsAsFactors = F)
DataGini2 = DataGini[,c(1,53:57)]
names(DataGini2) = c("Pais","2008","2009","2010", "2011", "2012")
DataGini2$`2008` = gsub("\\,", ".", DataGini2$`2008`)
DataGini2$`2009` = gsub("\\,", ".", DataGini2$`2009`)
DataGini2$`2010` = gsub("\\,", ".", DataGini2$`2010`)
DataGini2$`2011` = gsub("\\,", ".", DataGini2$`2011`)
DataGini2$`2012` = gsub("\\,", ".", DataGini2$`2012`)
DataGini2[,c(2:6)]=lapply(DataGini2[,c(2:6)],as.numeric)
DataGini2$Gini= rowMeans(DataGini2[,2:6],na.rm = TRUE)
DataGini2= DataGini2[,c (1,7)]
DataGini2 = DataGini2[complete.cases(DataGini2),]
row.names(DataGini2) = NULL
EDU=read.csv(link7,stringsAsFactors = F)
EDU2=EDU[,c(1,53:57)]
names(EDU2)=c("Pais", "2008","2009","2010","2011","2012")
EDU2$`2008`= gsub("\\,", ".",EDU2$`2008`)
EDU2$`2009`= gsub("\\,", ".",EDU2$`2009`)
EDU2$`2010`= gsub("\\,", ".",EDU2$`2010`)
EDU2$`2011`= gsub("\\,", ".",EDU2$`2011`)
EDU2$`2012`= gsub("\\,", ".",EDU2$`2012`)
EDU2[c(2:6)] = lapply(EDU2[c(2:6)], as.numeric)
EDU2$EDU = rowMeans(EDU2[,2:6],na.rm = TRUE)
EDU2= EDU2[,c (1,7)]
EDU2= EDU2[complete.cases(EDU2),]
row.names(EDU2) = NULL
ENER=read.csv(link8,stringsAsFactors = F)
ENER2=ENER[,c(1,53:57)]
names(ENER2)=c("Pais","2008","2009","2010","2011","2012")
ENER2$`2008`= gsub("\\,", ".",ENER2$`2008`)
ENER2$`2009`= gsub("\\,", ".",ENER2$`2009`)
ENER2$`2010`= gsub("\\,", ".",ENER2$`2010`)
ENER2$`2011`= gsub("\\,", ".",ENER2$`2011`)
ENER2$`2012`= gsub("\\,", ".",ENER2$`2012`)
ENER2[c(2:6)] = lapply(ENER2[c(2:6)], as.numeric)
ENER2$ENER = rowMeans(ENER2[,2:6],na.rm = TRUE)
ENER2= ENER2[,c (1,7)]
ENER2= ENER2[complete.cases(ENER2),]
row.names(ENER2) = NULL
GAST=read.csv(link9,stringsAsFactors = F)
GAST2=GAST[,c(1,53:57)]
names(GAST2)=c("Pais","2008","2009","2010","2011","2012")
GAST2$`2008`= gsub("\\,", ".",GAST2$`2008`)
GAST2$`2009`= gsub("\\,", ".",GAST2$`2009`)
GAST2$`2010`= gsub("\\,", ".",GAST2$`2010`)
GAST2$`2011`= gsub("\\,", ".",GAST2$`2011`)
GAST2$`2012`= gsub("\\,", ".",GAST2$`2012`)
GAST2[c(2:6)] = lapply(GAST2[c(2:6)], as.numeric)
GAST2$GAST = rowMeans(GAST2[,2:6],na.rm = TRUE)
GAST2= GAST2[,c (1,7)]
GAST2= GAST2[complete.cases(GAST2),]
row.names(GAST2) = NULL
ban=read.csv(link10,stringsAsFactors = F)
ban2=ban[,c(1,53:57)]
names(ban2)=c("Pais","2008","2009","2010","2011","2012")
ban2$`2008`= gsub("\\,", ".",ban2$`2008`)
ban2$`2009`= gsub("\\,", ".",ban2$`2009`)
ban2$`2010`= gsub("\\,", ".",ban2$`2010`)
ban2$`2011`= gsub("\\,", ".",ban2$`2011`)
ban2$`2012`= gsub("\\,", ".",ban2$`2012`)
ban2[c(2:6)] = lapply(ban2[c(2:6)], as.numeric)
ban2$ban = rowMeans(ban2[,2:6],na.rm = TRUE)
ban2= ban2[,c (1,7)]
ban2= ban2[complete.cases(ban2),]
row.names(ban2) = NULL
EspVida=read.csv(link12, stringsAsFactors = F)
EspVida2=EspVida[,c(1,53:57)]
names(EspVida2) = c("Pais","2008","2009","2010","2011","2012")
EspVida2$`2008` = gsub("\\,", ".", EspVida2$`2008`)
EspVida2$`2009` = gsub("\\,", ".", EspVida2$`2009`)
EspVida2$`2010` = gsub("\\,", ".", EspVida2$`2010`)
EspVida2$`2011` = gsub("\\,", ".", EspVida2$`2011`)
EspVida2$`2012` = gsub("\\,", ".", EspVida2$`2012`)
EspVida2[,c(2:6)]=lapply(EspVida2[,c(2:6)],as.numeric) #volver numerico en grupo
EspVida2$VidaM = rowMeans(EspVida2[,2:6], na.rm = TRUE)
EspVida2= EspVida2[,c (1,7)]
EspVida2 = EspVida2[complete.cases(EspVida2),]
row.names(EspVida2) = NULL
neta=read.csv(link13, stringsAsFactors = F)
migra2=neta[,c(1,57)]
names(migra2) = c("Pais","Migracion")
migra2 = migra2[complete.cases(migra2),]
row.names(migra2) = NULL
migra2[,c(2)]=as.numeric(migra2[,c(2)]) #volver numerico
ODA=read.csv(link14, stringsAsFactors = F)
ODA2=ODA[,c(1,53:57)]
names(ODA2) = c("Pais","2008","2009","2010", "2011", "2012")
ODA2$`2008` = gsub("\\,", ".", ODA2$`2008`)
ODA2$`2009` = gsub("\\,", ".", ODA2$`2009`)
ODA2$`2010` = gsub("\\,", ".", ODA2$`2010`)
ODA2$`2011` = gsub("\\,", ".", ODA2$`2011`)
ODA2$`2012` = gsub("\\,", ".", ODA2$`2012`)
ODA2[,c(2:6)]=lapply(ODA2[,c(2:6)],as.numeric) #volver numerico en grupo
ODA2$ODA = rowMeans(ODA2[,2:6], na.rm = TRUE)
ODA2= ODA2[,c (1,7)]
ODA2 = ODA2[complete.cases(ODA2),]
row.names(ODA2) = NULL
AFRICA=read.csv(link15, stringsAsFactors = F)
names(AFRICA)=c("Pais", "Africa")
women=read.csv(link16, stringsAsFactors = F)
women2=women[,c(1,53:57)]
names(women2) = c("Pais","2008","2009","2010", "2011", "2012")
women2$`2008` = gsub("\\,", ".", women2$`2008`)
women2$`2009` = gsub("\\,", ".", women2$`2009`)
women2$`2010` = gsub("\\,", ".", women2$`2010`)
women2$`2011` = gsub("\\,", ".", women2$`2011`)
women2$`2012` = gsub("\\,", ".", women2$`2012`)
women2[,c(2:6)]=lapply(women2[,c(2:6)],as.numeric) #volver numerico en grupo
women2$Women = rowMeans(women2[,2:6], na.rm = TRUE)
women2= women2[,c (1,7)]
women2 = women2[complete.cases(women2),]
row.names(women2) = NULL
empoderamiento1=merge(DataAct1,DataFLM1,all.x=T,all.y=T)
desigualdad1=merge(DataTugurios1,DataGini1,all.x=T,all.y=T)
est1=merge(EDU1,ENER1,all.x=T,all.y=T)
estado1=merge(est1,GAST1,all.x=T,all.y=T)
densidad1=merge(estado1,ban1,all.x=T,all.y=T)
Calidad1=merge(desigualdad1,densidad1,all.x=T,all.y=T)
salud1=merge(EspVida1,antiRetrov1, all.x=T,all.y=T)
empoderamiento2=merge(DataAct2,DataFLM2,all.x=T,all.y=T)
est2=merge(DataTugurios2,EDU2,all.x=T,all.y=T)
estado2=merge(ENER2,est2,all.x=T,all.y=T)
densidad2=merge(estado2,GAST2,all.x=T,all.y=T)
Calidad2=merge(densidad2,ban2,all.x=T,all.y=T)
salud2=merge(EspVida2,antiRetrov2, all.x=T,all.y=T)
Utilizamos la técnica del análisis factorial para saber que tan apropiado es juntar las variables en varios indices. La pregunta que nos hacemos es ¿en cuantas dimensiones podemos resumir todas estas variables? Los indices actuarán como variables independientes latentes al conformar la hipótesis.
Creamos una copia de la data y ponemos a los países como índice.
empoderamiento1_x=empoderamiento1
row.names(empoderamiento1) = empoderamiento1$Pais
empoderamiento1$Pais = NULL
head(empoderamiento1)
## PoblacionActiva FLM
## Afghanistan 43.55220 NA
## Albania 48.17600 29.15748
## Algeria 12.87380 NA
## Angola 75.08880 62.67960
## Arab World 19.62438 20.61435
## Argentina 49.57260 49.55246
Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.
empoderamiento1[is.na(empoderamiento1$PoblacionActiva), "PoblacionActiva"]=mean(empoderamiento1$PoblacionActiva, na.rm=T)
empoderamiento1[is.na(empoderamiento1$FLM), "FLM"]=mean(empoderamiento1$FLM, na.rm=T)
Estandarizamos:
empoderamiento1=as.data.frame(scale(empoderamiento1[,c(1,2)]))
head(empoderamiento1)
## PoblacionActiva FLM
## Afghanistan -0.43930039 0.00000000
## Albania -0.13370714 -1.37188100
## Algeria -2.46687804 0.00000000
## Angola 1.64499686 0.96623135
## Arab World -2.02072269 -1.96774987
## Argentina -0.04140391 0.05063512
Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.
library(psych)
pearson1 = cor(empoderamiento1) #sacar la correlación de los puntajes estandarizadas
pearson1
## PoblacionActiva FLM
## PoblacionActiva 1.0000000 0.7868555
## FLM 0.7868555 1.0000000
cor.plot(pearson1,
numbers=T,
upper=FALSE,
main = "Correlation",
show.legend = FALSE) #verlo en un gráfico
KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.5.
KMO(empoderamiento1) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = empoderamiento1)
## Overall MSA = 0.5
## MSA for each item =
## PoblacionActiva FLM
## 0.5 0.5
Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial.
#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(empoderamiento1, n=nrow(empoderamiento1))
## R was not square, finding R from data
## $chisq
## [1] 231.196
##
## $p.value
## [1] 3.2698e-52
##
## $df
## [1] 1
La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.
¿Cuántos índices debería crear? El R nos sugiere 1 índice.
fa.parallel(pearson1, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(empoderamiento1)) #cuantos indices deberia formar
## Parallel analysis suggests that the number of factors = 1 and the number of components = NA
empoderamiento1 = fa(empoderamiento1,
nfactors=1,
rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
empoderamiento1$loadings
##
## Loadings:
## MR1
## PoblacionActiva 0.887
## FLM 0.887
##
## MR1
## SS loadings 1.574
## Proportion Var 0.787
Ambas variables aportan de igual modo al índice. Se logró resumir el 78.7% de los componentes PoblacionActiva y FLM.
El MR1 está compuesto por ambas variables.
fa.diagram(empoderamiento1)
Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.
#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(empoderamiento1$communalities)
## PoblacionActiva FLM
## 0.7868555 0.7868555
Ambas variables aportan de igual modo al modelo.
Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.
# mientras mas grande peor (lo que mantiene)
sort(empoderamiento1$uniquenesses)
## PoblacionActiva FLM
## 0.2131445 0.2131445
La variable que está más cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores.
sort(empoderamiento1$complexity)
## PoblacionActiva FLM
## 1 1
empoderamiento1$scores
## MR1
## Afghanistan -0.218081911
## Albania -0.747419191
## Algeria -1.224632385
## Angola 1.296292143
## Arab World -1.979997621
## Argentina 0.004582650
## Armenia -0.310238745
## Aruba 0.367840847
## Australia 0.498514225
## Austria 0.105783795
## Azerbaijan 0.302854548
## Bahamas, The 0.623402726
## Bahrain -0.853641697
## Bangladesh -1.472732756
## Barbados 0.960750286
## Belarus 0.329622731
## Belgium -0.306988194
## Belize -0.867062954
## Benin 1.580277249
## Bhutan 0.567385718
## Bolivia 0.743099218
## Bosnia and Herzegovina -1.034565215
## Botswana 0.336834077
## Brazil 0.394759215
## Brunei Darussalam 0.195202744
## Bulgaria -0.243377536
## Burkina Faso 1.389544683
## Burundi 1.045368902
## Cabo Verde 0.136991681
## Cambodia 1.808782549
## Cameroon 1.760772259
## Canada 0.819332764
## Caribbean small states 0.072862091
## Cayman Islands 1.053765461
## Central African Republic 0.509861315
## Central Europe and the Baltics -0.125440772
## Chad 0.448841779
## Channel Islands 0.001251200
## Chile -0.593441335
## China 0.546450719
## Colombia 0.227261289
## Comoros -1.114769780
## Congo, Dem. Rep. 1.415986742
## Congo, Rep. 1.166573364
## Costa Rica -0.397352481
## Cote d'Ivoire -0.061868183
## Croatia -0.336865361
## Cuba -0.959734638
## Cyprus 0.310985908
## Czech Republic 0.069977696
## Denmark 0.739197542
## Djibouti -0.037241149
## Dominican Republic -0.655151160
## Early-demographic dividend -0.865927088
## East Asia & Pacific 0.386330446
## East Asia & Pacific (excluding high income) 0.442014163
## East Asia & Pacific (IDA & IBRD countries) 0.436908551
## Ecuador 0.176081095
## Egypt, Arab Rep. -2.005033677
## El Salvador -0.264923711
## Equatorial Guinea 0.060289066
## Eritrea 0.744175438
## Estonia 0.277800750
## Eswatini -0.498152426
## Ethiopia 1.679320454
## Euro area -0.106349196
## Europe & Central Asia -0.006807899
## Europe & Central Asia (excluding high income) -0.001337942
## Europe & Central Asia (IDA & IBRD countries) -0.019361503
## European Union -0.039837413
## Fiji -0.946866807
## Finland 0.515624322
## Fragile and conflict affected situations -0.034553476
## France 0.052207623
## French Polynesia -0.151777904
## Gabon -0.271022288
## Gambia, The -0.054741891
## Georgia 0.411265626
## Germany 0.092597943
## Ghana 1.324422734
## Greece -0.488210709
## Guam 0.340044186
## Guatemala -0.378624796
## Guinea 0.416189510
## Guinea-Bissau 0.491520630
## Guyana -0.513258095
## Haiti 0.195356957
## Heavily indebted poor countries (HIPC) 0.485561463
## High income 0.149685853
## Honduras -0.589130873
## Hong Kong SAR, China 0.171289897
## Hungary -0.456806438
## IBRD only -0.023631135
## Iceland 1.693784620
## IDA & IBRD total -0.018782865
## IDA blend -0.806941564
## IDA only 0.161754091
## IDA total 0.001778396
## India -1.185765411
## Indonesia -0.162841980
## Iran, Islamic Rep. -2.112360416
## Iraq -2.536029376
## Ireland 0.238920337
## Isle of Man 0.256001551
## Israel 0.377123027
## Italy -0.782635384
## Jamaica 0.421407379
## Japan -0.072704909
## Jordan -2.490151045
## Kazakhstan 1.027408228
## Kenya 0.735505219
## Kiribati -0.985310951
## Korea, Dem. People’s Rep. 0.830878402
## Korea, Rep. 0.034976626
## Kosovo -0.698268280
## Kuwait 0.046047582
## Kyrgyz Republic 0.300847727
## Lao PDR 1.999875482
## Late-demographic dividend 0.388485135
## Latin America & Caribbean 0.041142445
## Latin America & Caribbean (excluding high income) 0.075280389
## Latin America & the Caribbean (IDA & IBRD countries) 0.065569377
## Latvia 0.128623266
## Least developed countries: UN classification 0.216709160
## Lebanon -1.946961775
## Lesotho -0.137693307
## Liberia 0.765510910
## Libya -0.941884570
## Liechtenstein 0.141807689
## Lithuania 0.134496532
## Low & middle income -0.014293141
## Low income 0.508704767
## Lower middle income -0.818704121
## Luxembourg -0.227072385
## Macao SAR, China 0.539375369
## Madagascar 2.273801315
## Malawi 1.975846557
## Malaysia -0.280719425
## Maldives -0.319897128
## Mali 0.730988288
## Malta -1.298600132
## Mauritania -0.703685818
## Mauritius -0.575270084
## Mexico -0.573230839
## Middle East & North Africa -1.975443501
## Middle East & North Africa (excluding high income) -2.028850299
## Middle East & North Africa (IDA & IBRD countries) -2.025291777
## Middle income -0.060565269
## Moldova -0.238247760
## Mongolia 0.432687495
## Montenegro -0.414569055
## Morocco -1.568033163
## Mozambique 2.542142687
## Myanmar 0.199796113
## Namibia -0.249277877
## Nepal 2.538850436
## Netherlands 0.521080833
## New Caledonia 0.334361949
## New Zealand 0.725181542
## Nicaragua -0.361433382
## Niger 0.251317114
## Nigeria -0.091427247
## North America 0.648117672
## North Macedonia -0.468344263
## Northern Mariana Islands 1.125439692
## Norway 1.054652072
## OECD members 0.039050741
## Oman -1.671541746
## Other small states -0.024994858
## Pacific island small states -0.169651496
## Pakistan -2.086227681
## Palau 0.321096783
## Panama -0.182764593
## Papua New Guinea 0.305338522
## Paraguay 0.319355648
## Peru 0.900286201
## Philippines -0.147202953
## Poland -0.151082728
## Portugal 0.382453534
## Post-demographic dividend 0.202798162
## Pre-demographic dividend 0.260775226
## Puerto Rico -0.831745121
## Qatar -0.272388758
## Romania -0.120953027
## Russian Federation 0.597349047
## Rwanda 2.350623422
## Samoa -1.374880549
## San Marino 0.172208561
## Sao Tome and Principe -1.019860577
## Saudi Arabia -2.129877574
## Senegal -1.054152738
## Serbia -0.308830749
## Sierra Leone 1.023502680
## Singapore 0.186636237
## Slovak Republic 0.138050914
## Slovenia 0.203810232
## Small states -0.010767330
## Solomon Islands 0.444523960
## Somalia -1.074265326
## South Africa -0.416041508
## South Asia -1.199783982
## South Asia (IDA & IBRD) -1.199783982
## South Sudan 0.664178656
## Spain -0.221935582
## Sri Lanka -0.897814432
## St. Lucia 0.649728560
## St. Vincent and the Grenadines 0.131420593
## Sub-Saharan Africa 0.379954847
## Sub-Saharan Africa (excluding high income) 0.379954847
## Sub-Saharan Africa (IDA & IBRD countries) 0.379954847
## Sudan -0.843744066
## Suriname -0.436831030
## Sweden 0.641036800
## Switzerland 0.680393591
## Syrian Arab Republic -2.245588328
## Tajikistan -0.674952343
## Tanzania 2.512556173
## Thailand 1.073992684
## Timor-Leste -0.395653700
## Togo 2.104439749
## Tonga -0.658657852
## Trinidad and Tobago 0.152339251
## Tunisia -1.785198120
## Turkey -1.729348682
## Turkmenistan 0.063497873
## Uganda 0.677071249
## Ukraine 0.250958153
## United Arab Emirates -0.805208024
## United Kingdom 0.368314436
## United States 0.628777497
## Upper middle income 0.246886943
## Uruguay 0.147303509
## Uzbekistan -0.351101194
## Vanuatu 0.365019405
## Venezuela, RB -0.001698803
## Vietnam 1.399045475
## Virgin Islands (U.S.) 0.282411076
## West Bank and Gaza -2.388327075
## World -0.003717115
## Yemen, Rep. -2.505323817
## Zambia 0.760219351
## Zimbabwe 1.866854539
Ponemos el índice en una nueva data.frame.
pearson1=as.data.frame(empoderamiento1$scores)
names(pearson1) = c("Empoderamiento")
head(pearson1)
## Empoderamiento
## Afghanistan -0.21808191
## Albania -0.74741919
## Algeria -1.22463238
## Angola 1.29629214
## Arab World -1.97999762
## Argentina 0.00458265
pearson1$Pais=row.names(pearson1)
row.names(pearson1) = NULL
El análisis factorial exploratorio sugiere que los componentes de Población Activa Mujeres y Participación en la fuerza laboral mujeres están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice.
Creamos una copia de la data y ponemos a los países como índice.
empoderamiento2_x=empoderamiento2
row.names(empoderamiento2) = empoderamiento2$Pais
empoderamiento2$Pais = NULL
head(empoderamiento2)
## PoblacionActiva FLM
## Afghanistan 43.15240 29.90230
## Albania 46.56340 47.99584
## Algeria 14.75860 14.63667
## Angola 75.30100 80.61500
## Arab World 20.13167 20.88708
## Argentina 48.21300 48.44430
Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.
empoderamiento2[is.na(empoderamiento2$PoblacionActiva), "PoblacionActiva"]=mean(empoderamiento2$PoblacionActiva, na.rm=T)
empoderamiento2[is.na(empoderamiento2$FLM), "FLM"]=mean(empoderamiento2$FLM, na.rm=T)
Estandarizamos:
empoderamiento2=as.data.frame(scale(empoderamiento2[,c(1,2)]))
head(empoderamiento2)
## PoblacionActiva FLM
## Afghanistan -0.5011848 -1.4197678
## Albania -0.2705588 -0.1427890
## Algeria -2.4209582 -2.4971627
## Angola 1.6724597 2.1593574
## Arab World -2.0576717 -2.0560302
## Argentina -0.1590254 -0.1111382
Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.
library(psych)
pearson2 = cor(empoderamiento2) #sacar la correlación de los puntajes estandarizadas
pearson2
## PoblacionActiva FLM
## PoblacionActiva 1.000000 0.864506
## FLM 0.864506 1.000000
cor.plot(pearson2,
numbers=T,
upper=FALSE,
main = "Correlation",
show.legend = FALSE) #verlo en un gráfico
KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. El Overall MSA sale 0.5.
KMO(empoderamiento2) #Que tan buena idea es juntarlos en un indice. Ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = empoderamiento2)
## Overall MSA = 0.5
## MSA for each item =
## PoblacionActiva FLM
## 0.5 0.5
Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial.
#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(empoderamiento2, n=nrow(empoderamiento2))
## R was not square, finding R from data
## $chisq
## [1] 333.6392
##
## $p.value
## [1] 1.549413e-74
##
## $df
## [1] 1
La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.
¿Cuántos índices debería crear? El R nos sugiere 1 índice.
fa.parallel(pearson2, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(empoderamiento2)) #cuantos indices deberia formar
## Parallel analysis suggests that the number of factors = 1 and the number of components = NA
empoderamiento2 = fa(empoderamiento2,
nfactors=1,
rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
empoderamiento2$loadings
##
## Loadings:
## MR1
## PoblacionActiva 0.93
## FLM 0.93
##
## MR1
## SS loadings 1.729
## Proportion Var 0.865
Ambas variables aportan de igual modo al índice. Se logró resumir el 86.5% de los componentes PoblacionActiva y FLM.
El MR1 está compuesto por ambas variables.
fa.diagram(empoderamiento2)
Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.
#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(empoderamiento2$communalities)
## PoblacionActiva FLM
## 0.864506 0.864506
Ambas variables aportan de igual modo al modelo.
Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial. En este caso, ninguna de las variables tiene menor relevancia.
# mientras mas grande peor (lo que mantiene)
sort(empoderamiento2$uniquenesses)
## PoblacionActiva FLM
## 0.135494 0.135494
La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores.
sort(empoderamiento2$complexity)
## PoblacionActiva FLM
## 1 1
Ninguna variable está cerca a otro factor.
empoderamiento2$scores
## MR1
## Afghanistan -0.957936814
## Albania -0.206127451
## Algeria -2.452558785
## Angola 1.910842948
## Arab World -2.051412705
## Argentina -0.134724627
## Armenia -0.003203348
## Aruba 0.321716349
## Australia 0.583245223
## Austria 0.248409257
## Azerbaijan 0.724065533
## Bahamas, The 1.293475038
## Bahrain -0.504468467
## Bangladesh -1.208854798
## Barbados 0.853973567
## Belarus 0.410514455
## Belgium -0.223791856
## Belize 0.176865679
## Benin 1.388095882
## Bermuda 1.055179121
## Bhutan 0.972773007
## Bolivia 0.758604626
## Bosnia and Herzegovina -1.081725092
## Botswana 0.363650970
## Brazil 0.290391135
## Brunei Darussalam 0.439111288
## Bulgaria -0.169381193
## Burkina Faso 0.308629824
## Burundi 1.713822749
## Cabo Verde 0.276720231
## Cambodia 1.913624610
## Cameroon 1.456609287
## Canada 0.811835599
## Caribbean small states 0.322600325
## Cayman Islands 1.049759068
## Central African Republic 0.505677673
## Central Europe and the Baltics -0.174184424
## Chad 0.455223801
## Channel Islands -0.027021182
## Chile -0.249707952
## China 0.935866021
## Colombia 0.344824362
## Comoros -0.522685446
## Congo, Dem. Rep. 0.889777222
## Congo, Rep. 0.380742695
## Costa Rica -0.264711634
## Cote d'Ivoire 0.359120294
## Croatia -0.324163072
## Cuba -0.469537629
## Cyprus 0.445661568
## Czech Republic -0.052299602
## Denmark 0.671106942
## Djibouti 0.026426746
## Dominican Republic -0.545707012
## Early-demographic dividend -1.148137378
## East Asia & Pacific 0.702412513
## East Asia & Pacific (excluding high income) 0.799843359
## East Asia & Pacific (IDA & IBRD countries) 0.794178274
## Ecuador -0.025008402
## Egypt, Arab Rep. -1.923753954
## El Salvador -0.246904148
## Equatorial Guinea 0.111581975
## Eritrea 0.774818825
## Estonia 0.333192186
## Eswatini -0.438737337
## Ethiopia 0.784165191
## Euro area -0.032651759
## Europe & Central Asia 0.024644777
## Europe & Central Asia (excluding high income) 0.003059226
## Europe & Central Asia (IDA & IBRD countries) -0.019337885
## European Union 0.005345216
## Fiji -0.430651323
## Finland 0.424036791
## Fragile and conflict affected situations -0.121270395
## France 0.057534593
## French Polynesia -0.110637088
## Gabon -0.717002018
## Gambia, The 0.004341844
## Georgia 0.371760800
## Germany 0.196612219
## Ghana 1.229293064
## Greece -0.438754594
## Greenland 0.749668323
## Guam 0.334856760
## Guatemala -0.558469088
## Guinea 0.427164715
## Guinea-Bissau 0.521484133
## Guyana -0.445049081
## Haiti 0.495107476
## Heavily indebted poor countries (HIPC) 0.444674059
## High income 0.137513064
## Honduras -0.601406995
## Hong Kong SAR, China 0.164568363
## Hungary -0.459137089
## IBRD only -0.350545563
## Iceland 1.614808242
## IDA & IBRD total -0.222378554
## IDA blend -0.659863816
## IDA only 0.137474868
## IDA total -0.008244770
## India -1.727627330
## Indonesia 0.038596582
## Iran, Islamic Rep. -2.399518052
## Iraq -2.639221453
## Ireland 0.368276158
## Isle of Man 0.262940846
## Israel 0.467166412
## Italy -0.816413641
## Jamaica 0.533835201
## Japan -0.125779127
## Jordan -2.444445892
## Kazakhstan 1.085802316
## Kenya 1.132218882
## Kiribati 0.079575052
## Korea, Dem. People’s Rep. 0.820720957
## Korea, Rep. -0.041486864
## Kosovo -0.927406405
## Kuwait 0.342453034
## Kyrgyz Republic 0.147533753
## Lao PDR 1.826360223
## Late-demographic dividend 0.725821087
## Latin America & Caribbean 0.051031735
## Latin America & Caribbean (excluding high income) 0.082640191
## Latin America & the Caribbean (IDA & IBRD countries) 0.067917711
## Latvia 0.263889255
## Least developed countries: UN classification 0.198790933
## Lebanon -1.935468052
## Lesotho -0.008994052
## Liberia 0.385196962
## Libya -1.499071019
## Liechtenstein 0.117515231
## Lithuania 0.137755199
## Low & middle income -0.221585361
## Low income 0.461308488
## Lower middle income -1.062838706
## Luxembourg -0.054823107
## Macao SAR, China 1.063540554
## Madagascar 2.162356901
## Malawi 1.392729132
## Malaysia -0.305094473
## Maldives -0.218579937
## Mali 0.345872300
## Malta -1.055523687
## Marshall Islands -0.738355520
## Mauritania -1.528646123
## Mauritius -0.546916305
## Mexico -0.492061217
## Middle East & North Africa -2.099511388
## Middle East & North Africa (excluding high income) -2.212285671
## Middle East & North Africa (IDA & IBRD countries) -2.210458196
## Middle income -0.268700119
## Moldova -0.754335065
## Mongolia 0.264793622
## Montenegro -0.515949470
## Morocco -1.749565070
## Mozambique 1.087663848
## Myanmar 0.104144013
## Namibia 0.134322117
## Nauru -0.025657774
## Nepal 2.004082360
## Netherlands 0.609649229
## New Caledonia 0.657928604
## New Zealand 0.782031149
## Nicaragua 0.064029970
## Niger 1.221846237
## Nigeria 0.196544383
## North America 0.566246572
## North Macedonia -0.508392052
## Northern Mariana Islands 0.582158901
## Norway 1.066801298
## OECD members 0.043796360
## Oman -1.680785687
## Other small states 0.005153535
## Pacific island small states -0.071744448
## Pakistan -1.994420826
## Panama -0.226029029
## Papua New Guinea -0.146946725
## Paraguay 0.504846850
## Peru 1.142832351
## Philippines -0.142069509
## Poland -0.178585272
## Portugal 0.347406419
## Post-demographic dividend 0.198455654
## Pre-demographic dividend 0.236305410
## Puerto Rico -1.056886094
## Qatar 0.067587282
## Romania -0.276402251
## Russian Federation 0.631587290
## Rwanda 1.903235199
## Samoa -1.808000681
## Sao Tome and Principe -0.303977896
## Saudi Arabia -2.178148313
## Senegal -0.747793201
## Serbia -0.586548626
## Seychelles 0.418502462
## Sierra Leone 0.334665957
## Singapore 0.441575795
## Slovak Republic 0.018743478
## Slovenia 0.186890300
## Small states 0.018817799
## Solomon Islands 0.852451946
## Somalia -1.113485168
## South Africa -0.304471943
## South Asia -1.673057853
## South Asia (IDA & IBRD) -1.673057853
## South Sudan 1.441090425
## Spain 0.097710499
## Sri Lanka -1.079302538
## St. Lucia 0.586376124
## St. Vincent and the Grenadines 0.199225502
## Sub-Saharan Africa 0.360199399
## Sub-Saharan Africa (excluding high income) 0.360199399
## Sub-Saharan Africa (IDA & IBRD countries) 0.360199399
## Sudan -1.714188636
## Suriname -0.408659681
## Sweden 0.808392777
## Switzerland 0.729499639
## Syrian Arab Republic -2.526839852
## Tajikistan -1.449616001
## Tanzania 2.207699847
## Thailand 1.016285752
## Timor-Leste -1.619543488
## Togo 1.826017425
## Tonga -0.174323234
## Trinidad and Tobago 0.046667065
## Tunisia -1.756480858
## Turkey -1.619744506
## Turkmenistan 0.063090399
## Uganda 1.396774817
## Ukraine 0.207602776
## United Arab Emirates -0.512920396
## United Kingdom 0.382580295
## United States 0.538173274
## Upper middle income 0.436073738
## Uruguay 0.371744132
## Uzbekistan 0.073360587
## Vanuatu 0.716404137
## Venezuela, RB -0.007453655
## Vietnam 1.465705136
## Virgin Islands (U.S.) 0.240124002
## West Bank and Gaza -2.362713114
## World -0.140505894
## Yemen, Rep. -2.781120503
## Zambia 1.011156411
## Zimbabwe 1.530300799
Ponemos el índice en una nueva data.frame.
pearson2=as.data.frame(empoderamiento2$scores)
names(pearson2) = c("Empoderamiento")
head(pearson2)
## Empoderamiento
## Afghanistan -0.9579368
## Albania -0.2061275
## Algeria -2.4525588
## Angola 1.9108429
## Arab World -2.0514127
## Argentina -0.1347246
pearson2$Pais=row.names(pearson2)
row.names(pearson2) = NULL
El análisis factorial exploratorio sugiere que los componentes de Población Activa Mujeres y Participación en la fuerza laboral mujeres están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice.
Para este análisis factorial usamos la data Calidad1 compuesta por las datas est1, GAST1, ban1, DataTugurios1, DataGini1.
Dentro de la hipótesis de calidad de vida lo que queremos ver es que tanto porcentaje de personas no vive en barrios de tugurios y que tanta no desigualdad hay. Por ello, como las variables BarriosTugurios y Gini están midiendo lo contrario, las invertimos para que calcen con la hipótesis.
#Ponemos las variables en forma intuitiva restando con el mayor valor
Calidad1$BarriosTugurios= 100 - Calidad1$BarriosTugurios
Calidad1$Gini= 65 - Calidad1$Gini
Creamos una copia de la data y ponemos a los países como índice.
Calidad1_X=Calidad1
row.names(Calidad1) = Calidad1$Pais
Calidad1$Pais = NULL
head(Calidad1)
## BarriosTugurios Gini EDU ENER GAST
## Afghanistan NA NA NA 22.79312 NA
## Albania NA 34.4 NA 100.00000 0.0873700
## Algeria NA NA 72.64868 98.80855 0.1419467
## American Samoa NA NA NA NA 0.3170075
## Andorra NA NA NA 100.00000 NA
## Angola 18.65 NA NA 29.52772 NA
## ban
## Afghanistan 0.00137906
## Albania 0.16976576
## Algeria 0.38217637
## American Samoa NA
## Andorra 13.34488004
## Angola 0.04626376
Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.
Calidad1[is.na(Calidad1$BarriosTugurios), "BarriosTugurios"]=mean(Calidad1$BarriosTugurios, na.rm=T)
Calidad1[is.na(Calidad1$Gini), "Gini"]=mean(Calidad1$Gini, na.rm=T)
Calidad1[is.na(Calidad1$EDU), "EDU"]=mean(Calidad1$EDU, na.rm=T)
Calidad1[is.na(Calidad1$ENER), "ENER"]=mean(Calidad1$ENER, na.rm=T)
Calidad1[is.na(Calidad1$GAST), "GAST"]=mean(Calidad1$GAST, na.rm=T)
Calidad1[is.na(Calidad1$ban), "ban"]=mean(Calidad1$ban, na.rm=T)
Estandarizamos:
Calidad1=as.data.frame(scale(Calidad1[,c(1:6)]))
head(Calidad1)
## BarriosTugurios Gini EDU ENER GAST
## Afghanistan 0.000000 0.000000 0.0000000 -1.7233986 0.0000000
## Albania 0.000000 1.394347 0.0000000 0.7551778 -1.1905817
## Algeria 0.000000 0.000000 -0.2212941 0.7169287 -1.1038070
## American Samoa 0.000000 0.000000 0.0000000 0.0000000 -0.8254673
## Andorra 0.000000 0.000000 0.0000000 0.7551778 0.0000000
## Angola -2.469433 0.000000 0.0000000 -1.5071972 0.0000000
## ban
## Afghanistan -0.6777603
## Albania -0.6512634
## Algeria -0.6178389
## American Samoa 0.0000000
## Andorra 1.4219446
## Angola -0.6706974
Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.
library(psych)
promedio1 = cor(Calidad1) #sacar la correlación de los puntajes estandarizadas
promedio1
## BarriosTugurios Gini EDU ENER
## BarriosTugurios 1.000000000 -0.13270600 0.49417768 0.5779805
## Gini -0.132706004 1.00000000 -0.09252552 0.2145609
## EDU 0.494177679 -0.09252552 1.00000000 0.5721154
## ENER 0.577980511 0.21456087 0.57211541 1.0000000
## GAST -0.007642321 0.27747953 0.04709207 0.1967345
## ban 0.011836126 0.31819474 0.10412853 0.3545951
## GAST ban
## BarriosTugurios -0.007642321 0.01183613
## Gini 0.277479531 0.31819474
## EDU 0.047092075 0.10412853
## ENER 0.196734526 0.35459509
## GAST 1.000000000 0.62000846
## ban 0.620008458 1.00000000
cor.plot(promedio1,
numbers=T,
upper=FALSE,
main = "Correlation",
show.legend = FALSE) #verlo en un gráfico
KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor.
KMO(Calidad1) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = Calidad1)
## Overall MSA = 0.6
## MSA for each item =
## BarriosTugurios Gini EDU ENER
## 0.62 0.54 0.70 0.58
## GAST ban
## 0.59 0.58
Nos fijamos en el Overall MSA: sale 0.6.
Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial.
#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(Calidad1,n=nrow(Calidad1))
## R was not square, finding R from data
## $chisq
## [1] 466.7162
##
## $p.value
## [1] 6.110613e-90
##
## $df
## [1] 15
La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.
¿Cuántos índices debería crear? El R nos sugiere 3 índices.
fa.parallel(promedio1, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(Calidad1)) #cuantos indices deberia formar
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs
## = np.obs, : The estimated weights for the factor scores are probably
## incorrect. Try a different factor extraction method.
## Parallel analysis suggests that the number of factors = 3 and the number of components = NA
Calidad1 = fa(Calidad1,
nfactors=3,
rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
## Warning in fac(r = r, nfactors = nfactors, n.obs = n.obs, rotate =
## rotate, : An ultra-Heywood case was detected. Examine the results carefully
Calidad1$loadings
##
## Loadings:
## MR1 MR2 MR3
## BarriosTugurios 0.717 -0.143
## Gini 0.241 0.551
## EDU 0.677
## ENER 0.888 0.157 0.432
## GAST 0.863 0.118
## ban 0.121 0.673 0.313
##
## MR1 MR2 MR3
## SS loadings 1.782 1.285 0.632
## Proportion Var 0.297 0.214 0.105
## Cumulative Var 0.297 0.511 0.616
Se logró resumir el 61.6% de los componentes BarriosTugurios, Gini, EDU, ENER, GAST y ban.
fa.diagram(Calidad1)
MR1 está compuesto por ENER, BarriosTugurios y EDU (dichos componentes son los que hacen referencia al rol del Estado). MR2 está compuesto por GAST y ban, que tienen en común lo tecnológico. Finalmente, MR3 está compuesto por Gini, el índice de desigualdad en el mundo (como lo invertimos, sería no desigualdad).
Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.
#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(Calidad1$communalities)
## Gini EDU BarriosTugurios ban
## 0.3668824 0.4712142 0.5351012 0.5657713
## GAST ENER
## 0.7585527 0.9950000
La variable que más aporta es ENER y la que menos aporta es Gini (por ello forma un índice distinto).
Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.
# mientras mas grande peor (lo que mantiene)
sort(Calidad1$uniquenesses)
## ENER GAST ban BarriosTugurios
## -0.0006972736 0.2413269718 0.4340153963 0.4648857180
## EDU Gini
## 0.5288417029 0.6330720986
Nuevamente, Gini es la que menos relevancia tiene para el modelo y ENER la que mayor relevancia tiene.
La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. En este caso, casi todas tienden a estar cerca de otro factor, por esta razón el R sugirió formar 3 índices y no 1.
sort(Calidad1$complexity)
## GAST EDU BarriosTugurios Gini
## 1.038257 1.055293 1.080547 1.408544
## ban ENER
## 1.487721 1.520918
Calidad1$scores
## MR1
## Afghanistan -1.28872296
## Albania 0.47328987
## Algeria 0.63538286
## American Samoa 0.02928735
## Andorra 0.45131879
## Angola -1.54618516
## Antigua and Barbuda 0.87478567
## Arab World 0.37962060
## Argentina 1.26624404
## Armenia 0.52788649
## Aruba 0.31144886
## Australia 0.29572552
## Austria 0.10617704
## Azerbaijan 0.58259044
## Bahamas, The 0.52927301
## Bahrain 0.61196199
## Bangladesh -1.47593965
## Barbados 0.70408381
## Belarus 0.36794990
## Belgium 0.03415665
## Belize 0.69510370
## Benin -1.98448749
## Bermuda 0.12295387
## Bhutan -0.70295308
## Bolivia 0.58528978
## Bosnia and Herzegovina 0.53055154
## Botswana -0.84727758
## Brazil 1.35087042
## Brunei Darussalam 0.67504403
## Bulgaria 0.53877126
## Burkina Faso -2.10020389
## Burundi -2.17378997
## Cabo Verde 0.10482152
## Cambodia -1.66772678
## Cameroon -0.64171528
## Canada 0.12337850
## Caribbean small states 0.55891719
## Cayman Islands 0.83042617
## Central African Republic -2.18979013
## Central Europe and the Baltics 0.58641461
## Chad -2.81787378
## Channel Islands 0.59464125
## Chile 1.29221255
## China 0.73851168
## Colombia 1.47579858
## Comoros -0.38736668
## Congo, Dem. Rep. -2.03120474
## Congo, Rep. -0.99528190
## Costa Rica 1.30392674
## Cote d'Ivoire -0.63845748
## Croatia 0.60387032
## Cuba 0.64590704
## Curacao 0.59464125
## Cyprus 0.39557968
## Czech Republic 0.19795345
## Denmark -0.18758402
## Djibouti -0.47181901
## Dominica 0.26900652
## Dominican Republic 1.21052802
## Early-demographic dividend 0.07268648
## East Asia & Pacific 0.66249277
## East Asia & Pacific (excluding high income) 0.73458314
## East Asia & Pacific (IDA & IBRD countries) 0.75694924
## Ecuador 1.41726441
## Egypt, Arab Rep. 0.73174179
## El Salvador 0.88835512
## Equatorial Guinea -0.50421759
## Eritrea -1.06508883
## Estonia 0.30025367
## Eswatini -1.05000765
## Ethiopia -2.49421098
## Euro area 0.63086605
## Europe & Central Asia 0.70916626
## Europe & Central Asia (excluding high income) 0.84447754
## Europe & Central Asia (IDA & IBRD countries) 0.84506294
## European Union 0.65020917
## Faroe Islands 0.41899491
## Fiji 0.22077322
## Finland -0.11250373
## Fragile and conflict affected situations -1.23880669
## France 0.12113052
## French Polynesia 0.59118472
## Gabon 0.34357663
## Gambia, The -0.73692487
## Georgia 0.61040154
## Germany 0.13578600
## Ghana -0.35724373
## Gibraltar 0.59464125
## Greece 0.67609049
## Greenland 0.50864662
## Grenada 0.96658799
## Guam 0.66853342
## Guatemala 0.64850773
## Guinea -1.87316603
## Guinea-Bissau -2.14797483
## Guyana 0.19093545
## Haiti -1.60348315
## Heavily indebted poor countries (HIPC) -1.74380376
## High income 0.34907271
## Honduras 0.57011946
## Hong Kong SAR, China 0.29062705
## Hungary 0.29210942
## IBRD only 0.57996366
## Iceland -0.11265529
## IDA & IBRD total 0.21730463
## IDA blend -0.44649028
## IDA only -1.48465665
## IDA total -1.13635754
## India -0.30704108
## Indonesia 0.62143023
## Iran, Islamic Rep. 1.01081734
## Iraq 0.26255170
## Ireland 0.34338351
## Isle of Man 0.59464125
## Israel 0.27011902
## Italy 0.33678435
## Jamaica 0.33957689
## Japan 0.25298583
## Jordan 0.96984775
## Kazakhstan 0.51310632
## Kenya -1.25419578
## Kiribati -0.31494032
## Korea, Dem. People’s Rep. -1.42845827
## Korea, Rep. -0.05648612
## Kosovo 0.25791023
## Kuwait 0.86760922
## Kyrgyz Republic 0.53437903
## Lao PDR -0.98977441
## Late-demographic dividend 0.86466749
## Latin America & Caribbean 0.86535543
## Latin America & Caribbean (excluding high income) 0.84915828
## Latin America & the Caribbean (IDA & IBRD countries) 0.85893282
## Latvia 0.54913602
## Least developed countries: UN classification -1.69519780
## Lebanon 0.69299911
## Lesotho -1.52439532
## Liberia -2.31629524
## Libya 0.67416460
## Liechtenstein 0.30930217
## Lithuania 0.43919362
## Low & middle income 0.19720627
## Low income -1.75727091
## Lower middle income -0.11636657
## Luxembourg 0.15262039
## Macao SAR, China 0.66434442
## Madagascar -1.79495531
## Malawi -1.94670000
## Malaysia 0.79011432
## Maldives 0.65082253
## Mali -2.15849881
## Malta 0.37533013
## Marshall Islands -0.05030317
## Mauritania -1.50561264
## Mauritius 0.55225015
## Mexico 1.38852627
## Micronesia, Fed. Sts. -0.37486694
## Middle East & North Africa 0.69788251
## Middle East & North Africa (excluding high income) 0.65634623
## Middle East & North Africa (IDA & IBRD countries) 0.65288652
## Middle income 0.39082017
## Moldova 0.55469328
## Monaco 0.27095935
## Mongolia -0.09745198
## Montenegro 0.60195399
## Morocco 0.41115604
## Mozambique -2.24022606
## Myanmar -0.66759847
## Namibia -0.03481467
## Nauru 0.58503834
## Nepal -0.75003491
## Netherlands -0.03316193
## New Caledonia 0.59263892
## New Zealand 0.50010167
## Nicaragua 0.31084864
## Niger -2.48974118
## Nigeria -1.01291027
## North America 0.29694702
## North Macedonia 0.62233366
## Northern Mariana Islands 0.59464125
## Norway 0.01619126
## OECD members 0.36242030
## Oman 0.71428723
## Other small states -0.37371102
## Pacific island small states -0.32538152
## Pakistan -0.19247573
## Palau 0.61747321
## Panama 0.97063199
## Papua New Guinea -1.56504359
## Paraguay 1.45990858
## Peru 0.67546043
## Philippines 0.43908948
## Poland 0.47860696
## Portugal 0.47708332
## Post-demographic dividend 0.33697908
## Pre-demographic dividend -1.54547211
## Puerto Rico 0.61309036
## Qatar 0.76566564
## Romania 0.61917325
## Russian Federation 0.67829303
## Rwanda -1.58772460
## Samoa 0.47755835
## San Marino 0.59846417
## Sao Tome and Principe -0.45879920
## Saudi Arabia 1.07603800
## Senegal -1.02471482
## Serbia 0.46794911
## Seychelles 0.56230626
## Sierra Leone -2.58758124
## Singapore 0.35540711
## Sint Maarten (Dutch part) 0.59464125
## Slovak Republic 0.28001107
## Slovenia 0.32304036
## Small states -0.18116503
## Solomon Islands -1.28031868
## Somalia -1.94086688
## South Africa 1.22630549
## South Asia -0.29271171
## South Asia (IDA & IBRD) -0.29271171
## South Sudan -1.92960790
## Spain 0.52657555
## Sri Lanka 0.31471714
## St. Kitts and Nevis 0.34076772
## St. Lucia 0.77375456
## St. Martin (French part) -0.43812641
## St. Vincent and the Grenadines 0.26280349
## Sub-Saharan Africa -1.44087447
## Sub-Saharan Africa (excluding high income) -1.44110644
## Sub-Saharan Africa (IDA & IBRD countries) -1.44087447
## Sudan -0.99364835
## Suriname 1.10695892
## Sweden -0.18950717
## Switzerland 0.08076505
## Syrian Arab Republic 0.78990348
## Tajikistan 0.51670612
## Tanzania -1.72998746
## Thailand 0.97906030
## Timor-Leste -1.59996695
## Togo -1.50179459
## Tonga 0.62244336
## Trinidad and Tobago 0.80215679
## Tunisia 0.60999492
## Turkey 1.08646735
## Turkmenistan 0.58593378
## Turks and Caicos Islands 0.42401618
## Tuvalu 0.52636842
## Uganda -1.74553044
## Ukraine 0.34677614
## United Arab Emirates 0.75863772
## United Kingdom 0.26678538
## United States 0.35139421
## Upper middle income 0.90063013
## Uruguay 1.02914988
## Uzbekistan 0.58813642
## Vanuatu -1.10820402
## Venezuela, RB 1.27890147
## Vietnam 0.46795125
## Virgin Islands (U.S.) 0.65726233
## West Bank and Gaza 0.72894882
## World 0.23193789
## Yemen, Rep. -1.13072094
## Zambia -1.17865742
## Zimbabwe -0.68533868
## MR2
## Afghanistan 0.038673556
## Albania -1.141039814
## Algeria -1.066187218
## American Samoa -0.596071750
## Andorra 0.283324544
## Angola -0.057611355
## Antigua and Barbuda -0.036392766
## Arab World -0.183969970
## Argentina -0.457542618
## Armenia -0.943961150
## Aruba 0.177247485
## Australia 1.460774186
## Austria 1.968257989
## Azerbaijan -0.872896588
## Bahamas, The -0.078658359
## Bahrain -0.142086253
## Bangladesh -0.225756689
## Barbados 0.360420947
## Belarus -0.422674500
## Belgium 1.633200756
## Belize -0.119811492
## Benin -0.230122721
## Bermuda 0.501509377
## Bhutan -0.018350604
## Bolivia -0.088063431
## Bosnia and Herzegovina -1.184580709
## Botswana -0.340734870
## Brazil 0.130761512
## Brunei Darussalam -1.116576217
## Bulgaria -0.555813083
## Burkina Faso -0.892291173
## Burundi -0.479159014
## Cabo Verde -0.093544371
## Cambodia -0.041797330
## Cameroon -0.082428270
## Canada 1.891593845
## Caribbean small states -0.073788621
## Cayman Islands 0.003016415
## Central African Republic 0.191304163
## Central Europe and the Baltics -0.168878154
## Chad 0.005344313
## Channel Islands -0.096217949
## Chile -0.593597253
## China 0.385816828
## Colombia -0.846490324
## Comoros -0.101454119
## Congo, Dem. Rep. -0.648856511
## Congo, Rep. 0.179012241
## Costa Rica -0.665401900
## Cote d'Ivoire -0.110569877
## Croatia -0.083026606
## Cuba -0.631253489
## Curacao -0.096217949
## Cyprus -0.661495798
## Czech Republic 0.415452766
## Denmark 2.594244773
## Djibouti -0.091467854
## Dominica -0.005702867
## Dominican Republic -0.083529206
## Early-demographic dividend -0.371289965
## East Asia & Pacific 1.799223841
## East Asia & Pacific (excluding high income) 0.309168324
## East Asia & Pacific (IDA & IBRD countries) 0.305156655
## Ecuador -0.952885612
## Egypt, Arab Rep. -0.910446395
## El Salvador -0.962811287
## Equatorial Guinea -0.169953945
## Eritrea 0.172340320
## Estonia 0.412675050
## Eswatini 0.169900059
## Ethiopia -0.949868930
## Euro area 1.479329669
## Europe & Central Asia 1.126543872
## Europe & Central Asia (excluding high income) -0.143604277
## Europe & Central Asia (IDA & IBRD countries) -0.173638980
## European Union 1.402028670
## Faroe Islands 0.393879398
## Fiji -0.162821343
## Finland 3.445077161
## Fragile and conflict affected situations 0.083130493
## France 1.783262297
## French Polynesia -0.087064473
## Gabon -0.659268842
## Gambia, The 0.014934555
## Georgia -0.975507084
## Germany 2.141283612
## Ghana -0.775304309
## Gibraltar -0.096217949
## Greece -0.399083943
## Greenland -0.127756291
## Grenada 0.118049191
## Guam -0.867542228
## Guatemala -1.057025754
## Guinea 0.029361244
## Guinea-Bissau 0.201196511
## Guyana -0.147604999
## Haiti 0.032591706
## Heavily indebted poor countries (HIPC) -0.090908368
## High income 1.940143363
## Honduras -0.804265058
## Hong Kong SAR, China 0.617148333
## Hungary 0.148211597
## IBRD only -0.103249413
## Iceland 2.912597749
## IDA & IBRD total -0.113469380
## IDA blend -0.717257212
## IDA only -0.111048709
## IDA total -0.126674662
## India -0.223974750
## Indonesia -0.130333434
## Iran, Islamic Rep. -0.505986899
## Iraq -1.204075513
## Ireland 0.474287072
## Isle of Man -0.096217949
## Israel 4.178094497
## Italy 0.453768093
## Jamaica -0.178293277
## Japan 3.143684121
## Jordan -0.135870655
## Kazakhstan -0.942233950
## Kenya -0.529287367
## Kiribati -0.113211581
## Korea, Dem. People’s Rep. 0.231136548
## Korea, Rep. 2.920839185
## Kosovo -0.092597574
## Kuwait -0.991964148
## Kyrgyz Republic -0.991741225
## Lao PDR -0.179464201
## Late-demographic dividend 0.136836954
## Latin America & Caribbean -0.358214098
## Latin America & Caribbean (excluding high income) -0.337341831
## Latin America & the Caribbean (IDA & IBRD countries) -0.356369239
## Latvia -0.448307153
## Least developed countries: UN classification -0.112001232
## Lebanon -0.222165075
## Lesotho -0.801214149
## Liberia 0.166900102
## Libya -0.047277648
## Liechtenstein 0.659408947
## Lithuania -0.035043486
## Low & middle income -0.089096894
## Low income -0.091611216
## Lower middle income -0.407146159
## Luxembourg 1.233445607
## Macao SAR, China -0.490710996
## Madagascar -0.720709798
## Malawi 0.065261626
## Malaysia -0.439603013
## Maldives -0.089877854
## Mali -0.903897635
## Malta -0.118937774
## Marshall Islands 0.008139475
## Mauritania -0.095554341
## Mauritius -0.770523574
## Mexico -0.557484070
## Micronesia, Fed. Sts. -0.087187079
## Middle East & North Africa -0.189530020
## Middle East & North Africa (excluding high income) -0.219404712
## Middle East & North Africa (IDA & IBRD countries) -0.220215144
## Middle income -0.093949608
## Moldova -0.756074758
## Monaco -0.036862855
## Mongolia -0.900740075
## Montenegro 0.109209165
## Morocco -0.461744104
## Mozambique -0.537220431
## Myanmar -0.065475439
## Namibia 0.022964864
## Nauru -0.094664119
## Nepal -0.078425541
## Netherlands 1.806020389
## New Caledonia -0.090915436
## New Zealand 0.459543824
## Nicaragua -0.143254254
## Niger -0.176345947
## Nigeria -0.902908831
## North America 2.350717020
## North Macedonia -0.891880407
## Northern Mariana Islands -0.096217949
## Norway 1.382424532
## OECD members 1.878486670
## Oman -0.235193576
## Other small states 0.032677782
## Pacific island small states -0.095241171
## Pakistan -0.670270791
## Palau -0.251454186
## Panama -0.763408637
## Papua New Guinea 0.253237200
## Paraguay -0.976977489
## Peru -0.856131578
## Philippines -0.925876097
## Poland -0.408627324
## Portugal 0.173693825
## Post-demographic dividend 2.031560590
## Pre-demographic dividend -0.104061880
## Puerto Rico -0.145074361
## Qatar -0.070090611
## Romania -0.600563764
## Russian Federation 0.134042632
## Rwanda 0.066749205
## Samoa -0.245410754
## San Marino -0.106341704
## Sao Tome and Principe -0.090399048
## Saudi Arabia -1.064260348
## Senegal -0.187050785
## Serbia -0.618589436
## Seychelles -0.730837807
## Sierra Leone -0.015009675
## Singapore 1.851834413
## Sint Maarten (Dutch part) -0.096217949
## Slovak Republic -0.507357440
## Slovenia 0.866347934
## Small states 0.015180312
## Solomon Islands 0.083274903
## Somalia 0.203971234
## South Africa -0.046605946
## South Asia -0.254725198
## South Asia (IDA & IBRD) -0.254725198
## South Sudan 0.312226770
## Spain 0.605472539
## Sri Lanka -0.867624443
## St. Kitts and Nevis 0.279233760
## St. Lucia -0.025436339
## St. Martin (French part) 0.070892534
## St. Vincent and the Grenadines -0.069702830
## Sub-Saharan Africa -0.476288869
## Sub-Saharan Africa (excluding high income) -0.476296136
## Sub-Saharan Africa (IDA & IBRD countries) -0.476288869
## Sudan -0.605447725
## Suriname -0.098510133
## Sweden 3.637355430
## Switzerland 2.739352668
## Syrian Arab Republic -0.177805992
## Tajikistan -1.147706733
## Tanzania -0.527397330
## Thailand -0.797765656
## Timor-Leste -0.123815067
## Togo -0.085046474
## Tonga -0.113593468
## Trinidad and Tobago -1.024744966
## Tunisia -0.432702257
## Turkey -0.351652098
## Turkmenistan -0.094809008
## Turks and Caicos Islands -0.068609380
## Tuvalu -0.185046003
## Uganda -0.596488142
## Ukraine -0.051874817
## United Arab Emirates -0.082306122
## United Kingdom 1.236198046
## United States 2.390895483
## Upper middle income -0.017229040
## Uruguay -0.563391821
## Uzbekistan -0.960016648
## Vanuatu 0.026823609
## Venezuela, RB -0.773894179
## Vietnam -0.223627404
## Virgin Islands (U.S.) -1.065345509
## West Bank and Gaza -0.900469413
## World 1.321749952
## Yemen, Rep. -0.242455987
## Zambia -0.952795992
## Zimbabwe 0.039555393
## MR3
## Afghanistan -1.383960928
## Albania 1.178861819
## Algeria 0.754605654
## American Samoa 0.128088771
## Andorra 0.683137249
## Angola -0.236433583
## Antigua and Barbuda -0.683118279
## Arab World -0.179963663
## Argentina -0.942786035
## Armenia 0.963556281
## Aruba 0.459208943
## Australia 0.651910080
## Austria 0.831483487
## Azerbaijan 0.786529608
## Bahamas, The 0.526419633
## Bahrain 0.574474833
## Bangladesh 0.764994519
## Barbados 0.128232469
## Belarus 1.160071049
## Belgium 1.038849324
## Belize -0.370858809
## Benin 0.522825990
## Bermuda 1.091048380
## Bhutan 0.015232477
## Bolivia -1.234556271
## Bosnia and Herzegovina 1.024539946
## Botswana -1.069705024
## Brazil -1.221833260
## Brunei Darussalam 0.762116022
## Bulgaria 0.841523706
## Burkina Faso -0.149873263
## Burundi -0.819435531
## Cabo Verde -0.845431725
## Cambodia -0.382786898
## Cameroon -0.801709174
## Canada 0.769278501
## Caribbean small states -0.105548614
## Cayman Islands 0.054513173
## Central African Republic -0.632472148
## Central Europe and the Baltics 0.618695037
## Chad 0.470415508
## Channel Islands 0.586190945
## Chile -0.852608812
## China -0.040508722
## Colombia -1.328451123
## Comoros -0.943916083
## Congo, Dem. Rep. -0.581961726
## Congo, Rep. -1.354452257
## Costa Rica -0.786354981
## Cote d'Ivoire -0.292241319
## Croatia 0.569214302
## Cuba 0.583579714
## Curacao 0.586190945
## Cyprus 1.152618643
## Czech Republic 1.184434735
## Denmark 1.132539236
## Djibouti -0.577301661
## Dominica 0.290470676
## Dominican Republic -1.345349390
## Early-demographic dividend -0.316100657
## East Asia & Pacific -0.716923160
## East Asia & Pacific (excluding high income) -0.437616863
## East Asia & Pacific (IDA & IBRD countries) -0.412530805
## Ecuador -1.143672951
## Egypt, Arab Rep. 0.431403759
## El Salvador -0.603729738
## Equatorial Guinea 0.217032222
## Eritrea -1.049953113
## Estonia 0.936862620
## Eswatini -1.035086251
## Ethiopia 1.004805727
## Euro area -0.078829412
## Europe & Central Asia -0.105810970
## Europe & Central Asia (excluding high income) 0.046998852
## Europe & Central Asia (IDA & IBRD countries) 0.057283047
## European Union -0.086086701
## Faroe Islands 0.697883506
## Fiji 0.132666700
## Finland 0.748508138
## Fragile and conflict affected situations -0.355859383
## France 0.846353003
## French Polynesia 0.588529012
## Gabon -0.179273317
## Gambia, The -1.687206678
## Georgia 0.770867295
## Germany 0.718331186
## Ghana -0.679193777
## Gibraltar 0.586190945
## Greece 0.500045908
## Greenland 0.718312028
## Grenada -1.276780628
## Guam 0.700404055
## Guatemala -0.689192163
## Guinea -0.326705660
## Guinea-Bissau -0.650666462
## Guyana -0.335769989
## Haiti 0.113529884
## Heavily indebted poor countries (HIPC) -0.362488848
## High income 0.345650041
## Honduras -1.444686610
## Hong Kong SAR, China 0.817993167
## Hungary 1.076314940
## IBRD only -0.349395494
## Iceland 0.889037429
## IDA & IBRD total -0.364471552
## IDA blend 0.138062611
## IDA only -0.237938503
## IDA total -0.185638204
## India -0.033948424
## Indonesia -0.323572689
## Iran, Islamic Rep. -0.252916997
## Iraq 1.449952559
## Ireland 0.869974599
## Isle of Man 0.586190945
## Israel -0.202936334
## Italy 0.871391219
## Jamaica 0.342901540
## Japan 0.151225406
## Jordan -0.298676127
## Kazakhstan 0.988832083
## Kenya -1.364526917
## Kiribati -0.253662086
## Korea, Dem. People’s Rep. -1.408158796
## Korea, Rep. 0.762875295
## Kosovo 0.967715353
## Kuwait 0.324087068
## Kyrgyz Republic 0.977190058
## Lao PDR 0.619132617
## Late-demographic dividend -0.345568118
## Latin America & Caribbean -0.392300789
## Latin America & Caribbean (excluding high income) -0.396025578
## Latin America & the Caribbean (IDA & IBRD countries) -0.391042338
## Latvia 0.778301578
## Least developed countries: UN classification -0.151443646
## Lebanon 0.441057518
## Lesotho -1.649729968
## Liberia -1.006682271
## Libya 0.320822834
## Liechtenstein 0.779200255
## Lithuania 0.843147136
## Low & middle income -0.375756194
## Low income -0.356444171
## Lower middle income -0.198881175
## Luxembourg 0.960119455
## Macao SAR, China 0.471478055
## Madagascar -0.517044049
## Malawi -1.253257793
## Malaysia 0.183166587
## Maldives -0.186738700
## Mali 0.358788767
## Malta 0.937184926
## Marshall Islands -0.049588321
## Mauritania -0.704343048
## Mauritius 0.816614067
## Mexico -1.045446428
## Micronesia, Fed. Sts. -0.760889089
## Middle East & North Africa -0.033870126
## Middle East & North Africa (excluding high income) 0.020981082
## Middle East & North Africa (IDA & IBRD countries) 0.023876188
## Middle income -0.326434824
## Moldova 0.831938072
## Monaco 1.032701150
## Mongolia 0.671252783
## Montenegro 0.454084268
## Morocco -0.217708272
## Mozambique -0.004036439
## Myanmar -0.732649978
## Namibia -2.562420851
## Nauru 0.576724508
## Nepal -0.656085832
## Netherlands 1.077840606
## New Caledonia 0.587545363
## New Zealand 0.563026743
## Nicaragua -0.641379681
## Niger 0.250479955
## Nigeria 0.378940499
## North America 0.314466352
## North Macedonia 0.683715113
## Northern Mariana Islands 0.586190945
## Norway 1.141598448
## OECD members 0.336713186
## Oman 0.413776918
## Other small states -0.560287944
## Pacific island small states -0.419627022
## Pakistan 1.178012067
## Palau 0.507388095
## Panama -1.064040118
## Papua New Guinea -1.542803135
## Paraguay -1.308855259
## Peru -0.980928543
## Philippines -0.417693447
## Poland 0.907377573
## Portugal 0.688788610
## Post-demographic dividend 0.346218254
## Pre-demographic dividend -0.260756521
## Puerto Rico 0.573711582
## Qatar 0.224126264
## Romania 0.700843001
## Russian Federation 0.371514089
## Rwanda -1.770416315
## Samoa 0.358366615
## San Marino 0.583605041
## Sao Tome and Principe -0.562343942
## Saudi Arabia -0.129714659
## Senegal -0.117831889
## Serbia 0.988274980
## Seychelles 0.586335510
## Sierra Leone 0.688862756
## Singapore 0.373064303
## Sint Maarten (Dutch part) 0.586190945
## Slovak Republic 1.330889297
## Slovenia 0.737181709
## Small states -0.444235755
## Solomon Islands -1.952007208
## Somalia -0.810146772
## South Africa -2.135850646
## South Asia -0.129643613
## South Asia (IDA & IBRD) -0.129643613
## South Sudan -1.902186720
## Spain 0.412542452
## Sri Lanka -0.281662162
## St. Kitts and Nevis 0.559463640
## St. Lucia -0.497928704
## St. Martin (French part) -0.431900302
## St. Vincent and the Grenadines 0.240898853
## Sub-Saharan Africa -0.326364007
## Sub-Saharan Africa (excluding high income) -0.326425128
## Sub-Saharan Africa (IDA & IBRD countries) -0.326364007
## Sudan -0.991866448
## Suriname -1.021303372
## Sweden 0.826477655
## Switzerland 0.583417148
## Syrian Arab Republic -0.317970857
## Tajikistan 1.037788850
## Tanzania -1.028535221
## Thailand -0.489601496
## Timor-Leste 0.039750570
## Togo -0.571379380
## Tonga -0.256525312
## Trinidad and Tobago 0.090949028
## Tunisia 0.623837993
## Turkey -0.607938503
## Turkmenistan 0.577607216
## Turks and Caicos Islands 0.417990591
## Tuvalu 0.452118712
## Uganda -1.127900527
## Ukraine 1.057440069
## United Arab Emirates 0.244735236
## United Kingdom 0.730646427
## United States 0.198425817
## Upper middle income -0.324783747
## Uruguay -0.259468252
## Uzbekistan 0.877257285
## Vanuatu -1.295507926
## Venezuela, RB -0.704418912
## Vietnam 0.394349770
## Virgin Islands (U.S.) 0.772962562
## West Bank and Gaza 0.519147512
## World -0.611312688
## Yemen, Rep. 0.871877662
## Zambia -1.424985708
## Zimbabwe -1.744006562
Ponemos los indices en una nueva data.frame.
promedio1=as.data.frame(Calidad1$scores)
names(promedio1) = c("Densidad","DesarrolloTec", "NoDesigualdad")
head(promedio1)
## Densidad DesarrolloTec NoDesigualdad
## Afghanistan -1.28872296 0.03867356 -1.3839609
## Albania 0.47328987 -1.14103981 1.1788618
## Algeria 0.63538286 -1.06618722 0.7546057
## American Samoa 0.02928735 -0.59607175 0.1280888
## Andorra 0.45131879 0.28332454 0.6831372
## Angola -1.54618516 -0.05761135 -0.2364336
promedio1$Pais=row.names(promedio1)
row.names(promedio1) = NULL
El análisis factorial exploratorio sugiere, por un lado, que los componentes ENER, EDU y Barrios Tugurios están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice. Por otro lado, los componentes ban y GAST también se encuentran correlacionados entre ellos, pues el análisis factorial sugiere que deben formar una sola dimensión. Y esto tiene sentido al ser dos variables que se relacionan con el aspecto de desarrollo tecnológico. Finalmente, la variable Gini debe ir en un solo índice como sugiere el análisis factorial. Por ello, se conservará como tal.
Para este análisis factorial usamos la data Calidad1 compuesta de las datas est1, GAST1, ban1 y DataTugurios1. Para este análisis no introducimos a la variable Gini porque en un análisis anterior (donde entraron todas las variables independientes al modelo) el índice de Gini altera el modelo y la forma como se juntan el resto de variables. Por ello optamos por añadirlo junto a los scores ya formados.
Dentro de la hipótesis de calidad de vida lo que queremos ver es que tanto porcentaje de personas no vive en barrios de tugurios. Por ello, como la variable BarriosTugurios está midiendo lo contrario, la invertimos para que calce con la hipótesis.
#Ponemos las variables en forma intuitiva restando con el mayor valor
Calidad2$BarriosTugurios= 100 - Calidad2$BarriosTugurios
Creamos una copia de la data y ponemos a los países como índice.
Calidad2_X=Calidad2
row.names(Calidad2) = Calidad2$Pais
Calidad2$Pais = NULL
head(Calidad2)
## ENER BarriosTugurios EDU GAST
## Afghanistan 48.45538 NA 31.74112 NA
## Albania 100.00000 NA 96.67697 0.15412
## Algeria 98.94692 NA 75.13605 NA
## Andorra 100.00000 NA NA NA
## Angola 33.51748 34.2 NA NA
## Antigua and Barbuda 94.22346 NA NA NA
## ban
## Afghanistan 0.003874254
## Albania 3.739381479
## Algeria 2.385431981
## Andorra 28.845289134
## Angola 0.070203059
## Antigua and Barbuda 9.959628841
Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.
Calidad2[is.na(Calidad2$BarriosTugurios), "BarriosTugurios"]=mean(Calidad2$BarriosTugurios, na.rm=T)
Calidad2[is.na(Calidad2$EDU), "EDU"]=mean(Calidad2$EDU, na.rm=T)
Calidad2[is.na(Calidad2$ENER), "ENER"]=mean(Calidad2$ENER, na.rm=T)
Calidad2[is.na(Calidad2$GAST), "GAST"]=mean(Calidad2$GAST, na.rm=T)
Calidad2[is.na(Calidad2$ban), "ban"]=mean(Calidad2$ban, na.rm=T)
Estandarizamos:
Calidad2=as.data.frame(scale(Calidad2[,c(1:5)]))
head(Calidad2)
## ENER BarriosTugurios EDU GAST
## Afghanistan -1.0591265 0.000000 -3.3708303 0.000000
## Albania 0.7089823 0.000000 1.0350593 -1.122095
## Algeria 0.6728591 0.000000 -0.4264896 0.000000
## Andorra 0.7089823 0.000000 0.0000000 0.000000
## Angola -1.5715337 -1.762928 0.0000000 0.000000
## Antigua and Barbuda 0.5108327 0.000000 0.0000000 0.000000
## ban
## Afghanistan -0.83285151
## Albania -0.49709541
## Algeria -0.61879155
## Andorra 1.75948211
## Angola -0.82688972
## Antigua and Barbuda 0.06199493
Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.
library(psych)
promedio2 = cor(Calidad2) #sacar la correlación de los puntajes estandarizadas
promedio2
## ENER BarriosTugurios EDU GAST
## ENER 1.0000000 0.50865945 0.61842801 0.19623497
## BarriosTugurios 0.5086595 1.00000000 0.38641647 0.03744230
## EDU 0.6184280 0.38641647 1.00000000 -0.01961126
## GAST 0.1962350 0.03744230 -0.01961126 1.00000000
## ban 0.5218063 0.09207125 0.28765543 0.56726309
## ban
## ENER 0.52180626
## BarriosTugurios 0.09207125
## EDU 0.28765543
## GAST 0.56726309
## ban 1.00000000
cor.plot(promedio2,
numbers=T,
upper=FALSE,
main = "Correlation",
show.legend = FALSE) #verlo en un gráfico
KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.6.
KMO(Calidad2) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = Calidad2)
## Overall MSA = 0.6
## MSA for each item =
## ENER BarriosTugurios EDU GAST
## 0.62 0.61 0.70 0.50
## ban
## 0.54
Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial. La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.
#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(Calidad2,n=nrow(Calidad2))
## R was not square, finding R from data
## $chisq
## [1] 418.9267
##
## $p.value
## [1] 8.785799e-84
##
## $df
## [1] 10
¿Cuántos índices debería crear? El R nos sugiere 2 índices.
fa.parallel(promedio2, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(Calidad2)) #cuantos indices deberia formar
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs
## = np.obs, : The estimated weights for the factor scores are probably
## incorrect. Try a different factor extraction method.
## Parallel analysis suggests that the number of factors = 2 and the number of components = NA
Calidad2 = fa(Calidad2,
nfactors=2,
rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
Calidad2$loadings
##
## Loadings:
## MR1 MR2
## ENER 0.878 0.314
## BarriosTugurios 0.570
## EDU 0.688
## GAST 0.588
## ban 0.257 0.965
##
## MR1 MR2
## SS loadings 1.636 1.381
## Proportion Var 0.327 0.276
## Cumulative Var 0.327 0.603
Se logró resumir el 60.3% de los componentes ENER, BarriosTugurios, EDU, GAST y ban.
fa.diagram(Calidad2)
MR1 junta a ENER, EDU y BarriosTugurios (justo los que explican sobre ek rol del Estado)
Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.
#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(Calidad2$communalities)
## BarriosTugurios GAST EDU ENER
## 0.3257767 0.3453905 0.4789444 0.8697739
## ban
## 0.9950000
ENER y ban son las que más aportan al modelo.
Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.
# mientras mas grande peor (lo que mantiene)
sort(Calidad2$uniquenesses)
## ban ENER EDU GAST
## 0.003056918 0.130226072 0.521055347 0.654609544
## BarriosTugurios
## 0.674223671
EDU, GAST y BarriosTugurios son las menos relevantes para el modelo, por ello son agrupadas en un índice diferente.
La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. Casi todas las variables están cerca a otro factor, de ahí que el R nos sugiriera más de 1 índice.
sort(Calidad2$complexity)
## GAST BarriosTugurios EDU ban
## 1.000052 1.002502 1.022702 1.141761
## ENER
## 1.252351
Calidad2$scores
## MR1
## Afghanistan -1.377330863
## Albania 0.950491375
## Algeria 0.604573720
## Andorra 0.204009577
## Angola -1.284084321
## Antigua and Barbuda 0.408988703
## Arab World 0.202621757
## Argentina 1.031217695
## Armenia 0.979954340
## Aruba 0.435479338
## Australia 0.197932999
## Austria 0.201088263
## Azerbaijan 0.932718798
## Bahamas, The 0.563522400
## Bahrain 0.642411553
## Bangladesh -0.926983955
## Barbados 0.359192301
## Belarus 0.707920541
## Belgium 0.099303659
## Belize 0.453707459
## Benin -1.963586052
## Bermuda -0.346170551
## Bhutan -0.199912893
## Bolivia 0.567757965
## Bosnia and Herzegovina 0.853480296
## Botswana -0.670481864
## Brazil 0.884082164
## British Virgin Islands -0.339406508
## Brunei Darussalam 0.866823099
## Bulgaria 0.730388247
## Burkina Faso -1.610298156
## Burundi -2.321758289
## Cabo Verde 0.218652861
## Cambodia -1.177003247
## Cameroon -0.703531977
## Canada 0.095611835
## Caribbean small states 0.557833094
## Cayman Islands 0.112545782
## Central African Republic -2.816112862
## Central Europe and the Baltics 0.433185610
## Chad -2.261142307
## Channel Islands 0.586329725
## Chile 0.805812490
## China 0.862702484
## Colombia 1.047609264
## Comoros -0.714718742
## Congo, Dem. Rep. -1.863548199
## Congo, Rep. -0.967331388
## Costa Rica 0.860192467
## Cote d'Ivoire -1.094544731
## Croatia 0.666265218
## Cuba 1.042226104
## Curacao 0.334040430
## Cyprus 0.586479054
## Czech Republic 0.319342870
## Denmark -0.090713262
## Djibouti -0.565529713
## Dominica 0.400504649
## Dominican Republic 1.030369071
## Early-demographic dividend 0.186699461
## East Asia & Pacific 0.703838558
## East Asia & Pacific (excluding high income) 0.775468852
## East Asia & Pacific (IDA & IBRD countries) 0.798429752
## Ecuador 0.809731376
## Egypt, Arab Rep. 0.931450237
## El Salvador 0.577140972
## Equatorial Guinea -0.212350998
## Eritrea -1.171906082
## Estonia 0.486346426
## Eswatini -0.679298673
## Ethiopia -1.594889032
## Euro area 0.402174844
## Europe & Central Asia 0.582367994
## Europe & Central Asia (excluding high income) 0.827158700
## Europe & Central Asia (IDA & IBRD countries) 0.816946189
## European Union 0.436313333
## Faroe Islands 0.129421088
## Fiji 0.429812042
## Finland 0.021471456
## Fragile and conflict affected situations -1.150910645
## France 0.036055209
## French Polynesia 0.525202090
## Gabon 0.383110633
## Gambia, The -0.876619917
## Georgia 0.646707377
## Germany 0.034425268
## Ghana -0.291092528
## Gibraltar 0.137258357
## Greece 0.608568801
## Greenland 0.352176247
## Grenada 0.224584586
## Guam 0.731809297
## Guatemala 0.366503263
## Guinea -2.116866037
## Guinea-Bissau -1.822072232
## Guyana 0.326336778
## Haiti -1.244912366
## Heavily indebted poor countries (HIPC) -1.767177585
## High income 0.176690871
## Honduras 0.249249163
## Hong Kong SAR, China 0.183118098
## Hungary 0.336185769
## IBRD only 0.625999012
## Iceland -0.001109328
## IDA & IBRD total 0.240211912
## IDA blend -0.401454380
## IDA only -1.463007982
## IDA total -1.094957138
## India 0.006042714
## Indonesia 0.998484290
## Iran, Islamic Rep. 0.762619197
## Iraq 0.724188741
## Ireland 0.299916357
## Isle of Man 0.586329725
## Israel 0.099739121
## Italy 0.571505241
## Jamaica 0.466003657
## Japan 0.113520296
## Jordan 1.144735440
## Kazakhstan 0.948131340
## Kenya -1.411079091
## Kiribati -0.118545894
## Korea, Dem. People’s Rep. -1.190214037
## Korea, Rep. -0.061883004
## Kosovo -0.007270755
## Kuwait 0.969430973
## Kyrgyz Republic 1.031886519
## Lao PDR -0.402676447
## Late-demographic dividend 0.872365406
## Latin America & Caribbean 0.673874041
## Latin America & Caribbean (excluding high income) 0.667169244
## Latin America & the Caribbean (IDA & IBRD countries) 0.666469625
## Latvia 0.628090372
## Least developed countries: UN classification -1.636435408
## Lebanon 0.768319904
## Lesotho -1.614869097
## Liberia -2.133409124
## Libya 0.706442539
## Liechtenstein -0.044058331
## Lithuania 0.598994628
## Low & middle income 0.223286461
## Low income -1.791311259
## Lower middle income 0.024980366
## Luxembourg 0.111993246
## Macao SAR, China 0.534542432
## Madagascar -1.992600857
## Malawi -2.315971021
## Malaysia 0.761305215
## Maldives 0.617984904
## Mali -2.183982785
## Malta 0.383582798
## Marshall Islands 0.376550565
## Mauritania -1.144651991
## Mauritius 0.752944649
## Mexico 0.756750157
## Micronesia, Fed. Sts. -0.264435017
## Middle East & North Africa 0.533146026
## Middle East & North Africa (excluding high income) 0.538272408
## Middle East & North Africa (IDA & IBRD countries) 0.534144610
## Middle income 0.437402474
## Moldova 0.907991474
## Monaco 0.003233212
## Mongolia 0.335830420
## Montenegro 0.832683446
## Morocco 0.512991177
## Mozambique -2.262550446
## Myanmar -0.617424342
## Namibia -0.532763168
## Nauru 0.558455342
## Nepal -0.497487108
## Netherlands -0.020284823
## New Caledonia 0.476823871
## New Zealand 0.259010941
## Nicaragua 0.172244424
## Niger -2.700544803
## Nigeria -1.150985722
## North America 0.118450557
## North Macedonia 0.557243888
## Northern Mariana Islands 0.586329725
## Norway 0.036377181
## OECD members 0.197394953
## Oman 0.846569563
## Other small states -0.327899607
## Pacific island small states -0.150826870
## Pakistan 0.162301595
## Palau 0.684912280
## Panama 0.513688145
## Papua New Guinea -1.811642255
## Paraguay 0.888507517
## Peru 0.581482192
## Philippines 0.582268253
## Poland 0.713895967
## Portugal 0.534092705
## Post-demographic dividend 0.155170493
## Pre-demographic dividend -1.604953272
## Puerto Rico 0.668475868
## Qatar 0.807323285
## Romania 0.740125801
## Russian Federation 0.799297674
## Rwanda -2.109260450
## Samoa 0.915524539
## San Marino 0.357579554
## Sao Tome and Principe -0.431159873
## Saudi Arabia 0.667211497
## Senegal -0.854951055
## Serbia 0.781839628
## Seychelles 0.718378044
## Sierra Leone -1.870931154
## Singapore 0.393804833
## Sint Maarten (Dutch part) 0.586329725
## Slovak Republic 0.479245013
## Slovenia 0.247051739
## Small states -0.139300241
## Solomon Islands -1.214688694
## Somalia -1.729333218
## South Africa 0.649135712
## South Asia -0.099795697
## South Asia (IDA & IBRD) -0.099795697
## South Sudan -2.737857651
## Spain 0.529035318
## Sri Lanka 0.512746416
## St. Kitts and Nevis 0.216054689
## St. Lucia 0.376345892
## St. Martin (French part) -0.415175900
## St. Vincent and the Grenadines 0.360231636
## Sub-Saharan Africa -1.509636418
## Sub-Saharan Africa (excluding high income) -1.509869506
## Sub-Saharan Africa (IDA & IBRD countries) -1.509636418
## Sudan -1.481419341
## Suriname 0.618456102
## Sweden -0.001361372
## Switzerland -0.078168490
## Syrian Arab Republic 0.624526171
## Tajikistan 0.795584416
## Tanzania -1.917651602
## Thailand 1.046195553
## Timor-Leste -1.113921209
## Togo -1.350157109
## Tonga 0.763436426
## Trinidad and Tobago 0.813399705
## Tunisia 0.656312179
## Turkey 1.032862777
## Turkmenistan 0.763126469
## Turks and Caicos Islands 0.412159281
## Tuvalu 0.628698018
## Uganda -1.894678543
## Ukraine 0.912624168
## United Arab Emirates 0.608907194
## United Kingdom 0.126554451
## United States 0.121178194
## Upper middle income 0.892369454
## Uruguay 0.773677139
## Uzbekistan 0.801762657
## Vanuatu -1.037167058
## Venezuela, RB 0.857118087
## Vietnam 0.934133282
## Virgin Islands (U.S.) 0.611327090
## West Bank and Gaza 0.899095741
## World 0.232848878
## Yemen, Rep. -0.285153467
## Zambia -1.435602486
## Zimbabwe -0.777274576
## MR2
## Afghanistan -0.253587060
## Albania -0.820002466
## Algeria -0.751228096
## Andorra 1.806943944
## Angola -0.664141776
## Antigua and Barbuda -0.028293050
## Arab World -0.639164795
## Argentina -0.161874162
## Armenia -0.860115543
## Aruba 0.681295264
## Australia 1.389119396
## Austria 1.261886593
## Azerbaijan -0.575084494
## Bahamas, The -0.093261077
## Bahrain 0.374214018
## Bangladesh -0.566797736
## Barbados 1.019041419
## Belarus 0.424637148
## Belgium 1.973482533
## Belize -0.717151979
## Benin -0.205510883
## Bermuda 4.816667570
## Bhutan -0.567428387
## Bolivia -0.972043784
## Bosnia and Herzegovina -0.253947759
## Botswana -0.643128629
## Brazil -0.351452232
## British Virgin Islands 1.723253964
## Brunei Darussalam -0.672866814
## Bulgaria 0.280510399
## Burkina Faso -0.486283280
## Burundi -0.122622652
## Cabo Verde -0.650912099
## Cambodia -0.555437632
## Cameroon -0.647050952
## Canada 2.068517657
## Caribbean small states -0.422042407
## Cayman Islands 2.271329106
## Central African Republic -0.179778403
## Central Europe and the Baltics 0.649666705
## Chad -0.548577040
## Channel Islands -0.134193587
## Chile -0.146265062
## China -0.198180716
## Colombia -0.459092671
## Comoros -0.508327606
## Congo, Dem. Rep. -0.461974040
## Congo, Rep. -0.655361163
## Costa Rica -0.520295296
## Cote d'Ivoire -0.412443017
## Croatia 0.568896607
## Cuba -1.217949644
## Curacao 1.146743926
## Cyprus 1.060695525
## Czech Republic 1.057007458
## Denmark 2.667963096
## Djibouti -0.656066416
## Dominica 0.074289966
## Dominican Republic -0.665387643
## Early-demographic dividend -0.635542009
## East Asia & Pacific -0.166139392
## East Asia & Pacific (excluding high income) -0.375688498
## East Asia & Pacific (IDA & IBRD countries) -0.380523776
## Ecuador -0.851417036
## Egypt, Arab Rep. -0.707018688
## El Salvador -0.736489107
## Equatorial Guinea -0.820793567
## Eritrea -0.505232434
## Estonia 1.232062717
## Eswatini -0.705689475
## Ethiopia -0.633779529
## Euro area 1.503087101
## Europe & Central Asia 0.640136175
## Europe & Central Asia (excluding high income) -0.353494744
## Europe & Central Asia (IDA & IBRD countries) -0.285838170
## European Union 1.366163591
## Faroe Islands 2.185648845
## Fiji -0.787089319
## Finland 1.883247250
## Fragile and conflict affected situations -0.473760866
## France 2.264221947
## French Polynesia 0.176167106
## Gabon -0.940735143
## Gambia, The -0.657038821
## Georgia -0.502659828
## Germany 2.093858828
## Ghana -0.688652391
## Gibraltar 2.145857019
## Greece 0.696281563
## Greenland 1.054663727
## Grenada 0.271559890
## Guam -0.872830716
## Guatemala -0.758893240
## Guinea -0.044220219
## Guinea-Bissau -0.454848978
## Guyana -0.725507169
## Haiti -0.699553556
## Heavily indebted poor countries (HIPC) -0.372884948
## High income 1.473228219
## Honduras -0.912766320
## Hong Kong SAR, China 1.970658173
## Hungary 1.066466290
## IBRD only -0.458960704
## Iceland 2.334822620
## IDA & IBRD total -0.468406108
## IDA blend -0.717046278
## IDA only -0.463925811
## IDA total -0.547426428
## India -0.641442921
## Indonesia -0.963440904
## Iran, Islamic Rep. -0.862011541
## Iraq -1.051810959
## Ireland 1.123969837
## Isle of Man -0.134193587
## Israel 1.326989623
## Italy 0.899680576
## Jamaica -0.602977186
## Japan 1.537109574
## Jordan -0.759663178
## Kazakhstan -0.666378976
## Kenya -0.581696018
## Kiribati -0.777869435
## Korea, Dem. People’s Rep. 0.157014115
## Korea, Rep. 2.333497814
## Kosovo 0.001664061
## Kuwait -1.022585272
## Kyrgyz Republic -1.155932089
## Lao PDR -0.633710495
## Late-demographic dividend -0.249342498
## Latin America & Caribbean -0.447997594
## Latin America & Caribbean (excluding high income) -0.492271420
## Latin America & the Caribbean (IDA & IBRD countries) -0.438275878
## Latvia 0.870219018
## Least developed countries: UN classification -0.425293973
## Lebanon -0.484953836
## Lesotho -0.482055956
## Liberia -0.487427717
## Libya -0.941193669
## Liechtenstein 3.066448387
## Lithuania 0.937712872
## Low & middle income -0.481625102
## Low income -0.384392512
## Lower middle income -0.674282548
## Luxembourg 2.088958393
## Macao SAR, China 1.259039423
## Madagascar -0.452244532
## Malawi -0.323209455
## Malaysia -0.429980774
## Maldives -0.594353196
## Mali -0.148985808
## Malta 1.704249038
## Marshall Islands -0.190806557
## Mauritania -0.599407030
## Mauritius -0.365596292
## Mexico -0.273592591
## Micronesia, Fed. Sts. -0.726059864
## Middle East & North Africa -0.699270330
## Middle East & North Africa (excluding high income) -0.771020651
## Middle East & North Africa (IDA & IBRD countries) -0.769403555
## Middle income -0.497000850
## Moldova -0.560670546
## Monaco 2.826337084
## Mongolia -0.801579322
## Montenegro -0.202399262
## Morocco -0.553176858
## Mozambique -0.302058421
## Myanmar -0.732784209
## Namibia -0.676231395
## Nauru -0.108268118
## Nepal -0.636416037
## Netherlands 2.674905142
## New Caledonia 0.421795746
## New Zealand 1.426431617
## Nicaragua -0.774455194
## Niger -0.102880992
## Nigeria -0.494484040
## North America 1.690402297
## North Macedonia 0.166907865
## Northern Mariana Islands -0.134193587
## Norway 2.433102142
## OECD members 1.364208136
## Oman -0.895756547
## Other small states -0.292832845
## Pacific island small states -0.736063195
## Pakistan -0.697068821
## Palau -0.859265268
## Panama -0.401489164
## Papua New Guinea -0.332056025
## Paraguay -1.008282911
## Peru -0.740392505
## Philippines -0.884998051
## Poland 0.326942844
## Portugal 0.743421173
## Post-demographic dividend 1.569307286
## Pre-demographic dividend -0.415939432
## Puerto Rico 0.233564644
## Qatar -0.335584516
## Romania 0.259363853
## Russian Federation -0.167085188
## Rwanda -0.385803854
## Samoa -1.175614995
## San Marino 1.027229749
## Sao Tome and Principe -0.738262493
## Saudi Arabia -0.429779229
## Senegal -0.391058998
## Serbia -0.126954247
## Seychelles -0.402048045
## Sierra Leone 0.428200978
## Singapore 1.332486331
## Sint Maarten (Dutch part) -0.134193587
## Slovak Republic 0.509518156
## Slovenia 1.216552499
## Small states -0.346266477
## Solomon Islands -0.561910335
## Somalia -0.575123936
## South Africa -0.852635006
## South Asia -0.627574402
## South Asia (IDA & IBRD) -0.627574402
## South Sudan 0.087935795
## Spain 1.014615036
## Sri Lanka -0.923862389
## St. Kitts and Nevis 1.438850236
## St. Lucia 0.139200305
## St. Martin (French part) 0.095021522
## St. Vincent and the Grenadines 0.083622377
## Sub-Saharan Africa -0.426509093
## Sub-Saharan Africa (excluding high income) -0.426510689
## Sub-Saharan Africa (IDA & IBRD countries) -0.426509093
## Sudan -0.358459926
## Suriname -0.803429691
## Sweden 2.086815652
## Switzerland 2.599001453
## Syrian Arab Republic -0.976780987
## Tajikistan -1.036945275
## Tanzania -0.447691586
## Thailand -0.644741956
## Timor-Leste -0.475574389
## Togo -0.382852984
## Tonga -1.061948716
## Trinidad and Tobago -0.082560007
## Tunisia -0.624435259
## Turkey -0.120290779
## Turkmenistan -1.051063444
## Turks and Caicos Islands -0.094331107
## Tuvalu -0.747612951
## Uganda -0.427928552
## Ukraine -0.649126020
## United Arab Emirates -0.111665277
## United Kingdom 1.969030540
## United States 1.648144795
## Upper middle income -0.297473668
## Uruguay -0.027181200
## Uzbekistan -1.004148087
## Vanuatu -0.625606841
## Venezuela, RB -0.621641703
## Vietnam -0.723424473
## Virgin Islands (U.S.) -0.261111624
## West Bank and Gaza -0.770972653
## World -0.161697970
## Yemen, Rep. -0.777899021
## Zambia -0.585572199
## Zimbabwe -0.581057220
Ponemos los índices en una nueva data.frame.
promedio2=as.data.frame(Calidad2$scores)
names(promedio2) = c("Densidad", "DesarrolloTec")
head(promedio2)
## Densidad DesarrolloTec
## Afghanistan -1.3773309 -0.25358706
## Albania 0.9504914 -0.82000247
## Algeria 0.6045737 -0.75122810
## Andorra 0.2040096 1.80694394
## Angola -1.2840843 -0.66414178
## Antigua and Barbuda 0.4089887 -0.02829305
promedio2$Pais=row.names(promedio2)
row.names(promedio2) = NULL
head(promedio2)
## Densidad DesarrolloTec Pais
## 1 -1.3773309 -0.25358706 Afghanistan
## 2 0.9504914 -0.82000247 Albania
## 3 0.6045737 -0.75122810 Algeria
## 4 0.2040096 1.80694394 Andorra
## 5 -1.2840843 -0.66414178 Angola
## 6 0.4089887 -0.02829305 Antigua and Barbuda
El análisis factorial exploratorio sugiere, por un lado, que los componentes ENER, EDU y Barrios Tugurios están efectivamente correlacionados, por lo cual es correcto juntarlos en un solo índice. Por otro lado, los componentes ban y GAST también se encuentran correlacionados entre ellos, pues el análisis factorial sugiere que deben formar una sola dimensión. Y esto tiene sentido al ser dos variables que se relacionan con el aspecto de desarrollo tecnológico.
Para este análisis factorial usamos la data salud2 compuesta por las variables VidaM y CobRet.
Creamos una copia de la data y ponemos a los países como índice.
salud1_X=salud1
row.names(salud1) = salud1$Pais
salud1$Pais = NULL
head(salud1)
## VidaM CobARet
## Afghanistan 59.71540 NA
## Albania 78.16240 6.2
## Algeria 74.10120 14.6
## Angola 55.38620 1.4
## Antigua and Barbuda 76.90380 NA
## Arab World 70.78677 NA
Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.
salud1[is.na(salud1$VidaM), "VidaM"]=mean(salud1$VidaM, na.rm=T)
salud1[is.na(salud1$CobARet), "CobARet"]=mean(salud1$CobARet, na.rm=T)
Estandarizamos:
salud1=as.data.frame(scale(salud1[,c(1,2)]))
head(salud1)
## VidaM CobARet
## Afghanistan -1.133702486 0.00000000
## Albania 0.739051823 -0.64026360
## Algeria 0.326755526 -0.05502504
## Angola -1.573206359 -0.97468563
## Antigua and Barbuda 0.611277737 0.00000000
## Arab World -0.009727659 0.00000000
Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.
library(psych)
puntaje1 = cor(salud1) #sacar la correlación de los puntajes estandarizadas
puntaje1
## VidaM CobARet
## VidaM 1.0000000 0.4826546
## CobARet 0.4826546 1.0000000
cor.plot(puntaje1,
numbers=T,
upper=FALSE,
main = "Correlation",
show.legend = FALSE) #verlo en un gráfico
KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.5
KMO(salud1) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = salud1)
## Overall MSA = 0.5
## MSA for each item =
## VidaM CobARet
## 0.5 0.5
Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial. La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.
#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(salud1,n=nrow(salud1))
## R was not square, finding R from data
## $chisq
## [1] 65.10916
##
## $p.value
## [1] 7.086207e-16
##
## $df
## [1] 1
¿Cuántos índices debería crear? El R nos sugiere 1 índice.
fa.parallel(puntaje1, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(salud1)) #cuantos indices deberia formar
## Parallel analysis suggests that the number of factors = 1 and the number of components = NA
salud1 = fa(salud1,
nfactors=1,
rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
salud1$loadings
##
## Loadings:
## MR1
## VidaM 0.695
## CobARet 0.695
##
## MR1
## SS loadings 0.965
## Proportion Var 0.483
El índice logra resumir el 48.3% de los componentes VidaM y CobARet.
fa.diagram(salud1)
MR1 junta a ambos componentes.
Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor.
#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(salud1$communalities)
## VidaM CobARet
## 0.4826546 0.4826546
Ambos componentes aportan de igual forma al factorial.
Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial.
# mientras mas grande peor (lo que mantiene)
sort(salud1$uniquenesses)
## VidaM CobARet
## 0.5173454 0.5173454
Ambos componentes tienen menor relevancia para el análisis factorial.
La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. En este caso, ninguna variable está cerca a otro factor.
sort(salud1$complexity)
## VidaM CobARet
## 1 1
salud1$scores
## MR1
## Afghanistan -0.531223568
## Albania 0.046289599
## Algeria 0.127325856
## Angola -1.193876075
## Antigua and Barbuda 0.286428886
## Arab World -0.004558128
## Argentina 1.136605835
## Armenia -0.250722761
## Aruba 0.277495237
## Australia 1.816622019
## Austria 1.746740690
## Azerbaijan -0.446383479
## Bahamas, The 0.435434166
## Bahrain 0.263627063
## Bangladesh -0.594973180
## Barbados 0.976052458
## Belarus -0.037640984
## Belgium 0.526952398
## Belize -0.084709744
## Benin -1.077452549
## Bermuda 0.499361789
## Bhutan -0.279283252
## Bolivia -0.678960846
## Bosnia and Herzegovina 0.329260928
## Botswana -0.695994685
## Brazil 0.825928745
## Brunei Darussalam 0.337909157
## Bulgaria 0.492009979
## Burkina Faso -1.065722512
## Burundi -1.079721209
## Cabo Verde -0.195891973
## Cambodia -0.248401824
## Cameroon -1.165292105
## Canada 0.554543007
## Caribbean small states 0.153951841
## Central African Republic -1.648226807
## Central Europe and the Baltics 0.336295082
## Chad -1.441149955
## Channel Islands 0.487478799
## Chile 2.008619424
## China 0.221505329
## Colombia -0.048372110
## Comoros -0.868593956
## Congo, Dem. Rep. -1.188587936
## Congo, Rep. -1.110690571
## Costa Rica 0.745081791
## Cote d'Ivoire -1.347554179
## Croatia 0.383481231
## Cuba 0.679105473
## Curacao 0.374252648
## Cyprus 1.123172427
## Czech Republic 1.442572154
## Denmark 1.516128510
## Djibouti -0.950432434
## Dominican Republic -0.219300325
## Early-demographic dividend -0.150445711
## East Asia & Pacific 0.213396793
## East Asia & Pacific (excluding high income) 0.160686354
## East Asia & Pacific (IDA & IBRD countries) 0.162369841
## Ecuador -0.045767225
## Egypt, Arab Rep. -0.405086485
## El Salvador 0.176765861
## Equatorial Guinea -1.152752955
## Eritrea -0.832730127
## Estonia 0.093521685
## Eswatini -1.289354093
## Ethiopia -0.991857074
## Euro area 0.557465684
## Europe & Central Asia 0.348775182
## Europe & Central Asia (excluding high income) 0.136991308
## Europe & Central Asia (IDA & IBRD countries) 0.162594996
## European Union 0.506593020
## Faroe Islands 0.526000998
## Fiji 0.021397302
## Finland 0.548834605
## Fragile and conflict affected situations -0.522476279
## France 2.233242721
## French Polynesia 0.281196184
## Gabon -0.621277868
## Gambia, The -1.015193583
## Georgia -0.086135140
## Germany 2.014868172
## Ghana -0.991006365
## Greece 1.522321820
## Greenland 0.043545901
## Grenada 0.139171146
## Guam 0.406923735
## Guatemala 0.058762705
## Guinea -1.228136671
## Guinea-Bissau -1.264182912
## Guyana 0.030613334
## Haiti -0.788298757
## Heavily indebted poor countries (HIPC) -0.671600820
## High income 0.509147448
## Honduras 0.049510519
## Hong Kong SAR, China 0.668711044
## Hungary 0.944261599
## IBRD only 0.053640720
## Iceland 0.581182216
## IDA & IBRD total -0.078103905
## IDA blend -0.607383275
## IDA only -0.489339559
## IDA total -0.527963387
## India -0.701492628
## Indonesia -0.562927395
## Iran, Islamic Rep. -0.358385842
## Iraq 0.008334576
## Ireland 1.857774963
## Israel 0.541223403
## Italy 1.484023077
## Jamaica -0.118597895
## Japan 1.871170737
## Jordan 0.157533172
## Kazakhstan -0.388250968
## Kenya -0.951841847
## Kiribati -0.144555454
## Korea, Dem. People’s Rep. 0.034288776
## Korea, Rep. 0.511729993
## Kosovo 0.003682228
## Kuwait 2.062804848
## Kyrgyz Republic -0.423014465
## Lao PDR -0.707901162
## Late-demographic dividend 0.223937384
## Latin America & Caribbean 0.256480255
## Latin America & Caribbean (excluding high income) 0.237142353
## Latin America & the Caribbean (IDA & IBRD countries) 0.250725234
## Latvia 0.286248120
## Least developed countries: UN classification -0.519093785
## Lebanon 0.429039473
## Lesotho -1.408489722
## Liberia -1.177488693
## Libya 0.130580001
## Liechtenstein 0.600210222
## Lithuania -0.012289095
## Low & middle income -0.086007665
## Low income -0.605906529
## Lower middle income -0.236671017
## Luxembourg 1.805112027
## Macao SAR, China 0.636116069
## Madagascar -0.887243354
## Malawi -1.266635266
## Malaysia 0.011518846
## Maldives 0.224378558
## Mali -1.194080502
## Malta 0.506021591
## Mauritania -0.830770549
## Mauritius 0.237155864
## Mexico 0.641142284
## Micronesia, Fed. Sts. -0.106309162
## Middle East & North Africa 0.099066974
## Middle East & North Africa (excluding high income) 0.078120053
## Middle East & North Africa (IDA & IBRD countries) 0.077658702
## Middle income -0.027404434
## Moldova -0.357086387
## Mongolia -0.505037002
## Montenegro 0.593335394
## Morocco -0.157634214
## Mozambique -1.278797091
## Myanmar -0.694994564
## Namibia -0.848907283
## Nepal -0.653252364
## Netherlands 1.679844135
## New Caledonia 0.387096553
## New Zealand 1.470218565
## Nicaragua -0.233348239
## Niger -1.237056537
## Nigeria -1.436488093
## North America 0.452428819
## North Macedonia 0.013030596
## Norway 2.579758332
## OECD members 0.491026088
## Oman 0.271177939
## Other small states -0.364012688
## Pacific island small states -0.017075781
## Pakistan -0.707142970
## Palau 0.057912046
## Panama 0.430264157
## Papua New Guinea -0.642356878
## Paraguay -0.263644117
## Peru -0.109136401
## Philippines -0.419045173
## Poland 0.403270358
## Portugal 1.121744350
## Post-demographic dividend 0.507833903
## Pre-demographic dividend -0.760460376
## Puerto Rico 0.549405445
## Qatar 1.609931278
## Romania 2.189087140
## Russian Federation -0.299733353
## Rwanda -0.845681366
## Samoa 0.170472216
## Sao Tome and Principe -0.209773945
## Saudi Arabia 0.183972587
## Senegal -0.792198828
## Serbia 1.342320787
## Seychelles 0.271025715
## Sierra Leone -1.716780444
## Singapore 0.178774408
## Sint Maarten (Dutch part) 0.286248120
## Slovak Republic 1.040259842
## Slovenia 0.920420235
## Small states -0.232259117
## Solomon Islands -0.162213444
## Somalia -1.293614968
## South Africa -1.110207003
## South Asia -0.241991799
## South Asia (IDA & IBRD) -0.241991799
## South Sudan -1.387028696
## Spain 1.694730622
## Sri Lanka -0.146130080
## St. Lucia 0.210706935
## St. Martin (French part) 0.490799186
## St. Vincent and the Grenadines 0.129229013
## Sub-Saharan Africa -0.777661864
## Sub-Saharan Africa (excluding high income) -0.777775639
## Sub-Saharan Africa (IDA & IBRD countries) -0.777661864
## Sudan -0.912118204
## Suriname -0.104952250
## Sweden 0.565008410
## Switzerland 0.614481226
## Syrian Arab Republic 0.276610435
## Tajikistan -0.501243844
## Tanzania -1.014317989
## Thailand 0.242204151
## Timor-Leste -0.256877774
## Togo -1.120817739
## Tonga 0.154545775
## Trinidad and Tobago 0.107926134
## Tunisia 0.356074937
## Turkey 0.241798697
## Turkmenistan -0.094644994
## Uganda -1.040429046
## Ukraine -0.304992281
## United Arab Emirates 0.282804051
## United Kingdom 0.489847786
## United States 0.441326370
## Upper middle income 0.190969536
## Uruguay 0.572336401
## Uzbekistan -0.448759358
## Vanuatu 0.016278768
## Venezuela, RB 0.314019495
## Vietnam -0.021868355
## Virgin Islands (U.S.) 0.479382383
## West Bank and Gaza 0.120485644
## World -0.239476561
## Yemen, Rep. -0.362502237
## Zambia -1.163770229
## Zimbabwe -1.545252176
Ponemos el índice en una nueva data.frame.
puntaje1=as.data.frame(salud1$scores)
names(puntaje1) = c("Salud")
head(puntaje1)
## Salud
## Afghanistan -0.531223568
## Albania 0.046289599
## Algeria 0.127325856
## Angola -1.193876075
## Antigua and Barbuda 0.286428886
## Arab World -0.004558128
puntaje1$Pais=row.names(puntaje1)
row.names(puntaje1) = NULL
El análisis factorial exploratorio sugiere que los componentes Esperanza de vida en mujeres y Cobertura del tratamiento antirretroviral están efectivamente correlacionados, por cual es correcto juntarlos en un solo índice.
Para este análisis factorial usamos la data salud2 compuesta por las variables VidaM y CobRet.
Creamos una copia de la data y ponemos a los países como índice.
salud2_X=salud2
row.names(salud2) = salud2$Pais
salud2$Pais = NULL
head(salud2)
## VidaM CobARet
## Afghanistan 62.44780 NA
## Albania 79.21420 18.0
## Algeria 75.89040 28.8
## Angola 60.80120 9.8
## Antigua and Barbuda 77.79520 NA
## Arab World 71.90649 NA
Es necesario que imputemos para no perder demasiados datos. En este caso, imputamos con la media.
salud2[is.na(salud2$VidaM), "VidaM"]=mean(salud2$VidaM, na.rm=T)
salud2[is.na(salud2$CobARet), "CobARet"]=mean(salud2$CobARet, na.rm=T)
Estandarizamos:
salud2=as.data.frame(scale(salud2[,c(1,2)]))
head(salud2)
## VidaM CobARet
## Afghanistan -1.1656446 0.0000000
## Albania 0.7174271 -0.7262289
## Algeria 0.3441237 0.0631689
## Angola -1.3505779 -1.3255865
## Antigua and Barbuda 0.5580561 0.0000000
## Arab World -0.1033177 0.0000000
Activamos el paquete que utilizaremos para el análisis y sacamos la correlación de los componentes estandarizados.
library(psych)
puntaje2 = cor(salud2) #sacar la correlación de los puntajes estandarizadas
puntaje2
## VidaM CobARet
## VidaM 1.0000000 0.3953312
## CobARet 0.3953312 1.0000000
cor.plot(puntaje2,
numbers=T,
upper=FALSE,
main = "Correlation",
show.legend = FALSE) #verlo en un gráfico
KMO (medida de adecuación muestral). Nos indica qué tan apropiado es juntar nuestros indicadores. Mientras más cercano a uno, mejor. Nos fijamos en el Overall MSA: sale 0.5.
KMO(salud2) #Que tan buena idea es juntarlos en un indice. ver el Overall MSA(más cercano a 1)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = salud2)
## Overall MSA = 0.5
## MSA for each item =
## VidaM CobARet
## 0.5 0.5
Prueba de esfericidad de bartlett: Cuando la matriz de correlación es igual a la matriz de identidad. No se quiere eso porque la asociación sería muy débil. Si Sig. (p-valor) < 0.05 rechazamos H0 (hipótesis nula) > se puede aplicar el análisis factorial. Si Sig. (p-valor) > 0.05 no rechazamos H0 > no se puede aplicar el análisis factorial. La significancia del test de bartlett resulta ser menor a 0.05, por lo que sí podemos aplicar el análisis factorial.
#Prueba de esfericidad de bartlett
library(psych)
cortest.bartlett(salud2,n=nrow(salud2))
## R was not square, finding R from data
## $chisq
## [1] 41.89086
##
## $p.value
## [1] 9.651291e-11
##
## $df
## [1] 1
¿Cuántos índices debería crear? El R nos sugiere 1 índice.
fa.parallel(puntaje2, fm="pa", fa="fa", main = "Scree Plot",n.obs = nrow(salud2)) #cuantos indices deberia formar
## Parallel analysis suggests that the number of factors = 1 and the number of components = NA
salud2 = fa(salud2,
nfactors=1,
rotate="varimax") #codigo para el analisis factorial solo cambiar la data y el numero de factores
salud2$loadings
##
## Loadings:
## MR1
## VidaM 0.629
## CobARet 0.629
##
## MR1
## SS loadings 0.791
## Proportion Var 0.395
El modelo resume el 39.5% de los componentes VidaM y CobARet para este segundo periodo.
fa.diagram(salud2)
El MR1 junta a ambos componentes.
Una comunatity es la medida en que un elemento se correlaciona con todos los demás elementos. Las communalities más altas son mejores. Si las communalities para una variable en particular son bajas (entre 0.0-0.4), entonces esa variable puede tener dificultades para cargar significativamente en cualquier factor. En este caso, ninguno de los componentes aporta mucho.
#Para ver el tipo de análisis factorial:
# mientras mas grande mejor (lo que aporta)
sort(salud2$communalities)
## VidaM CobARet
## 0.3953312 0.3953312
Uniqueness es la varianza que es “única” a la variable y no se comparte con otras variables. Es igual a 1 - comunality (varianza que se comparte con otras variables). Cuanto mayor sea la “uniqueness”, menor será la relevancia de la variable en el modelo factorial. Es posible afirmar que en este caso, ninguno de los componentes tiene mayor relevancia para el modelo.
# mientras mas grande peor (lo que mantiene)
sort(salud2$uniquenesses)
## VidaM CobARet
## 0.6046688 0.6046688
La variable que está cerca a otro factor (mayor a 1). Cercanía a factores, mientras más grande, menos cercano a los factores. Nigún componente está cerca a otro factor en este caso.
sort(salud2$complexity)
## VidaM CobARet
## 1 1
salud2$scores
## MR1
## Afghanistan -0.525254033
## Albania -0.003966211
## Algeria 0.183531157
## Angola -1.205913178
## Antigua and Barbuda 0.251467044
## Arab World -0.046556236
## Argentina 1.113839189
## Armenia -0.493835927
## Aruba 0.232539168
## Australia 1.668689360
## Austria 1.766518457
## Azerbaijan -0.489522683
## Bahamas, The 0.242197633
## Bahrain 0.164941789
## Bangladesh -0.835551393
## Barbados 0.702308356
## Belarus 0.114545236
## Belgium 0.512853925
## Belize -0.150894145
## Benin -0.440830430
## Bermuda 0.531680583
## Bhutan -0.249382772
## Bolivia -0.873357083
## Bosnia and Herzegovina 0.284150526
## Botswana 0.171549232
## Brazil 0.565174203
## Brunei Darussalam 0.284201136
## Bulgaria 0.091200473
## Burkina Faso -0.670685296
## Burundi -0.847462831
## Cabo Verde 0.012044930
## Cambodia 0.623487436
## Cameroon -1.171192539
## Canada 0.537146387
## Caribbean small states 0.113243573
## Cayman Islands 0.600914097
## Central African Republic -1.759328051
## Central Europe and the Baltics 0.329657888
## Chad -1.111819538
## Channel Islands 0.468186163
## Chile 1.696529561
## China 0.202021764
## Colombia -0.154708810
## Comoros -1.108943528
## Congo, Dem. Rep. -1.346127167
## Congo, Rep. -0.932693059
## Costa Rica 0.804023461
## Cote d'Ivoire -1.358032295
## Croatia 0.350904185
## Cuba 0.688019445
## Curacao 0.370641810
## Cyprus 0.698208218
## Czech Republic 1.187016106
## Denmark 1.579167337
## Djibouti -1.136876101
## Dominican Republic -0.175246244
## Early-demographic dividend -0.156507262
## East Asia & Pacific 0.188080249
## East Asia & Pacific (excluding high income) 0.133967444
## East Asia & Pacific (IDA & IBRD countries) 0.135679689
## Ecuador 0.103322520
## Egypt, Arab Rep. -0.686768677
## El Salvador 0.511151781
## Equatorial Guinea -1.369142395
## Eritrea -0.315059970
## Estonia 0.681322714
## Eswatini -0.748431840
## Ethiopia -0.359709550
## Euro area 0.553190188
## Europe & Central Asia 0.344983535
## Europe & Central Asia (excluding high income) 0.135216023
## Europe & Central Asia (IDA & IBRD countries) 0.159348217
## European Union 0.502147007
## Faroe Islands 0.523987970
## Fiji -0.020962785
## Finland 0.533097643
## Fragile and conflict affected situations -0.539849697
## France 2.000510738
## French Polynesia 0.263299497
## Gabon -0.508556573
## Gambia, The -1.152878942
## Georgia -0.228357151
## Germany 1.715893041
## Ghana -1.005406067
## Greece 1.251217360
## Greenland 0.021943774
## Grenada 0.110854182
## Guam 0.410400471
## Guatemala 0.181174461
## Guinea -1.100175699
## Guinea-Bissau -1.385799035
## Guyana 0.393568629
## Haiti -0.628226762
## Heavily indebted poor countries (HIPC) -0.626624262
## High income 0.491239739
## Honduras 0.181340532
## Hong Kong SAR, China 0.671767108
## Hungary 0.658155294
## IBRD only 0.037009168
## Iceland 0.561438848
## IDA & IBRD total -0.094607364
## IDA blend -0.619924032
## IDA only -0.464057657
## IDA total -0.514983179
## India -0.573839043
## Indonesia -0.924028440
## Iran, Islamic Rep. -0.648707880
## Iraq -0.079102742
## Ireland 1.544109887
## Israel 0.535122015
## Italy 1.636732956
## Jamaica -0.123547729
## Japan 1.687808037
## Jordan 0.114052689
## Kazakhstan -0.551478399
## Kenya -0.302403525
## Kiribati -0.217782329
## Korea, Dem. People’s Rep. 0.004493690
## Korea, Rep. 0.547268245
## Kosovo -0.037775192
## Kuwait 1.236783463
## Kyrgyz Republic -0.699030005
## Lao PDR -0.719986319
## Late-demographic dividend 0.209792546
## Latin America & Caribbean 0.235081499
## Latin America & Caribbean (excluding high income) 0.218152799
## Latin America & the Caribbean (IDA & IBRD countries) 0.229846952
## Latvia 0.283087731
## Least developed countries: UN classification -0.484638836
## Lebanon 0.562233592
## Lesotho -0.844990251
## Liberia -1.246536137
## Libya 0.081763960
## Liechtenstein 0.593828796
## Lithuania -0.236733382
## Low & middle income -0.102124406
## Low income -0.565529443
## Lower middle income -0.250244406
## Luxembourg 1.653522694
## Macao SAR, China 0.644539308
## Madagascar -1.277307191
## Malawi -0.640374086
## Malaysia -0.200674050
## Maldives 0.222275604
## Mali -1.082199825
## Malta 0.510829554
## Mauritania -0.992083276
## Mauritius 0.198975085
## Mexico 0.633065449
## Micronesia, Fed. Sts. -0.169045579
## Middle East & North Africa 0.068101592
## Middle East & North Africa (excluding high income) 0.047793570
## Middle East & North Africa (IDA & IBRD countries) 0.047466511
## Middle income -0.045670142
## Moldova -0.489751547
## Mongolia -0.746627289
## Montenegro 0.394644098
## Morocco -0.164814912
## Mozambique -1.334538185
## Myanmar -0.706189861
## Namibia 0.116469833
## Nepal -0.614896695
## Netherlands 1.664207073
## New Caledonia 0.356477122
## New Zealand 1.550199124
## Nicaragua -0.209627773
## Niger -1.043872103
## Nigeria -1.595619350
## North America 0.424023693
## North Macedonia -0.032712836
## Norway 2.487583484
## OECD members 0.473009210
## Oman 0.269514318
## Other small states -0.330597205
## Pacific island small states -0.041122400
## Pakistan -1.168774803
## Panama 0.389814639
## Papua New Guinea -0.532040252
## Paraguay -0.278430351
## Peru 0.155803629
## Philippines -0.642988063
## Poland 0.392403806
## Portugal 1.320158854
## Post-demographic dividend 0.493120513
## Pre-demographic dividend -0.735041435
## Puerto Rico 0.489249751
## Qatar 1.091449637
## Romania 1.259171501
## Russian Federation -0.351325370
## Rwanda 0.075983856
## Samoa 0.182041215
## San Marino 0.707193614
## Sao Tome and Principe -0.253927487
## Saudi Arabia 0.120621776
## Senegal -0.490444081
## Serbia 1.030159539
## Seychelles 0.281063359
## Sierra Leone -1.811352162
## Singapore 0.330975672
## Sint Maarten (Dutch part) 0.236527181
## Slovak Republic 0.685966222
## Slovenia 0.802286988
## Small states -0.222874152
## Solomon Islands -0.142222653
## Somalia -1.599207394
## South Africa -0.809724055
## South Asia -0.241342515
## South Asia (IDA & IBRD) -0.241342515
## South Sudan -1.794605027
## Spain 1.794297141
## Sri Lanka -0.452913069
## St. Lucia 0.219411117
## St. Martin (French part) 0.465281189
## St. Vincent and the Grenadines 0.081794325
## Sub-Saharan Africa -0.730856374
## Sub-Saharan Africa (excluding high income) -0.730954905
## Sub-Saharan Africa (IDA & IBRD countries) -0.730856374
## Sudan -1.177303955
## Suriname 0.084241723
## Sweden 0.540182944
## Switzerland 0.597877539
## Syrian Arab Republic 0.199977149
## Tajikistan -0.798790681
## Tanzania -0.796048513
## Thailand 0.642156574
## Timor-Leste -0.207771811
## Togo -1.078055316
## Tonga 0.117807899
## Trinidad and Tobago 0.438948077
## Tunisia 0.039449652
## Turkey 0.239573860
## Turkmenistan -0.132809324
## Uganda -0.923976989
## Ukraine -0.484908812
## United Arab Emirates 0.251021682
## United Kingdom 0.484512721
## United States 0.411635338
## Upper middle income 0.176679969
## Uruguay 0.264041151
## Uzbekistan -0.751807255
## Vanuatu 0.001912616
## Venezuela, RB 0.259250754
## Vietnam 0.140702909
## Virgin Islands (U.S.) 0.439976542
## West Bank and Gaza 0.076449984
## World -0.101237568
## Yemen, Rep. -0.402303815
## Zambia -0.423634121
## Zimbabwe -0.911656024
Ponemos el índice en una nueva data.frame.
puntaje2=as.data.frame(salud2$scores)
names(puntaje2) = c("Salud")
head(puntaje2)
## Salud
## Afghanistan -0.525254033
## Albania -0.003966211
## Algeria 0.183531157
## Angola -1.205913178
## Antigua and Barbuda 0.251467044
## Arab World -0.046556236
puntaje2$Pais=row.names(puntaje2)
row.names(puntaje2) = NULL
El análisis factorial exploratorio sugiere que los componentes Esperanza de vida en mujeres y Cobertura del tratamiento antirretroviral están efectivamente correlacionados, por cual es correcto juntarlos en un solo índice.
Juntamos los índices con las variables faltantes, eliminamos los casos que no son países y estandarizamos las variables faltantes.
responsabilidad1 = merge(pearson1, DataMetodos1, by= "Pais")
dendes1 = merge(responsabilidad1, promedio1, by= "Pais")
sal1 = merge(dendes1, puntaje1, by= "Pais")
movilidad1 = merge(sal1, migra1, by= "Pais")
movi1 = merge(movilidad1, ODA1, by= "Pais")
control1 = merge(movi1, women1, by= "Pais")
final1 = merge(control1, AFRICA, by= "Pais")
VIH1 = merge(final1, DataVIH1,by= "Pais")
VIH1=VIH1[-grep("San|high|Pacific|French|Caribbean|Early|Late|Island|Small|West|Sint|Other|OECD|North|World|Euro|Latin|Upper|High|Heavily|IBR|IDA|Least|Low|Middle|East|Central|Fragile|Post|Pre",VIH1$Pais),] #Eliminamos los casos que no son países
row.names(VIH1)=NULL
VIH1$Metodos=scale(VIH1$Metodos)
VIH1$Migracion=scale(VIH1$Migracion)
VIH1$ODA=scale(VIH1$ODA)
VIH1$Women=scale(VIH1$Women)
Juntamos los índices con las variables faltantes, eliminamos los casos que no son países y estandarizamos las variables faltantes. Agregamos también el índice de Gini que no incluimos en el análisis factorial. Antes de ello, lo volteamos, pues al igual que BarriosTugurios, lo que queremos ver es que tanta no desigualdad hay. Asimismo, también imputamos a Gini para que esté de acuerdo a lo realizado en el primer periodo.
DataGini2$Gini= 65 - DataGini2$Gini
Hacemos el merge teniendo en cuenta a los NA’s para poder hacer la imputación en el índice de Gini. Luego de ello procederemos a quedarnos solo con los casos completos.
responsabilidad2 = merge(pearson2, DataMetodos2, all.x=T,all.y=T )
dendes2 = merge(responsabilidad2, promedio2,all.x=T,all.y=T )
gini2=merge(dendes2, DataGini2,all.x=T,all.y=T )
sal2 = merge(gini2, puntaje2, all.x=T,all.y=T )
movilidad2 = merge(sal2, migra2, all.x=T,all.y=T )
movi2 = merge(movilidad2, ODA2, all.x=T,all.y=T )
control2 = merge(movi2, women2,all.x=T,all.y=T )
final2 = merge(control2, AFRICA,all.x=T,all.y=T )
VIH2 = merge(final2, DataVIH2,all.x=T,all.y=T )
VIH2[is.na(VIH2$Gini), "Gini"]=mean(VIH2$Gini, na.rm=T) #Imputamos Gini
names(VIH2) = c("Pais","Empoderamiento", "Metodos", "Densidad", "DesarrolloTec", "NoDesigualdad", "Salud","Migracion", "ODA", "Women", "Africa", "VIH") #Cambiamos los nombres
VIH2=VIH2[complete.cases(VIH2),] #Nos quedamos con los casos completos
VIH2=VIH2[-grep("San|high|Pacific|French|Caribbean|Early|Late|Island|Small|West|Sint|Other|OECD|North|World|Euro|Latin|Upper|High|Heavily|IBR|IDA|Least|Low|Middle|East|Central|Fragile|Post|Pre",VIH2$Pais),] #Eliminamos los casos que no son países
row.names(VIH2)=NULL
VIH2$Metodos=scale(VIH2$Metodos) #Estandarizamos
VIH2$NoDesigualdad=scale(VIH2$NoDesigualdad)
VIH2$Migracion=scale(VIH2$Migracion)
VIH2$ODA=scale(VIH2$ODA)
VIH2$Women=scale(VIH2$Women)
PARA LA PRIMERA DATA - Prevalencia del VIH (variable dependiente) 2008-2012 - Hipótesis (variables independientes) 2003-2007
Creamos una copia de la data final y ponemos a los países como índice.
VIH1_x=VIH1
row.names(VIH1_x) = VIH1_x$Pais
VIH1_x$Pais=NULL
head(VIH1_x) #resultado final
## Empoderamiento Metodos Densidad DesarrolloTec NoDesigualdad
## Albania -0.74741919 0.6522352 0.4732899 -1.1410398 1.1788618
## Algeria -1.22463238 0.7085819 0.6353829 -1.0661872 0.7546057
## Argentina 0.00458265 1.4670948 1.2662440 -0.4575426 -0.9427860
## Armenia -0.31023875 0.3488301 0.5278865 -0.9439612 0.9635563
## Azerbaijan 0.30285455 0.2621429 0.5825904 -0.8728966 0.7865296
## Bangladesh -1.47273276 0.5243716 -1.4759396 -0.2257567 0.7649945
## Salud Migracion ODA Women Africa VIH
## Albania 0.0462896 0.02353665 -0.3298818 -0.6711162 NO 0.1
## Algeria 0.1273259 -0.21783736 -0.8130527 -1.0651146 SI 0.1
## Argentina 1.1366058 0.25176788 -0.8475062 0.6409133 NO 0.1
## Armenia -0.2507228 0.08215842 -0.1884567 2.6186155 NO 0.1
## Azerbaijan -0.4463835 0.49072094 -0.5866775 0.2886239 NO 0.1
## Bangladesh -0.5949732 -5.75914199 -0.6085870 -1.4134488 NO 0.1
Pedimos las distancias como criterio para establecer las similitudes entre los casos y eliminamos la variable categórica.
VIH1_x =dist(VIH1_x[-c(10)])
Al ser el GOF cercano a 1, entendemos que es adecuado vincular las variables introducidas.
VIH1_map = cmdscale(VIH1_x,eig=TRUE, k=2) # k sugiere dimensiones
VIH1_map$GOF # mientras mas cerca a 1 mejor.
## [1] 0.776212 0.776212
Podemos ver la posición de los puntos creados:
titulo="Mapa de Similitudes entre paises"
x = VIH1_map$points[,1]
y = VIH1_map$points[,2]
plot(x, y, main=titulo)
Podemos mostrar los nombres de las variables en lugar de los puntos:
plot(x, y, xlab="Dimensión 1", ylab="Dimensión 2", main=titulo,
type="n") # 'n' evita que se pongan los puntos.
# etiquetas y colores de los puntos
text(x, y,labels = rownames(VIH1_map$points),cex=1)
Guardamos nuestras dimensiones en un data.frame.
VIH1_map_DF=as.data.frame(VIH1_map$points)
A partir de ello, para el primer periodo, podemos decir que los países africanos como South Africa, Botswana y Eswatini son más distantes en cuanto a las características representadas en las variables independientes. En sí, la mayoría de países africanos resultan más distantes en cuanto a similitud por las características de las variables.
PARA LA SEGUNDA DATA - Prevalencia del VIH (variable dependiente) 2013-2017 - Hipótesis (variables independientes) 2008-2012
Creamos una copia de la data final y ponemos a los países como índice.
VIH2_x=VIH2
row.names(VIH2_x) = VIH2_x$Pais
VIH2_x$Pais=NULL
head(VIH2_x) #resultado final
## Empoderamiento Metodos Densidad DesarrolloTec
## Albania -0.206127451 1.0896776 0.9504914 -0.8200025
## Algeria -2.452558785 0.5068520 0.6045737 -0.7512281
## Angola 1.910842948 -1.1546359 -1.2840843 -0.6641418
## Argentina -0.134724627 0.4851048 1.0312177 -0.1618742
## Armenia -0.003203348 0.4633575 0.9799543 -0.8601155
## Azerbaijan 0.724065533 0.4633575 0.9327188 -0.5750845
## NoDesigualdad Salud Migracion ODA Women
## Albania 1.4499741 -0.003966211 0.13288761 -0.3767134 -0.53049129
## Algeria 1.7181831 0.183531157 0.02155436 -0.8767881 -0.79896570
## Angola -0.4133722 -1.205913178 0.53661832 -0.8458191 0.61733827
## Argentina -0.4528978 1.113839189 0.40857939 -0.8966298 0.62830015
## Armenia 1.4866764 -0.493835927 0.27336366 -0.2582459 2.53020104
## Azerbaijan 0.2182703 -0.489522683 0.34156903 -0.8188119 0.05464474
## Africa VIH
## Albania NO 0.10
## Algeria SI 0.10
## Angola SI 0.96
## Argentina NO 0.10
## Armenia NO 0.10
## Azerbaijan NO 0.10
Pedimos las distancias como criterio para establecer las similitudes entre los casos y eliminamos la variable categórica.
VIH2_x =dist(VIH2_x[-c(10)])
Al ser el GOF cercano a 1, entendemos que es adecuado vincular las variables introducidas.
VIH2_map = cmdscale(VIH2_x,eig=TRUE, k=2) # k sugiere dimensiones
VIH2_map$GOF # mientras mas cerca a 1 mejor.
## [1] 0.7091426 0.7091426
Podemos ver la posición de los puntos creados:
titulo="Mapa de Similitudes entre paises"
x = VIH2_map$points[,1]
y = VIH2_map$points[,2]
plot(x, y, main=titulo)
Podemos mostrar los nombres de las variables en lugar de los puntos:
plot(x, y, xlab="Dimensión 1", ylab="Dimensión 2", main=titulo,
type="n") # 'n' evita que se pongan los puntos.
# etiquetas y colores de los puntos
text(x, y,labels = rownames(VIH2_map$points),cex=1)
Guardamos nuestras dimensiones en un data.frame.
VIH2_map_DF=as.data.frame(VIH2_map$points)
A partir de ello, para el segundo periodo, podemos decir que los países africanos como Lesotho, Botswana y Eswatini son más distantes en cuanto a las características representadas en las variables independientes. Al igual que en el primero periodo, la mayoría de países africanos resultan más distantes en cuanto a similitud por las características de las variables.
PARA LA PRIMERA DATA
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
Creamos un subset de la data original y ponemos a los países como índice.
VIH1_d=VIH1[,c(-11)] #Eliminamos la variable categórica
row.names(VIH1_d) = VIH1_d$Pais
VIH1_d$Pais=NULL
VIH1_d = as.data.frame(scale(VIH1_d)) #Estandarizamos
VIH1gg=VIH1_d #Creamos una copia para hacer el aggregate
Pedimos las distancias como un criterio de agrupamiento.
VIH1_d=dist(VIH1_d[c(1:10)])
Con la función Kmeans separamos los casos en 5 centroides.
#Pedimos el numero de grupos:
VIH1_clus=kmeans(VIH1_d,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1_clus$cluster
## Albania Algeria Argentina
## 5 5 1
## Armenia Azerbaijan Bangladesh
## 5 5 3
## Belarus Belize Benin
## 5 1 2
## Bolivia Botswana Brazil
## 1 4 1
## Burkina Faso Burundi Cabo Verde
## 2 4 1
## Cambodia Cameroon Chad
## 2 2 2
## Colombia Congo, Dem. Rep. Congo, Rep.
## 1 2 2
## Costa Rica Cote d'Ivoire Cuba
## 1 2 1
## Dominican Republic Ecuador Egypt, Arab Rep.
## 1 1 1
## El Salvador Eswatini Ethiopia
## 5 3 2
## Georgia Ghana Guinea
## 5 2 2
## Guinea-Bissau Guyana Haiti
## 2 1 2
## Honduras India Indonesia
## 1 3 1
## Iran, Islamic Rep. Kazakhstan Kenya
## 1 5 2
## Kyrgyz Republic Lao PDR Lebanon
## 5 2 1
## Lesotho Liberia Madagascar
## 4 4 2
## Malawi Malaysia Mali
## 4 1 2
## Mauritania Mexico Moldova
## 2 1 5
## Mongolia Montenegro Morocco
## 5 1 1
## Mozambique Myanmar Namibia
## 4 2 4
## Nepal Nicaragua Niger
## 2 1 2
## Nigeria Pakistan Papua New Guinea
## 2 5 2
## Paraguay Peru Philippines
## 1 1 1
## Rwanda Senegal Serbia
## 4 2 5
## Sierra Leone South Africa Sri Lanka
## 4 4 1
## Sudan Suriname Tajikistan
## 2 1 5
## Tanzania Thailand Togo
## 2 1 2
## Trinidad and Tobago Tunisia Uganda
## 1 1 2
## Ukraine Uruguay Uzbekistan
## 5 1 5
## Vietnam Zambia Zimbabwe
## 1 2 4
table(VIH1_clus$cluster)
##
## 1 2 3 4 5
## 31 29 3 11 16
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1=as.data.frame(VIH1_clus$cluster)
grupos1
## VIH1_clus$cluster
## Albania 5
## Algeria 5
## Argentina 1
## Armenia 5
## Azerbaijan 5
## Bangladesh 3
## Belarus 5
## Belize 1
## Benin 2
## Bolivia 1
## Botswana 4
## Brazil 1
## Burkina Faso 2
## Burundi 4
## Cabo Verde 1
## Cambodia 2
## Cameroon 2
## Chad 2
## Colombia 1
## Congo, Dem. Rep. 2
## Congo, Rep. 2
## Costa Rica 1
## Cote d'Ivoire 2
## Cuba 1
## Dominican Republic 1
## Ecuador 1
## Egypt, Arab Rep. 1
## El Salvador 5
## Eswatini 3
## Ethiopia 2
## Georgia 5
## Ghana 2
## Guinea 2
## Guinea-Bissau 2
## Guyana 1
## Haiti 2
## Honduras 1
## India 3
## Indonesia 1
## Iran, Islamic Rep. 1
## Kazakhstan 5
## Kenya 2
## Kyrgyz Republic 5
## Lao PDR 2
## Lebanon 1
## Lesotho 4
## Liberia 4
## Madagascar 2
## Malawi 4
## Malaysia 1
## Mali 2
## Mauritania 2
## Mexico 1
## Moldova 5
## Mongolia 5
## Montenegro 1
## Morocco 1
## Mozambique 4
## Myanmar 2
## Namibia 4
## Nepal 2
## Nicaragua 1
## Niger 2
## Nigeria 2
## Pakistan 5
## Papua New Guinea 2
## Paraguay 1
## Peru 1
## Philippines 1
## Rwanda 4
## Senegal 2
## Serbia 5
## Sierra Leone 4
## South Africa 4
## Sri Lanka 1
## Sudan 2
## Suriname 1
## Tajikistan 5
## Tanzania 2
## Thailand 1
## Togo 2
## Trinidad and Tobago 1
## Tunisia 1
## Uganda 2
## Ukraine 5
## Uruguay 1
## Uzbekistan 5
## Vietnam 1
## Zambia 2
## Zimbabwe 4
names(grupos1)='cluster'
grupos1$NAME=row.names(grupos1)
head(grupos1)
## cluster NAME
## Albania 5 Albania
## Algeria 5 Algeria
## Argentina 1 Argentina
## Armenia 5 Armenia
## Azerbaijan 5 Azerbaijan
## Bangladesh 3 Bangladesh
Para poder apreciar visualmente qué países se encuentran dentro de los clusters generados procedemos a realizar mapas.
MAPA DE TODAS LAS VARIABLES
Para ver las características de cada grupo generado por el análisis de clústers, empleamos la función aggregate. De acuerdo a ello podemos decir que en el clúster 1 pintando en rojo oscuro, la mayoría de países en América Latina ha obtenido los puntajes más altos en Metodos, Densidad y Salud. El clúster 5 ha obtenido el menor puntaje en VIH y el mayor puntaje en NoDesigualdad, y está conformado por países de Asia y África pintados de color coral. El clúster 3, pintado de color palo rosa y formado por la India básicamente es el que ha obtenidoel mayor puntaje en VIH y DesarrolloTecno, y los puntajesmás bajos en Migracion y Empoderamiento.
VIH1gg=merge(VIH1gg, grupos1[-2], by=0)
row.names(VIH1gg) = VIH1gg$Row.names
VIH1gg=VIH1gg[-1]
head(VIH1gg)
## Empoderamiento Metodos Densidad DesarrolloTec NoDesigualdad
## Albania -0.87499288 0.6522352 0.6448434 -1.73193391 1.6669040
## Algeria -1.30656531 0.7085819 0.7768113 -1.54586396 1.1898866
## Argentina -0.19491265 1.4670948 1.2904264 -0.03288414 -0.7185957
## Armenia -0.47962446 0.3488301 0.6892932 -1.24203218 1.4248227
## Azerbaijan 0.07483247 0.2621429 0.7338304 -1.06537860 1.2257807
## Bangladesh -1.53093732 0.5243716 -0.9421201 0.54329354 1.2015675
## Salud Migracion ODA Women VIH
## Albania 0.84559917 0.02353665 -0.3298818 -0.6711162 -0.4211864
## Algeria 0.97066296 -0.21783736 -0.8130527 -1.0651146 -0.4211864
## Argentina 2.52829135 0.25176788 -0.8475062 0.6409133 -0.4211864
## Armenia 0.38721806 0.08215842 -0.1884567 2.6186155 -0.4211864
## Azerbaijan 0.08525359 0.49072094 -0.5866775 0.2886239 -0.4211864
## Bangladesh -0.14406587 -5.75914199 -0.6085870 -1.4134488 -0.4211864
## cluster
## Albania 5
## Algeria 5
## Argentina 1
## Armenia 5
## Azerbaijan 5
## Bangladesh 3
agg1=aggregate(cbind(Empoderamiento, Metodos, Densidad, NoDesigualdad, Salud, DesarrolloTec, Migracion, VIH )~ cluster, data=VIH1gg,FUN=mean)
names(agg1)=c("cluster","Empoderamiento", "Metodos", "Densidad", "NoDesigualdad", "Salud", "DesarrolloTec", "Migracion", "VIH")
agg1
## cluster Empoderamiento Metodos Densidad NoDesigualdad Salud
## 1 1 -0.5199245 0.8286017 0.9229373 -0.2039823 0.8919126
## 2 2 0.6121372 -0.9741211 -0.9677652 -0.1346964 -0.7791498
## 3 3 -1.1506396 0.3867557 -0.5093101 0.2274865 -0.5560775
## 4 4 0.7138261 -0.4918387 -0.8298047 -1.0207457 -1.0460935
## 5 5 -0.3771554 0.4258011 0.6318698 1.2984619 0.5075821
## DesarrolloTec Migracion VIH
## 1 -0.08139526 0.06770615 -0.38576281
## 2 0.27843840 0.04532982 -0.04795972
## 3 0.87261365 -3.33240106 1.76496521
## 4 0.68449043 0.46698534 1.32997785
## 5 -0.98116850 0.09043182 -0.41094831
Podemos decir que las características de los países según los clústers son las siguientes:
MAPA - HIPÓTESIS 1 Y VARIABLE DEPENDIENTE
Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de reforzamiento de las capacidades femeninas con las variables Empoderamiento, Metodos y VIH.
agg1H1=aggregate(cbind(Empoderamiento, Metodos, VIH )~ cluster, data=VIH1gg,FUN=mean)
names(agg1H1)=c("cluster","Empoderamiento","Metodos", "VIH")
agg1H1
## cluster Empoderamiento Metodos VIH
## 1 1 -0.5199245 0.8286017 -0.38576281
## 2 2 0.6121372 -0.9741211 -0.04795972
## 3 3 -1.1506396 0.3867557 1.76496521
## 4 4 0.7138261 -0.4918387 1.32997785
## 5 5 -0.3771554 0.4258011 -0.41094831
Así, tenemos que para esta hipótesis el clúster 3 que tiene mayor prevalencia del VIH también tiene el menor valor en la variable Empoderamiento. Por lo cual, concluimos con que la India (que conforma al clúster 3) tiene bajo Empoderamiento en relación al resto de países y es uno de los países que posee un valor alto en la prevalencia del VIH en mujeres. De alguna forma, el bajo empoderamiento puede explicar la prevalencia del VIH en mujeres. Esto se comprobará en la regresión.
MAPA - HIPÓTESIS 2 Y VARIABLE DEPENDIENTE
Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de calidad de vida con las variables Densidad, NoDesigualdad, Salud y VIH.
agg1H2=aggregate(cbind(Densidad, NoDesigualdad, Salud, VIH) ~ cluster, data=VIH1gg,FUN=mean)
names(agg1H2)=c("cluster","Densidad", "NoDesigualdad", "Salud", "VIH")
agg1H2
## cluster Densidad NoDesigualdad Salud VIH
## 1 1 0.9229373 -0.2039823 0.8919126 -0.38576281
## 2 2 -0.9677652 -0.1346964 -0.7791498 -0.04795972
## 3 3 -0.5093101 0.2274865 -0.5560775 1.76496521
## 4 4 -0.8298047 -1.0207457 -1.0460935 1.32997785
## 5 5 0.6318698 1.2984619 0.5075821 -0.41094831
Los países de Asia y Africa del norte que conforman el clúster 5 pintado en naranja poseen el menor puntaje en VIH y el mayor puntaje en NoDesigualdad. Intuimos que a mayor no desigualdad, menor prevalencia del VIH en mujeres. Lo comprobaremos en la regresión.
MAPA - HIPÓTESIS 3 Y VD
Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de movilización para el desarrollo con las variables Salud, DesarrolloTec y VIH.
agg1H3=aggregate(cbind(Migracion, DesarrolloTec, VIH) ~ cluster, data=VIH1gg,FUN=mean)
names(agg1H3)=c("cluster", "Migracion", "DesarrolloTec", "VIH")
agg1H3
## cluster Migracion DesarrolloTec VIH
## 1 1 0.06770615 -0.08139526 -0.38576281
## 2 2 0.04532982 0.27843840 -0.04795972
## 3 3 -3.33240106 0.87261365 1.76496521
## 4 4 0.46698534 0.68449043 1.32997785
## 5 5 0.09043182 -0.98116850 -0.41094831
El clúster 3 tiene el puntaje más alto en VIH, en DesarrolloTecno y el menor puntaje en Migracion, aquí tenemos a la India. El clúster 5 pintado de un verde pastel para las regiones de Asia y América del Sur, y que tiene a Perú (por ejemplo), posee los puntajes más bajos tanto en VIH como en DesarrolloTecno. Ello nos dice que puede haber una relación directa entre el desarrollo tecnológico y la prevalencia de VIH en mujeres: a mayor desarrollo tecnológico mayor prevalencia de VIH. Esto tiene sentido, pues el desarrollo tecnológico produce movilidad y aumenta las redes de contacto entre las personas (lo cual puede implicar la transmisión de muchas enfermedades e infecciones, entre ellas el VIH). Lo comprobaremos en la regresión.
PARA LA SEGUNDA DATA
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
Creamos un subset de la data original y ponemos a los países como índice.
VIH2_d=VIH2[,c(-11)] #Eliminamos la variable categórica
row.names(VIH2_d) = VIH2_d$Pais
VIH2_d$Pais=NULL
VIH2_d = as.data.frame(scale(VIH2_d)) #Estandarizamos
VIH2gg=VIH2_d #Creamos una copia para hacer el aggregate
Pedimos las distancias como un criterio de agrupamiento.
VIH2_d=dist(VIH2_d[c(1:10)])
Con la función Kmeans separamos los casos en 5 centroides.
#Pedimos el numero de grupos:
VIH2_clus=kmeans(VIH2_d,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2_clus$cluster
## Albania Algeria Angola
## 3 2 1
## Argentina Armenia Azerbaijan
## 3 2 3
## Bangladesh Barbados Belarus
## 5 4 4
## Belize Benin Bolivia
## 3 1 3
## Botswana Burkina Faso Burundi
## 4 1 4
## Cambodia Cameroon Chad
## 3 1 1
## Colombia Comoros Congo, Dem. Rep.
## 3 1 1
## Congo, Rep. Costa Rica Cote d'Ivoire
## 1 3 1
## Cuba Dominican Republic Ecuador
## 2 3 3
## Egypt, Arab Rep. El Salvador Equatorial Guinea
## 2 3 4
## Eritrea Eswatini Ethiopia
## 1 5 1
## Gabon Gambia, The Georgia
## 3 1 3
## Ghana Guatemala Guinea
## 1 3 1
## Guinea-Bissau Guyana Haiti
## 1 3 1
## Honduras India Indonesia
## 3 5 3
## Iran, Islamic Rep. Kazakhstan Kenya
## 2 3 1
## Kyrgyz Republic Lao PDR Lebanon
## 3 1 2
## Lesotho Madagascar Malawi
## 4 1 1
## Mali Mauritania Mexico
## 1 1 3
## Moldova Mongolia Morocco
## 3 3 3
## Mozambique Myanmar Nepal
## 4 3 1
## Nicaragua Niger Nigeria
## 3 1 1
## Pakistan Panama Paraguay
## 2 3 3
## Peru Philippines Rwanda
## 3 3 1
## Senegal Serbia Sierra Leone
## 1 2 4
## South Sudan Sudan Suriname
## 4 1 3
## Tajikistan Tanzania Thailand
## 2 1 3
## Togo Trinidad and Tobago Tunisia
## 1 3 3
## Uganda Ukraine Vietnam
## 1 2 3
## Zimbabwe
## 1
table(VIH2_clus$cluster)
##
## 1 2 3 4 5
## 32 10 34 9 3
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2=as.data.frame(VIH2_clus$cluster)
grupos2
## VIH2_clus$cluster
## Albania 3
## Algeria 2
## Angola 1
## Argentina 3
## Armenia 2
## Azerbaijan 3
## Bangladesh 5
## Barbados 4
## Belarus 4
## Belize 3
## Benin 1
## Bolivia 3
## Botswana 4
## Burkina Faso 1
## Burundi 4
## Cambodia 3
## Cameroon 1
## Chad 1
## Colombia 3
## Comoros 1
## Congo, Dem. Rep. 1
## Congo, Rep. 1
## Costa Rica 3
## Cote d'Ivoire 1
## Cuba 2
## Dominican Republic 3
## Ecuador 3
## Egypt, Arab Rep. 2
## El Salvador 3
## Equatorial Guinea 4
## Eritrea 1
## Eswatini 5
## Ethiopia 1
## Gabon 3
## Gambia, The 1
## Georgia 3
## Ghana 1
## Guatemala 3
## Guinea 1
## Guinea-Bissau 1
## Guyana 3
## Haiti 1
## Honduras 3
## India 5
## Indonesia 3
## Iran, Islamic Rep. 2
## Kazakhstan 3
## Kenya 1
## Kyrgyz Republic 3
## Lao PDR 1
## Lebanon 2
## Lesotho 4
## Madagascar 1
## Malawi 1
## Mali 1
## Mauritania 1
## Mexico 3
## Moldova 3
## Mongolia 3
## Morocco 3
## Mozambique 4
## Myanmar 3
## Nepal 1
## Nicaragua 3
## Niger 1
## Nigeria 1
## Pakistan 2
## Panama 3
## Paraguay 3
## Peru 3
## Philippines 3
## Rwanda 1
## Senegal 1
## Serbia 2
## Sierra Leone 4
## South Sudan 4
## Sudan 1
## Suriname 3
## Tajikistan 2
## Tanzania 1
## Thailand 3
## Togo 1
## Trinidad and Tobago 3
## Tunisia 3
## Uganda 1
## Ukraine 2
## Vietnam 3
## Zimbabwe 1
names(grupos2)='cluster'
grupos2$NAME=row.names(grupos2)
head(grupos2)
## cluster NAME
## Albania 3 Albania
## Algeria 2 Algeria
## Angola 1 Angola
## Argentina 3 Argentina
## Armenia 2 Armenia
## Azerbaijan 3 Azerbaijan
Para poder apreciar visualmente qué países se encuentran dentro de los clusters generados procedemos a realizar mapas.
MAPA2 DE TODAS LAS VARIABLES
Para ver las características de cada grupo generado por el análisis de clústers, empleamos la función aggregate. De acuerdo a ello tenemos que el clúster 1 (color rojo oscuro), en el que se encuentran países de África, tienen el mayor puntaje en la variable Empoderamiento, y los menores valores en Metodos y Salud. El clúster 2 (color guinda), que abarca a algunos países de África del norte, Europa y Asia, tiene el mayor puntaje en Densidad y NoDesigualdad y tiene los peores puntajes en Empoderamiento y Desarrollo Tecnologico. El clúster 3 (color palo rosa) donde están los países de Centroamérica, América del Sur y Asia tiene altos puntajes en Metodos y Salud y el menor puntaje en VIH con lo cual parece relevante para la la variable dependiente. El clúster 4 pintado de rojo para algunos países del sur de África y Europa tiene los mayores puntajes en las variables Desarrollo Tecnologico y Migracion, y el menor puntaje en Densidad y NoDesigualdad. Finalmente el clúster 5 (que incluye a la India) tiene el mayor puntaje en VIH y el menor puntaje en migración.
VIH2gg=merge(VIH2gg, grupos2[-2], by=0)
row.names(VIH2gg) = VIH2gg$Row.names
VIH2gg=VIH2gg[-1]
head(VIH2gg)
## Empoderamiento Metodos Densidad DesarrolloTec
## Albania -0.3593492 1.0896776 1.0926545 -0.81028707
## Algeria -2.3901891 0.5068520 0.7987106 -0.60553322
## Angola 1.5544542 -1.1546359 -0.8061785 -0.34626136
## Argentina -0.2947989 0.4851048 1.1612518 1.14908096
## Armenia -0.1758998 0.4633575 1.1176907 -0.92971102
## Azerbaijan 0.4815726 0.4633575 1.0775522 -0.08112159
## NoDesigualdad Salud Migracion ODA Women
## Albania 1.4499741 0.69836064 0.13288761 -0.3767134 -0.53049129
## Algeria 1.7181831 0.97895567 0.02155436 -0.8767881 -0.79896570
## Angola -0.4133722 -1.10038647 0.53661832 -0.8458191 0.61733827
## Argentina -0.4528978 2.37118754 0.40857939 -0.8966298 0.62830015
## Armenia 1.4866764 -0.03474303 0.27336366 -0.2582459 2.53020104
## Azerbaijan 0.2182703 -0.02828814 0.34156903 -0.8188119 0.05464474
## VIH cluster
## Albania -0.39207104 3
## Algeria -0.39207104 2
## Angola -0.08749358 1
## Argentina -0.39207104 3
## Armenia -0.39207104 2
## Azerbaijan -0.39207104 3
agg2=aggregate(cbind(Empoderamiento, Metodos, Densidad, NoDesigualdad, Salud, DesarrolloTec, Migracion, VIH)~ cluster, data=VIH2gg,FUN=mean)
names(agg2)=c("cluster","Empoderamiento", "Metodos", "Densidad", "NoDesigualdad", "Salud", "DesarrolloTec", "Migracion", "VIH")
agg2
## cluster Empoderamiento Metodos Densidad NoDesigualdad Salud
## 1 1 0.5620325 -0.8394144 -0.9303435 -0.09355822 -0.6455596
## 2 2 -1.3488770 0.5187405 0.9428077 1.17731254 0.4322509
## 3 3 -0.1491622 0.7200515 0.8032508 -0.15555364 0.6355666
## 4 4 0.4606172 -0.5254968 -0.7180808 -0.39041412 -0.4619460
## 5 5 -1.1901031 0.6405249 -0.1682950 0.00776287 -0.3721175
## DesarrolloTec Migracion VIH
## 1 0.2149053 0.11044326 0.01720492
## 2 -0.5701318 0.06146149 -0.37436305
## 3 -0.4066616 0.06249828 -0.32623898
## 4 1.4951035 0.45746717 0.96475466
## 5 -0.2683632 -3.46364842 1.86746874
Podemos decir que las características de los países según los clústers son las siguientes:
MAPA - HIPÓTESIS 1 Y VARIABLE DEPENDIENTE
Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de reforzamiento de las capacidades femeninas con las variables Empoderamiento, Metodos y VIH.
agg2H1=aggregate(cbind(Empoderamiento, Metodos, VIH )~ cluster, data=VIH2gg,FUN=mean)
names(agg2H1)=c("cluster","Empoderamiento","Metodos", "VIH")
agg2H1
## cluster Empoderamiento Metodos VIH
## 1 1 0.5620325 -0.8394144 0.01720492
## 2 2 -1.3488770 0.5187405 -0.37436305
## 3 3 -0.1491622 0.7200515 -0.32623898
## 4 4 0.4606172 -0.5254968 0.96475466
## 5 5 -1.1901031 0.6405249 1.86746874
Para esta hipotesis el clúster 1 es el que posee el mayor puntaje en la variable Empoderamiento y el peor puntaje en Metodos, estos países estan en África. El clúster 2, que contiene a algunos países de África del sur, tiene el menor puntaje en Empoderamiento y el menor puntaje en VIH. El clúster 3 tiene un puntaje alto en Metodos, aquí tenemos a la India. Finalmente el clúster 5 tiene un puntaje alto en VIH, en países de Centroamérica y de América del sur como Perú. En este segundo periodo, a diferencia del primero, vemos una relación directa entre empoderamiento y prevalencia del VIH en mujeres: a mayor empoderamiento mayor prevalencia de VIH. Esto no tiene mucho sentido; no obstante, lo comprobaremos en la hipótesis.
MAPA - HIPÓTESIS 2 Y VARIABLE DEPENDIENTE
Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de calidad de vida con las variables Densidad, NoDesigualdad, Salud y VIH.
agg2H2=aggregate(cbind(Densidad, NoDesigualdad, Salud, VIH) ~cluster, data=VIH2gg,FUN=mean)
names(agg2H2)=c("cluster","Densidad", "NoDesigualdad", "Salud", "VIH")
agg2H2
## cluster Densidad NoDesigualdad Salud VIH
## 1 1 -0.9303435 -0.09355822 -0.6455596 0.01720492
## 2 2 0.9428077 1.17731254 0.4322509 -0.37436305
## 3 3 0.8032508 -0.15555364 0.6355666 -0.32623898
## 4 4 -0.7180808 -0.39041412 -0.4619460 0.96475466
## 5 5 -0.1682950 0.00776287 -0.3721175 1.86746874
El clúster 5 es el queha tenido mayor puntaje en VIH, está pintado en naranja y son países de Asia. Por otro lado, el clúster 2 pintado en amarillo tiene a países como la India y Bolivia que poseen el puntaje más alto en Densidad y los más bajos en NoDesigualdad y VIH. Al igual que en el primer periodo, la variable densidad puede explicar la prevalencia de VIH de forma negativa, a mayor densidad, menor prevalencia de VIH.
MAPA2 -HIPÓTESIS3 Y VD
Con la función aggregate vemos las diferencias entre los grupos de acuerdo al promedio. En este caso vemos en función de la hipótesis de movilización para el desarrollo con las variables Salud, DesarrolloTec y VIH.
agg2H3=aggregate(cbind(Migracion, DesarrolloTec, VIH )~ cluster, data=VIH2gg,FUN=mean)
names(agg2H3)=c("cluster", "Migracion", "DesarrolloTec", "VIH")
agg2H3
## cluster Migracion DesarrolloTec VIH
## 1 1 0.11044326 0.2149053 0.01720492
## 2 2 0.06146149 -0.5701318 -0.37436305
## 3 3 0.06249828 -0.4066616 -0.32623898
## 4 4 0.45746717 1.4951035 0.96475466
## 5 5 -3.46364842 -0.2683632 1.86746874
El clúster 4 ha obtenido los puntajes más altos en DesarrolloTecno y Migracion, aquí tenemos a la India pintada de un verde chillón. El grupo que ha obtenido un mayor puntaje en VIH está en un verde pastel como Bolivia, que además ha obtenido el menor puntaje en migracion. Esto nos dice que hay una relación inversa entre migración y VIH: a menor migración mayor prevalencia de VIH. Lo pasaremos a comprobar en la regresión.
PRIMERA DATA Prevalencia del VIH (variable dependiente) 2008-2012 Hipótesis (variables independientes) 2003-2007
Ahora podemos hacer la regresión para la primera data. Como la variable dependiente está en porcentaje, la convertimos a proporción dividiendola entre 100.
VIH1$VIH=VIH1$VIH/100
El modelo escogido contendrá a los índices resultantes del análisis factorial, las demás variables manifiestas que componen las hipótesis y las variables control. Se espera que a mayor reforzamiento de las capacidades femeninas (variables Empoderamiento y Metodos) exista menor prevalencia del VIH en mujeres y a mayor calidad de vida (variables Densidad, NoDesigualdad y Salud) menor prevalencia del VIH en mujeres. Con respecto a la tercera hipótesis, de movilidad para el desarrollo en la población en general, se espera que la variable Migración tenga un efecto directo sobre la variable dependiente: a mayor migración, mayor prevalencia de VIH en mujeres. Por otro lado, con respecto a la variable DesarrolloTec se espera que a mayor desarrollo tecnológico menor prevalencia de VIH en mujeres. En esta última hipótesis se espera que las variables no vayan en la misma dirección.
library(betareg)
modelo1=betareg(VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA + Women + Africa,data=VIH1)
summary(modelo1)
##
## Call:
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad +
## Salud + DesarrolloTec + Migracion + ODA + Women + Africa, data = VIH1)
##
## Standardized weighted residuals 2:
## Min 1Q Median 3Q Max
## -2.4120 -0.6356 -0.0050 0.6321 3.9196
##
## Coefficients (mean model with logit link):
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.93290 0.20335 -29.176 < 2e-16 ***
## Empoderamiento -0.16459 0.08228 -2.001 0.045443 *
## Metodos 0.48347 0.15689 3.082 0.002059 **
## Densidad -0.46753 0.13852 -3.375 0.000738 ***
## NoDesigualdad -0.53010 0.09153 -5.791 6.98e-09 ***
## Salud -1.45091 0.19841 -7.313 2.62e-13 ***
## DesarrolloTec -0.05573 0.17983 -0.310 0.756655
## Migracion 0.38883 0.10412 3.734 0.000188 ***
## ODA -0.36996 0.10744 -3.444 0.000574 ***
## Women 0.29422 0.08837 3.329 0.000871 ***
## AfricaSI 0.07138 0.18483 0.386 0.699346
##
## Phi coefficients (precision model with identity link):
## Estimate Std. Error z value Pr(>|z|)
## (phi) 126.92 22.15 5.73 1e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Type of estimator: ML (maximum likelihood)
## Log-likelihood: 352.4 on 12 Df
## Pseudo R-squared: 0.6222
## Number of iterations: 50 (BFGS) + 5 (Fisher scoring)
El summary del modelo revela que seis variables independientes (Empoderamiento, Metodos, Densidad, NoDesigualdad, Salud, DesarrolloTec y Migracion), sin contar las variables control, son estadísticamente significativas. Al tratarse de una regresión Beta, los coeficientes no son interpretables, por lo que es necesario generar los margins.
library(margins)
(modelo1M = margins(modelo1))
## Average marginal effects
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA + Women + Africa, data = VIH1)
## Empoderamiento Metodos Densidad NoDesigualdad Salud DesarrolloTec
## -0.002342 0.006879 -0.006652 -0.007542 -0.02064 -0.0007929
## Migracion ODA Women AfricaSI
## 0.005532 -0.005264 0.004186 0.001007
resultado = summary(modelo1M)
#salen los limites de el error
bet=summary(modelo1M)
library(ggplot2)
## Registered S3 methods overwritten by 'ggplot2':
## method from
## [.quosures rlang
## c.quosures rlang
## print.quosures rlang
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
ggplot(bet,aes(x=factor, y=AME)) + geom_point() + geom_errorbar(aes(ymin=lower, ymax=upper))
Los resultados del modelo muestran que la hipótesis con mayor efecto sobre la prevalencia del VIH en mujeres es la de calidad de vida (con las variables de Densidad, NoDesigualdad y Salud). Así, por cada punto adicional en la densidad estatal, la probabilidad de una disminución en la prevalencia de VIH en mujeres es de 0.7% en promedio. Luego, por cada punto adicional en la No desigualdad, la probabilidad de una disminución en la prevalencia de VIH es de 0.8% en promedio. Por último, por cada punto adicional en la salud, la probabilidad de una disminución en la prevalencia de VIH es de 2% en promedio. Además, en el caso de la variable Migración,por cada punto adicional en esta, la probabilidad de un aumento en la prevalencia de VIH es de 0.6% en promedio.
Por otro lado, la variable Empoderamiento parece tener un efecto negativo en la prevalencia de VIH (-0,2%); sin embargo la variable Uso de métodos anticonceptivos parece tener un efecto positivo en la prevalencia del VIH (0.06%). ¿Por qué sucede aquello? En la variable de Uso de métodos anticonceptivos se están considerando todos los tipos de métodos anticonceptivos, es decir, esto no incluye solo preservativos, sino también métodos como pastillas anticonceptivas, T de cobre, etc. Para evitar la transmisión de VIH, el único método anticonceptivo útil es el preservativo, por lo cual, al juntarlo con los demás métodos anticonceptivos se pierde el efecto (o en todo caso, este no se hace visible). La variable con menor efecto en la prevalencia de VIH en mujeres es la de Empoderamiento. De esta forma, en relación con las acciones individuales, se rescata que las acciones estatales y sociales son las que determinan mejor los niveles de VIH en mujeres por país de origen. Finalmente, guiandonos del gráfico de barras de error, al no existir una superposición de los intervalos en las variables significativas, los efectos son distinguibles entre sí. Observamos que las variables significativas son las únicas que no tienen un traslape con el O.
SEGUNDA DATA Prevalencia del VIH (variable dependiente) 2013-2017 Hipótesis (variables independientes) 2008-2012
Ahora podemos empezar la regresión de la segunda data. Como la variable dependiente está en porcentaje, la convertimos a proporción dividiendola entre 100.
VIH2$VIH=VIH2$VIH/100
El modelo escogido, al igual que el primer periodo, contendrá a los índices resultantes del análisis factorial, las demás variables manifiestas que componen las hipótesis y las variables control. El objetivo de realizar esta regresión es ver si las variables que antes eran significativas se siguen manteniendo o se han alterado. Si es lo último, queremos saber cuáles son las que lograron mantenerse (o cuáles se incluyeron) y qué conclusiones se puede determinar de ello.
library(betareg)
modelo2=betareg(VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA + Women + Africa,data=VIH2)
summary(modelo2)
##
## Call:
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad +
## Salud + DesarrolloTec + Migracion + ODA + Women + Africa, data = VIH2)
##
## Standardized weighted residuals 2:
## Min 1Q Median 3Q Max
## -3.2018 -0.4481 -0.0119 0.5090 3.2154
##
## Coefficients (mean model with logit link):
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -5.04927 0.27746 -18.198 < 2e-16 ***
## Empoderamiento -0.11467 0.10290 -1.114 0.265138
## Metodos 0.20486 0.17797 1.151 0.249686
## Densidad -0.49370 0.18104 -2.727 0.006392 **
## NoDesigualdad -0.36806 0.10158 -3.624 0.000291 ***
## Salud -0.20423 0.20436 -0.999 0.317631
## DesarrolloTec -0.24710 0.34821 -0.710 0.477939
## Migracion 0.08615 0.11453 0.752 0.451897
## ODA -0.11816 0.12412 -0.952 0.341140
## Women 0.29724 0.11340 2.621 0.008761 **
## AfricaSI 0.15814 0.27579 0.573 0.566365
##
## Phi coefficients (precision model with identity link):
## Estimate Std. Error z value Pr(>|z|)
## (phi) 64.89 12.01 5.402 6.6e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Type of estimator: ML (maximum likelihood)
## Log-likelihood: 329.9 on 12 Df
## Pseudo R-squared: 0.3641
## Number of iterations: 48 (BFGS) + 10 (Fisher scoring)
El summary del modelo revela que para este segundo periodo solo dos variables independientes (Densidad y NoDesigualdad) sin contar a la variable control son estadísticamente significativas. Al tratarse de una regresión Beta, los coeficientes no son interpretables, por lo que es necesario generar los margins.
library(margins)
(modelo2M = margins(modelo2))
## Average marginal effects
## betareg(formula = VIH ~ Empoderamiento + Metodos + Densidad + NoDesigualdad + Salud + DesarrolloTec + Migracion + ODA + Women + Africa, data = VIH2)
## Empoderamiento Metodos Densidad NoDesigualdad Salud DesarrolloTec
## -0.001387 0.002477 -0.00597 -0.00445 -0.002469 -0.002988
## Migracion ODA Women AfricaSI
## 0.001042 -0.001429 0.003594 0.001897
resultado = summary(modelo2M)
#salen los limites de su error
bet=summary(modelo2M)
library(ggplot2)
ggplot(bet,aes(x=factor, y=AME)) + geom_point() + geom_errorbar(aes(ymin=lower, ymax=upper))
Los resultados del modelo muestran que la hipótesis que sigue teniendo mayor efecto sobre la prevalencia del VIH en mujeres es la de calidad de vida (con las variables de Densidad y NoDesigualdad). Así, por cada punto adicional en la densidad estatal, la probabilidad de una disminución en la prevalencia de VIH en mujeres es de 0.6% en promedio. Luego, por cada punto adicional en la No desigualdad, la probabilidad de una disminución en la prevalencia de VIH es de 0.5% en promedio. Guiandonos del gráfico de barras de error, al no existir una superposición de los intervalos en las variables significativas, los efectos son distinguibles entre sí. Observamos que Densidad y NoDesigualdad (además de la variable control women) son las únicas variables que no tienen un traslape con el 0, de ahí que sean las únicas significativas junto a la variable control.
Por todo ello podemos concluir con que las acciones estatales son las que siguen teniendo mayor predominancia en los niveles de VIH en mujeres (tanto en su aumento como en su disminución). En ambos periodos, las variables relacionadad al rol del Estado fueron las únicas que se mantuvieron significativas. Con esto, una vez más, se resalta la importancia del papel del Estado para el bienestar de la sociedad.
Antes de correr los chunks de conglomerados, para que esta parte del trabajo sea replicable se deberá descargar este zip: [link] https://app.box.com/s/r7w52vsp44xmil8dwn307yf4raqoeusy
Por favor no cambie el nombre del documento, de lo contrario no se podrá correr los chunks.
#Graficamos el mapa:
library(rgdal)
## Loading required package: sp
## rgdal: version: 1.4-4, (SVN revision 833)
## Geospatial Data Abstraction Library extensions to R successfully loaded
## Loaded GDAL runtime: GDAL 2.1.3, released 2017/20/01
## Path to GDAL shared files: /usr/share/gdal/2.1
## GDAL binary built with GEOS: TRUE
## Loaded PROJ.4 runtime: Rel. 4.9.2, 08 September 2015, [PJ_VERSION: 492]
## Path to PROJ.4 shared files: (autodetected)
## Linking to sp version: 1.3-1
folderMap='MapaMundo' #Nombre del archivo que contiene al mapa
fileName='world_map.shp'
fileToRead=file.path(folderMap,fileName)
mapamundo = readOGR(fileToRead,stringsAsFactors=FALSE)
## OGR data source with driver: ESRI Shapefile
## Source: "/cloud/project/MapaMundo/world_map.shp", layer: "world_map"
## with 246 features
## It has 11 fields
## Integer64 fields read as strings: POP2005
plot(mapamundo, border='grey')
#Creamos el objeto final:
mapamundo_VIH1=merge(mapamundo,grupos1)
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==1,]
c2=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==2,]
c3=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==3,]
c4=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==4,]
c5=mapamundo_VIH1[!is.na(mapamundo_VIH1$cluster) & mapamundo_VIH1$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="firebrick",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkred",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="indianred",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="red",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="tomato",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
Creamos una nueva subset solo con las variables Empoderamiento, Metodos y VIH. Pedimos las distancias entre los casos según las variables independientes.
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH1_H1=VIH1gg[c(1,2,10)]
VIH1_H1=dist(VIH1_H1[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento
Con la función Kmeans separamos en cinco centroides.
#Pedimos el numero de grupos:
VIH1H_clus=kmeans(VIH1_H1,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1H_clus$cluster
## Albania Algeria Argentina
## 1 3 1
## Armenia Azerbaijan Bangladesh
## 5 5 3
## Belarus Belize Benin
## 1 5 2
## Bolivia Botswana Brazil
## 5 4 1
## Burkina Faso Burundi Cabo Verde
## 2 2 1
## Cambodia Cameroon Chad
## 2 2 2
## Colombia Congo, Dem. Rep. Congo, Rep.
## 1 2 5
## Costa Rica Cote d'Ivoire Cuba
## 3 2 3
## Dominican Republic Ecuador Egypt, Arab Rep.
## 1 1 3
## El Salvador Eswatini Ethiopia
## 1 4 2
## Georgia Ghana Guinea
## 5 2 2
## Guinea-Bissau Guyana Haiti
## 2 5 5
## Honduras India Indonesia
## 1 3 1
## Iran, Islamic Rep. Kazakhstan Kenya
## 3 5 5
## Kyrgyz Republic Lao PDR Lebanon
## 5 2 3
## Lesotho Liberia Madagascar
## 4 2 2
## Malawi Malaysia Mali
## 2 5 2
## Mauritania Mexico Moldova
## 2 1 1
## Mongolia Montenegro Morocco
## 1 5 3
## Mozambique Myanmar Namibia
## 2 5 5
## Nepal Nicaragua Niger
## 2 1 2
## Nigeria Pakistan Papua New Guinea
## 2 3 5
## Paraguay Peru Philippines
## 1 1 5
## Rwanda Senegal Serbia
## 2 2 5
## Sierra Leone South Africa Sri Lanka
## 2 4 1
## Sudan Suriname Tajikistan
## 2 5 5
## Tanzania Thailand Togo
## 2 1 2
## Trinidad and Tobago Tunisia Uganda
## 5 3 2
## Ukraine Uruguay Uzbekistan
## 1 1 1
## Vietnam Zambia Zimbabwe
## 1 2 2
table(VIH1H_clus$cluster)
##
## 1 2 3 4 5
## 23 31 11 4 21
Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1H=as.data.frame(VIH1H_clus$cluster)
grupos1H
## VIH1H_clus$cluster
## Albania 1
## Algeria 3
## Argentina 1
## Armenia 5
## Azerbaijan 5
## Bangladesh 3
## Belarus 1
## Belize 5
## Benin 2
## Bolivia 5
## Botswana 4
## Brazil 1
## Burkina Faso 2
## Burundi 2
## Cabo Verde 1
## Cambodia 2
## Cameroon 2
## Chad 2
## Colombia 1
## Congo, Dem. Rep. 2
## Congo, Rep. 5
## Costa Rica 3
## Cote d'Ivoire 2
## Cuba 3
## Dominican Republic 1
## Ecuador 1
## Egypt, Arab Rep. 3
## El Salvador 1
## Eswatini 4
## Ethiopia 2
## Georgia 5
## Ghana 2
## Guinea 2
## Guinea-Bissau 2
## Guyana 5
## Haiti 5
## Honduras 1
## India 3
## Indonesia 1
## Iran, Islamic Rep. 3
## Kazakhstan 5
## Kenya 5
## Kyrgyz Republic 5
## Lao PDR 2
## Lebanon 3
## Lesotho 4
## Liberia 2
## Madagascar 2
## Malawi 2
## Malaysia 5
## Mali 2
## Mauritania 2
## Mexico 1
## Moldova 1
## Mongolia 1
## Montenegro 5
## Morocco 3
## Mozambique 2
## Myanmar 5
## Namibia 5
## Nepal 2
## Nicaragua 1
## Niger 2
## Nigeria 2
## Pakistan 3
## Papua New Guinea 5
## Paraguay 1
## Peru 1
## Philippines 5
## Rwanda 2
## Senegal 2
## Serbia 5
## Sierra Leone 2
## South Africa 4
## Sri Lanka 1
## Sudan 2
## Suriname 5
## Tajikistan 5
## Tanzania 2
## Thailand 1
## Togo 2
## Trinidad and Tobago 5
## Tunisia 3
## Uganda 2
## Ukraine 1
## Uruguay 1
## Uzbekistan 1
## Vietnam 1
## Zambia 2
## Zimbabwe 2
names(grupos1H)='cluster'
grupos1H$NAME=row.names(grupos1H)
head(grupos1H)
## cluster NAME
## Albania 1 Albania
## Algeria 3 Algeria
## Argentina 1 Argentina
## Armenia 5 Armenia
## Azerbaijan 5 Azerbaijan
## Bangladesh 3 Bangladesh
#Creamos el objeto final:
mapamundo_VIH1H=merge(mapamundo,grupos1H)
Creamos una mapa interactivo:
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==1,]
c2=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==2,]
c3=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==3,]
c4=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==4,]
c5=mapamundo_VIH1H[!is.na(mapamundo_VIH1H$cluster) & mapamundo_VIH1H$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="darkmagenta",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkorchid",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="deeppink",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="hotpink",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="mediumvioletred",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
Creamos una nueva subset solo con las variables Densidad, NoDesigualdad, Salud y VIH. Pedimos las distancias entre los casos según las variables independientes.
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH1_H2=VIH1gg[c(3,5,6,10)]
VIH1_H2=dist(VIH1_H2[c(1:4)]) #Pedimos las distancias como un criterio de agrupamiento
Con la función Kmeans separamos en cinco centroides.
#Pedimos el numero de grupos:
VIH1H2_clus=kmeans(VIH1_H2,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1H2_clus$cluster
## Albania Algeria Argentina
## 5 5 1
## Armenia Azerbaijan Bangladesh
## 5 5 2
## Belarus Belize Benin
## 5 3 2
## Bolivia Botswana Brazil
## 3 4 1
## Burkina Faso Burundi Cabo Verde
## 2 2 3
## Cambodia Cameroon Chad
## 3 2 2
## Colombia Congo, Dem. Rep. Congo, Rep.
## 1 2 2
## Costa Rica Cote d'Ivoire Cuba
## 1 2 5
## Dominican Republic Ecuador Egypt, Arab Rep.
## 1 1 5
## El Salvador Eswatini Ethiopia
## 1 4 2
## Georgia Ghana Guinea
## 5 3 2
## Guinea-Bissau Guyana Haiti
## 2 3 2
## Honduras India Indonesia
## 1 3 3
## Iran, Islamic Rep. Kazakhstan Kenya
## 3 5 2
## Kyrgyz Republic Lao PDR Lebanon
## 5 3 5
## Lesotho Liberia Madagascar
## 4 2 2
## Malawi Malaysia Mali
## 2 5 2
## Mauritania Mexico Moldova
## 2 1 5
## Mongolia Montenegro Morocco
## 5 5 3
## Mozambique Myanmar Namibia
## 2 3 4
## Nepal Nicaragua Niger
## 3 3 2
## Nigeria Pakistan Papua New Guinea
## 2 5 2
## Paraguay Peru Philippines
## 1 3 3
## Rwanda Senegal Serbia
## 2 3 1
## Sierra Leone South Africa Sri Lanka
## 2 4 3
## Sudan Suriname Tajikistan
## 2 1 5
## Tanzania Thailand Togo
## 2 1 2
## Trinidad and Tobago Tunisia Uganda
## 5 5 2
## Ukraine Uruguay Uzbekistan
## 5 1 5
## Vietnam Zambia Zimbabwe
## 5 2 4
table(VIH1H2_clus$cluster)
##
## 1 2 3 4 5
## 14 30 18 6 22
Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1H2=as.data.frame(VIH1H2_clus$cluster)
grupos1H2
## VIH1H2_clus$cluster
## Albania 5
## Algeria 5
## Argentina 1
## Armenia 5
## Azerbaijan 5
## Bangladesh 2
## Belarus 5
## Belize 3
## Benin 2
## Bolivia 3
## Botswana 4
## Brazil 1
## Burkina Faso 2
## Burundi 2
## Cabo Verde 3
## Cambodia 3
## Cameroon 2
## Chad 2
## Colombia 1
## Congo, Dem. Rep. 2
## Congo, Rep. 2
## Costa Rica 1
## Cote d'Ivoire 2
## Cuba 5
## Dominican Republic 1
## Ecuador 1
## Egypt, Arab Rep. 5
## El Salvador 1
## Eswatini 4
## Ethiopia 2
## Georgia 5
## Ghana 3
## Guinea 2
## Guinea-Bissau 2
## Guyana 3
## Haiti 2
## Honduras 1
## India 3
## Indonesia 3
## Iran, Islamic Rep. 3
## Kazakhstan 5
## Kenya 2
## Kyrgyz Republic 5
## Lao PDR 3
## Lebanon 5
## Lesotho 4
## Liberia 2
## Madagascar 2
## Malawi 2
## Malaysia 5
## Mali 2
## Mauritania 2
## Mexico 1
## Moldova 5
## Mongolia 5
## Montenegro 5
## Morocco 3
## Mozambique 2
## Myanmar 3
## Namibia 4
## Nepal 3
## Nicaragua 3
## Niger 2
## Nigeria 2
## Pakistan 5
## Papua New Guinea 2
## Paraguay 1
## Peru 3
## Philippines 3
## Rwanda 2
## Senegal 3
## Serbia 1
## Sierra Leone 2
## South Africa 4
## Sri Lanka 3
## Sudan 2
## Suriname 1
## Tajikistan 5
## Tanzania 2
## Thailand 1
## Togo 2
## Trinidad and Tobago 5
## Tunisia 5
## Uganda 2
## Ukraine 5
## Uruguay 1
## Uzbekistan 5
## Vietnam 5
## Zambia 2
## Zimbabwe 4
names(grupos1H2)='cluster'
grupos1H2$NAME=row.names(grupos1H2)
head(grupos1H2)
## cluster NAME
## Albania 5 Albania
## Algeria 5 Algeria
## Argentina 1 Argentina
## Armenia 5 Armenia
## Azerbaijan 5 Azerbaijan
## Bangladesh 2 Bangladesh
#Creamos el objeto final:
mapamundo_VIH1H2=merge(mapamundo,grupos1H2)
Creamos un mapa interactivo:
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==1,]
c2=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==2,]
c3=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==3,]
c4=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==4,]
c5=mapamundo_VIH1H2[!is.na(mapamundo_VIH1H2$cluster) & mapamundo_VIH1H2$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="chocolate",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="gold",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="sienna",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="peru",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="orange",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
Creamos una nueva subset solo con las variables DesarrolloTec, Migracion y VIH. Pedimos las distancias entre los casos según las variables independientes.
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH1_H3=VIH1gg[c(4,7,10)]
VIH1_H3=dist(VIH1_H3[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento
Con la función Kmeans separamos en cinco centroides.
#Pedimos el numero de grupos:
VIH1H3_clus=kmeans(VIH1_H3,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH1H3_clus$cluster
## Albania Algeria Argentina
## 5 5 1
## Armenia Azerbaijan Bangladesh
## 5 5 3
## Belarus Belize Benin
## 1 2 2
## Bolivia Botswana Brazil
## 2 4 2
## Burkina Faso Burundi Cabo Verde
## 5 1 2
## Cambodia Cameroon Chad
## 2 2 2
## Colombia Congo, Dem. Rep. Congo, Rep.
## 5 1 2
## Costa Rica Cote d'Ivoire Cuba
## 1 2 1
## Dominican Republic Ecuador Egypt, Arab Rep.
## 2 5 5
## El Salvador Eswatini Ethiopia
## 5 3 5
## Georgia Ghana Guinea
## 5 5 2
## Guinea-Bissau Guyana Haiti
## 2 2 2
## Honduras India Indonesia
## 5 3 2
## Iran, Islamic Rep. Kazakhstan Kenya
## 1 5 1
## Kyrgyz Republic Lao PDR Lebanon
## 5 2 2
## Lesotho Liberia Madagascar
## 4 2 1
## Malawi Malaysia Mali
## 2 1 5
## Mauritania Mexico Moldova
## 2 1 5
## Mongolia Montenegro Morocco
## 5 2 1
## Mozambique Myanmar Namibia
## 4 4 2
## Nepal Nicaragua Niger
## 2 2 2
## Nigeria Pakistan Papua New Guinea
## 5 4 2
## Paraguay Peru Philippines
## 5 5 4
## Rwanda Senegal Serbia
## 2 2 1
## Sierra Leone South Africa Sri Lanka
## 2 4 5
## Sudan Suriname Tajikistan
## 1 2 5
## Tanzania Thailand Togo
## 1 5 2
## Trinidad and Tobago Tunisia Uganda
## 5 1 1
## Ukraine Uruguay Uzbekistan
## 2 1 5
## Vietnam Zambia Zimbabwe
## 2 4 4
table(VIH1H3_clus$cluster)
##
## 1 2 3 4 5
## 18 34 3 9 26
Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos1H3=as.data.frame(VIH1H3_clus$cluster)
grupos1H3
## VIH1H3_clus$cluster
## Albania 5
## Algeria 5
## Argentina 1
## Armenia 5
## Azerbaijan 5
## Bangladesh 3
## Belarus 1
## Belize 2
## Benin 2
## Bolivia 2
## Botswana 4
## Brazil 2
## Burkina Faso 5
## Burundi 1
## Cabo Verde 2
## Cambodia 2
## Cameroon 2
## Chad 2
## Colombia 5
## Congo, Dem. Rep. 1
## Congo, Rep. 2
## Costa Rica 1
## Cote d'Ivoire 2
## Cuba 1
## Dominican Republic 2
## Ecuador 5
## Egypt, Arab Rep. 5
## El Salvador 5
## Eswatini 3
## Ethiopia 5
## Georgia 5
## Ghana 5
## Guinea 2
## Guinea-Bissau 2
## Guyana 2
## Haiti 2
## Honduras 5
## India 3
## Indonesia 2
## Iran, Islamic Rep. 1
## Kazakhstan 5
## Kenya 1
## Kyrgyz Republic 5
## Lao PDR 2
## Lebanon 2
## Lesotho 4
## Liberia 2
## Madagascar 1
## Malawi 2
## Malaysia 1
## Mali 5
## Mauritania 2
## Mexico 1
## Moldova 5
## Mongolia 5
## Montenegro 2
## Morocco 1
## Mozambique 4
## Myanmar 4
## Namibia 2
## Nepal 2
## Nicaragua 2
## Niger 2
## Nigeria 5
## Pakistan 4
## Papua New Guinea 2
## Paraguay 5
## Peru 5
## Philippines 4
## Rwanda 2
## Senegal 2
## Serbia 1
## Sierra Leone 2
## South Africa 4
## Sri Lanka 5
## Sudan 1
## Suriname 2
## Tajikistan 5
## Tanzania 1
## Thailand 5
## Togo 2
## Trinidad and Tobago 5
## Tunisia 1
## Uganda 1
## Ukraine 2
## Uruguay 1
## Uzbekistan 5
## Vietnam 2
## Zambia 4
## Zimbabwe 4
names(grupos1H3)='cluster'
grupos1H3$NAME=row.names(grupos1H3)
head(grupos1H3)
## cluster NAME
## Albania 5 Albania
## Algeria 5 Algeria
## Argentina 1 Argentina
## Armenia 5 Armenia
## Azerbaijan 5 Azerbaijan
## Bangladesh 3 Bangladesh
#Creamos el objeto final:
mapamundo_VIH1H3=merge(mapamundo,grupos1H3)
Creamos un mapa interactivo:
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==1,]
c2=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==2,]
c3=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==3,]
c4=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==4,]
c5=mapamundo_VIH1H3[!is.na(mapamundo_VIH1H3$cluster) & mapamundo_VIH1H3$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="darkgreen",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="yellowgreen",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="forestgreen",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="limegreen",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="lightgreen",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
#Creamos el objeto final:
mapamundo_VIH2=merge(mapamundo,grupos2)
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==1,]
c2=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==2,]
c3=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==3,]
c4=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==4,]
c5=mapamundo_VIH2[!is.na(mapamundo_VIH2$cluster) & mapamundo_VIH2$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="firebrick",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkred",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="indianred",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="red",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="tomato",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
Creamos una nueva subset solo con las variables Empoderamiento, Metodos y VIH. Pedimos las distancias entre los casos según las variables independientes.
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH2_H1=VIH2gg[c(1,2,10)]
VIH2_H1=dist(VIH2_H1[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento
Con la función Kmeans separamos en cinco centroides.
#Pedimos el numero de grupos:
VIH2H_clus=kmeans(VIH2_H1,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2H_clus$cluster
## Albania Algeria Angola
## 5 3 1
## Argentina Armenia Azerbaijan
## 4 4 4
## Bangladesh Barbados Belarus
## 3 4 4
## Belize Benin Bolivia
## 4 1 4
## Botswana Burkina Faso Burundi
## 2 1 1
## Cambodia Cameroon Chad
## 1 1 1
## Colombia Comoros Congo, Dem. Rep.
## 5 1 1
## Congo, Rep. Costa Rica Cote d'Ivoire
## 4 5 1
## Cuba Dominican Republic Ecuador
## 5 5 5
## Egypt, Arab Rep. El Salvador Equatorial Guinea
## 3 5 1
## Eritrea Eswatini Ethiopia
## 1 2 1
## Gabon Gambia, The Georgia
## 4 1 4
## Ghana Guatemala Guinea
## 1 4 1
## Guinea-Bissau Guyana Haiti
## 1 4 4
## Honduras India Indonesia
## 5 3 4
## Iran, Islamic Rep. Kazakhstan Kenya
## 3 4 1
## Kyrgyz Republic Lao PDR Lebanon
## 4 1 3
## Lesotho Madagascar Malawi
## 2 1 1
## Mali Mauritania Mexico
## 1 3 5
## Moldova Mongolia Morocco
## 5 4 3
## Mozambique Myanmar Nepal
## 1 4 1
## Nicaragua Niger Nigeria
## 5 1 1
## Pakistan Panama Paraguay
## 3 4 5
## Peru Philippines Rwanda
## 5 4 1
## Senegal Serbia Sierra Leone
## 1 5 1
## South Sudan Sudan Suriname
## 1 3 4
## Tajikistan Tanzania Thailand
## 3 1 5
## Togo Trinidad and Tobago Tunisia
## 1 4 3
## Uganda Ukraine Vietnam
## 1 5 5
## Zimbabwe
## 1
table(VIH2H_clus$cluster)
##
## 1 2 3 4 5
## 34 3 12 22 17
Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2H=as.data.frame(VIH2H_clus$cluster)
grupos2H
## VIH2H_clus$cluster
## Albania 5
## Algeria 3
## Angola 1
## Argentina 4
## Armenia 4
## Azerbaijan 4
## Bangladesh 3
## Barbados 4
## Belarus 4
## Belize 4
## Benin 1
## Bolivia 4
## Botswana 2
## Burkina Faso 1
## Burundi 1
## Cambodia 1
## Cameroon 1
## Chad 1
## Colombia 5
## Comoros 1
## Congo, Dem. Rep. 1
## Congo, Rep. 4
## Costa Rica 5
## Cote d'Ivoire 1
## Cuba 5
## Dominican Republic 5
## Ecuador 5
## Egypt, Arab Rep. 3
## El Salvador 5
## Equatorial Guinea 1
## Eritrea 1
## Eswatini 2
## Ethiopia 1
## Gabon 4
## Gambia, The 1
## Georgia 4
## Ghana 1
## Guatemala 4
## Guinea 1
## Guinea-Bissau 1
## Guyana 4
## Haiti 4
## Honduras 5
## India 3
## Indonesia 4
## Iran, Islamic Rep. 3
## Kazakhstan 4
## Kenya 1
## Kyrgyz Republic 4
## Lao PDR 1
## Lebanon 3
## Lesotho 2
## Madagascar 1
## Malawi 1
## Mali 1
## Mauritania 3
## Mexico 5
## Moldova 5
## Mongolia 4
## Morocco 3
## Mozambique 1
## Myanmar 4
## Nepal 1
## Nicaragua 5
## Niger 1
## Nigeria 1
## Pakistan 3
## Panama 4
## Paraguay 5
## Peru 5
## Philippines 4
## Rwanda 1
## Senegal 1
## Serbia 5
## Sierra Leone 1
## South Sudan 1
## Sudan 3
## Suriname 4
## Tajikistan 3
## Tanzania 1
## Thailand 5
## Togo 1
## Trinidad and Tobago 4
## Tunisia 3
## Uganda 1
## Ukraine 5
## Vietnam 5
## Zimbabwe 1
names(grupos2H)='cluster'
grupos2H$NAME=row.names(grupos2H)
head(grupos2H)
## cluster NAME
## Albania 5 Albania
## Algeria 3 Algeria
## Angola 1 Angola
## Argentina 4 Argentina
## Armenia 4 Armenia
## Azerbaijan 4 Azerbaijan
#Creamos el objeto final:
mapamundo_VIH2H=merge(mapamundo,grupos2H)
Creamos una mapa interactivo:
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==1,]
c2=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==2,]
c3=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==3,]
c4=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==4,]
c5=mapamundo_VIH2H[!is.na(mapamundo_VIH2H$cluster) & mapamundo_VIH2H$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="darkmagenta",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="darkorchid",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="deeppink",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="hotpink",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="mediumvioletred",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
Creamos una nueva subset solo con las variables Densidad, NoDesigualdad, Salud y VIH. Pedimos las distancias entre los casos según las variables independientes.
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH2_H2=VIH2gg[c(3,5,6,10)]
VIH2_H2=dist(VIH2_H2[c(1:4)]) #Pedimos las distancias como un criterio de agrupamiento
Con la función Kmeans separamos en cinco centroides.
#Pedimos el numero de grupos:
VIH2H2_clus=kmeans(VIH2_H2,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2H2_clus$cluster
## Albania Algeria Angola
## 5 5 1
## Argentina Armenia Azerbaijan
## 3 5 2
## Bangladesh Barbados Belarus
## 2 3 5
## Belize Benin Bolivia
## 2 1 2
## Botswana Burkina Faso Burundi
## 4 1 1
## Cambodia Cameroon Chad
## 3 2 1
## Colombia Comoros Congo, Dem. Rep.
## 3 2 1
## Congo, Rep. Costa Rica Cote d'Ivoire
## 1 3 1
## Cuba Dominican Republic Ecuador
## 3 3 3
## Egypt, Arab Rep. El Salvador Equatorial Guinea
## 5 3 1
## Eritrea Eswatini Ethiopia
## 2 4 2
## Gabon Gambia, The Georgia
## 2 1 2
## Ghana Guatemala Guinea
## 2 3 1
## Guinea-Bissau Guyana Haiti
## 1 3 2
## Honduras India Indonesia
## 3 2 2
## Iran, Islamic Rep. Kazakhstan Kenya
## 2 5 2
## Kyrgyz Republic Lao PDR Lebanon
## 5 2 5
## Lesotho Madagascar Malawi
## 4 1 1
## Mali Mauritania Mexico
## 1 2 3
## Moldova Mongolia Morocco
## 5 2 2
## Mozambique Myanmar Nepal
## 1 2 2
## Nicaragua Niger Nigeria
## 2 1 1
## Pakistan Panama Paraguay
## 2 3 3
## Peru Philippines Rwanda
## 3 2 1
## Senegal Serbia Sierra Leone
## 2 5 1
## South Sudan Sudan Suriname
## 1 1 3
## Tajikistan Tanzania Thailand
## 5 1 3
## Togo Trinidad and Tobago Tunisia
## 1 3 5
## Uganda Ukraine Vietnam
## 1 5 3
## Zimbabwe
## 1
table(VIH2H2_clus$cluster)
##
## 1 2 3 4 5
## 26 26 20 3 13
Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2H2=as.data.frame(VIH2H2_clus$cluster)
grupos2H2
## VIH2H2_clus$cluster
## Albania 5
## Algeria 5
## Angola 1
## Argentina 3
## Armenia 5
## Azerbaijan 2
## Bangladesh 2
## Barbados 3
## Belarus 5
## Belize 2
## Benin 1
## Bolivia 2
## Botswana 4
## Burkina Faso 1
## Burundi 1
## Cambodia 3
## Cameroon 2
## Chad 1
## Colombia 3
## Comoros 2
## Congo, Dem. Rep. 1
## Congo, Rep. 1
## Costa Rica 3
## Cote d'Ivoire 1
## Cuba 3
## Dominican Republic 3
## Ecuador 3
## Egypt, Arab Rep. 5
## El Salvador 3
## Equatorial Guinea 1
## Eritrea 2
## Eswatini 4
## Ethiopia 2
## Gabon 2
## Gambia, The 1
## Georgia 2
## Ghana 2
## Guatemala 3
## Guinea 1
## Guinea-Bissau 1
## Guyana 3
## Haiti 2
## Honduras 3
## India 2
## Indonesia 2
## Iran, Islamic Rep. 2
## Kazakhstan 5
## Kenya 2
## Kyrgyz Republic 5
## Lao PDR 2
## Lebanon 5
## Lesotho 4
## Madagascar 1
## Malawi 1
## Mali 1
## Mauritania 2
## Mexico 3
## Moldova 5
## Mongolia 2
## Morocco 2
## Mozambique 1
## Myanmar 2
## Nepal 2
## Nicaragua 2
## Niger 1
## Nigeria 1
## Pakistan 2
## Panama 3
## Paraguay 3
## Peru 3
## Philippines 2
## Rwanda 1
## Senegal 2
## Serbia 5
## Sierra Leone 1
## South Sudan 1
## Sudan 1
## Suriname 3
## Tajikistan 5
## Tanzania 1
## Thailand 3
## Togo 1
## Trinidad and Tobago 3
## Tunisia 5
## Uganda 1
## Ukraine 5
## Vietnam 3
## Zimbabwe 1
names(grupos2H2)='cluster'
grupos2H2$NAME=row.names(grupos2H2)
head(grupos2H2)
## cluster NAME
## Albania 5 Albania
## Algeria 5 Algeria
## Angola 1 Angola
## Argentina 3 Argentina
## Armenia 5 Armenia
## Azerbaijan 2 Azerbaijan
#Creamos el objeto final:
mapamundo_VIH2H2=merge(mapamundo,grupos2H2)
Creamos un mapa interactivo:
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==1,]
c2=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==2,]
c3=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==3,]
c4=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==4,]
c5=mapamundo_VIH2H2[!is.na(mapamundo_VIH2H2$cluster) & mapamundo_VIH2H2$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="chocolate",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="gold",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="sienna",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="peru",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="orange",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))
Creamos una nueva subset solo con las variables DesarrolloTec, Migracion y VIH. Pedimos las distancias entre los casos según las variables independientes.
set.seed(15) #Para que todos los grupos tengan el mismo punto de inicio, el 15 es inventado
VIH2_H3=VIH2gg[c(4,7,10)]
VIH2_H3=dist(VIH2_H3[c(1:3)]) #Pedimos las distancias como un criterio de agrupamiento
Con la función Kmeans separamos en cinco centroides.
#Pedimos el numero de grupos:
VIH2H3_clus=kmeans(VIH2_H3,centers = 5) #El 5 hace referencia al numero de grupos que se piden
VIH2H3_clus$cluster
## Albania Algeria Angola
## 3 3 3
## Argentina Armenia Azerbaijan
## 2 3 1
## Bangladesh Barbados Belarus
## 4 4 2
## Belize Benin Bolivia
## 3 1 5
## Botswana Burkina Faso Burundi
## 4 1 2
## Cambodia Cameroon Chad
## 1 3 1
## Colombia Comoros Congo, Dem. Rep.
## 1 1 1
## Congo, Rep. Costa Rica Cote d'Ivoire
## 3 1 1
## Cuba Dominican Republic Ecuador
## 5 3 3
## Egypt, Arab Rep. El Salvador Equatorial Guinea
## 3 3 3
## Eritrea Eswatini Ethiopia
## 1 4 3
## Gabon Gambia, The Georgia
## 5 3 1
## Ghana Guatemala Guinea
## 3 3 2
## Guinea-Bissau Guyana Haiti
## 1 3 3
## Honduras India Indonesia
## 3 4 5
## Iran, Islamic Rep. Kazakhstan Kenya
## 5 3 1
## Kyrgyz Republic Lao PDR Lebanon
## 5 3 2
## Lesotho Madagascar Malawi
## 4 1 2
## Mali Mauritania Mexico
## 2 3 1
## Moldova Mongolia Morocco
## 1 3 1
## Mozambique Myanmar Nepal
## 2 3 3
## Nicaragua Niger Nigeria
## 3 2 1
## Pakistan Panama Paraguay
## 5 1 5
## Peru Philippines Rwanda
## 3 5 1
## Senegal Serbia Sierra Leone
## 1 2 2
## South Sudan Sudan Suriname
## 2 1 3
## Tajikistan Tanzania Thailand
## 5 1 3
## Togo Trinidad and Tobago Tunisia
## 1 2 3
## Uganda Ukraine Vietnam
## 1 3 3
## Zimbabwe
## 2
table(VIH2H3_clus$cluster)
##
## 1 2 3 4 5
## 26 14 32 6 10
Hacemos que los clusters se vuelvan data.frame e incorporamos a la data.
#Creamos un objeto (cluster) que mezcla la informacion de los grupos con el mapa:
grupos2H3=as.data.frame(VIH2H3_clus$cluster)
grupos2H3
## VIH2H3_clus$cluster
## Albania 3
## Algeria 3
## Angola 3
## Argentina 2
## Armenia 3
## Azerbaijan 1
## Bangladesh 4
## Barbados 4
## Belarus 2
## Belize 3
## Benin 1
## Bolivia 5
## Botswana 4
## Burkina Faso 1
## Burundi 2
## Cambodia 1
## Cameroon 3
## Chad 1
## Colombia 1
## Comoros 1
## Congo, Dem. Rep. 1
## Congo, Rep. 3
## Costa Rica 1
## Cote d'Ivoire 1
## Cuba 5
## Dominican Republic 3
## Ecuador 3
## Egypt, Arab Rep. 3
## El Salvador 3
## Equatorial Guinea 3
## Eritrea 1
## Eswatini 4
## Ethiopia 3
## Gabon 5
## Gambia, The 3
## Georgia 1
## Ghana 3
## Guatemala 3
## Guinea 2
## Guinea-Bissau 1
## Guyana 3
## Haiti 3
## Honduras 3
## India 4
## Indonesia 5
## Iran, Islamic Rep. 5
## Kazakhstan 3
## Kenya 1
## Kyrgyz Republic 5
## Lao PDR 3
## Lebanon 2
## Lesotho 4
## Madagascar 1
## Malawi 2
## Mali 2
## Mauritania 3
## Mexico 1
## Moldova 1
## Mongolia 3
## Morocco 1
## Mozambique 2
## Myanmar 3
## Nepal 3
## Nicaragua 3
## Niger 2
## Nigeria 1
## Pakistan 5
## Panama 1
## Paraguay 5
## Peru 3
## Philippines 5
## Rwanda 1
## Senegal 1
## Serbia 2
## Sierra Leone 2
## South Sudan 2
## Sudan 1
## Suriname 3
## Tajikistan 5
## Tanzania 1
## Thailand 3
## Togo 1
## Trinidad and Tobago 2
## Tunisia 3
## Uganda 1
## Ukraine 3
## Vietnam 3
## Zimbabwe 2
names(grupos2H3)='cluster'
grupos2H3$NAME=row.names(grupos2H3)
head(grupos2H3)
## cluster NAME
## Albania 3 Albania
## Algeria 3 Algeria
## Angola 3 Angola
## Argentina 2 Argentina
## Armenia 3 Armenia
## Azerbaijan 1 Azerbaijan
#Creamos el objeto final:
mapamundo_VIH2H3=merge(mapamundo,grupos2H3)
Creamos un mapa interactivo:
#Para tener un mapa interactivo asignando colores a cada grupo:
library(leaflet)
#newMaps!
c1=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==1,]
c2=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==2,]
c3=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==3,]
c4=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==4,]
c5=mapamundo_VIH2H3[!is.na(mapamundo_VIH2H3$cluster) & mapamundo_VIH2H3$cluster==5,]
title="Clusters"
# base Layer
base= leaflet() %>% addProviderTiles("CartoDB.Positron")
layer1= base %>%
addPolygons(data=c1,color="darkgreen",fillOpacity = 1,stroke = F,
group = "1")
layer_12= layer1%>%addPolygons(data=c2,color="yellowgreen",fillOpacity = 1,stroke = F,
group = "2")
layer_123= layer_12%>%addPolygons(data=c3,color="forestgreen",fillOpacity = 1,stroke = F,
group = "3")
layer_1234= layer_123%>%addPolygons(data=c4,color="limegreen",fillOpacity = 1,stroke = F,
group = "4")
layer_12345= layer_1234%>%addPolygons(data=c5,color="lightgreen",fillOpacity = 1,stroke = F,
group = "5")
layer_12345
layer_12345%>% addLayersControl(
overlayGroups = c("1", "2","3","4","5"),
options = layersControlOptions(collapsed = FALSE))