En este paper mostraremos qué está afectando la desigualdad de género en el mundo, a nivel de países, según una recopilación de data que incluye variables de la data “Gender, Institutions and Development Database (GID-DB) 2019” y el Gender Inequality Index 2019 de la ONU. Buscaremos demotrar que la desigualdad de género es afectada por la manera en que las mujeres perciben las oportunidades que tienen, por su participación en la sociedad y qué tan conformes se sienten con la seguridad en su país.
Los conceptos de dichas latentes están basados en las fuentes previamente mencionadas. La primera latente, acerca de las oportunidades, está conformada por tres indicadores: secundaria completa (porcentaje de la población de 25 a más años que ha terminado la secundaria), libertad de movimiento (porcentaje de mujeres que declaran no sentirse seguras caminando solas por la noche) y posesión de cuentas financieras (porcentaje de la población femenina de 15 años a más con una cuenta financiera).
La segunda, sobre su participación, está conformada por también tres indicadores: voz política (el porcentaje de representantes en la(s) cámaras del parlamento de cada país que son mujeres), la autonomía reproductiva (mide la protección legal que tienen las mujeres sobre sus derechos reproductivos) y el desempleo (ratio entre hombres y mujeres del país que son desempleados).
La tercera y última, sobre su seguridad, está conformada por solo dos indicadores: violencia hacia la mujer (mide la protección legal que tienen las mujeres sobre la violencia de género) y la desconfianza hacia el sistema judicial de su país (porcentaje de mujeres que declaran no confiar en el poder judicial de su país).
library(rio)
library(ggplot2)
library(cluster)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(polycor)
library(ggcorrplot)
library(psych)
##
## Attaching package: 'psych'
## The following object is masked from 'package:polycor':
##
## polyserial
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
library(matrixcalc)
library(GPArotation)
library(lavaan)
## This is lavaan 0.6-9
## lavaan is FREE software! Please report any bugs.
##
## Attaching package: 'lavaan'
## The following object is masked from 'package:psych':
##
## cor2cov
library(BBmisc)
##
## Attaching package: 'BBmisc'
## The following objects are masked from 'package:dplyr':
##
## coalesce, collapse
## The following object is masked from 'package:base':
##
## isFALSE
github="https://raw.githubusercontent.com/rafa0303/Trabajo-final/main/desigualdad.csv"
data=import(github)
data.frame(data)
## Pais DesigualdadGenero MLAutonomia MLViolencia
## 1 Afghanistan 0.58 0.75 0.75
## 2 Albania 0.23 0.00 0.50
## 3 Algeria 0.44 0.75 0.50
## 4 Argentina 0.35 0.50 0.75
## 5 Armenia 0.26 0.00 0.75
## 6 Australia 0.10 0.00 0.75
## 7 Austria 0.07 0.00 0.25
## 8 Azerbaijan 0.32 0.00 0.75
## 9 Bangladesh 0.54 0.75 0.75
## 10 Belarus 0.12 0.00 0.75
## 11 Belgium 0.04 0.00 0.50
## 12 Benin 0.61 0.50 0.50
## 13 Bolivia 0.45 0.25 0.25
## 14 Bosnia and Herzegovina 0.16 0.00 0.50
## 15 Botswana 0.46 0.25 0.75
## 16 Brazil 0.39 0.50 0.25
## 17 Bulgaria 0.22 0.00 0.75
## 18 Burkina Faso 0.61 0.50 0.75
## 19 Cambodia 0.47 0.00 0.50
## 20 Cameroon 0.57 0.50 0.75
## 21 Canada 0.08 0.00 0.25
## 22 Central African Republic 0.68 0.25 0.25
## 23 Chad 0.70 0.25 0.75
## 24 Chile 0.29 0.50 0.75
## 25 Colombia 0.41 0.50 0.25
## 26 Congo 0.58 1.00 0.75
## 27 Costa de Marfil 0.66 0.75 0.75
## 28 Costa Rica 0.28 0.75 0.75
## 29 Croatia 0.12 0.00 0.25
## 30 Cyprus 0.09 0.25 0.25
## 31 Democratic Republic of the Congo 0.66 0.75 0.75
## 32 Denmark 0.04 0.00 0.50
## 33 Dominican Republic 0.45 0.75 0.25
## 34 Ecuador 0.39 0.50 0.50
## 35 El Salvador 0.40 1.00 0.50
## 36 Estonia 0.09 0.00 0.25
## 37 Ethiopia 0.51 0.25 0.50
## 38 Finland 0.05 0.25 0.75
## 39 France 0.05 0.00 0.25
## 40 Gabon 0.53 1.00 0.75
## 41 Georgia 0.35 0.00 0.75
## 42 Germany 0.08 0.00 0.75
## 43 Ghana 0.54 0.25 0.75
## 44 Greece 0.12 0.00 0.25
## 45 Guatemala 0.49 0.75 0.75
## 46 Haiti 0.62 1.00 0.75
## 47 Honduras 0.48 1.00 0.25
## 48 Hungary 0.26 0.25 0.75
## 49 India 0.50 0.25 0.50
## 50 Indonesia 0.45 0.50 0.75
## 51 Iraq 0.54 0.75 0.75
## 52 Ireland 0.09 0.75 0.25
## 53 Israel 0.10 0.25 0.75
## 54 Italy 0.07 0.00 0.75
## 55 Jamaica 0.41 0.75 0.75
## 56 Japan 0.10 0.50 0.75
## 57 Jordan 0.47 0.75 0.75
## 58 Kazakhstan 0.20 0.00 0.75
## 59 Kenya 0.54 0.75 0.50
## 60 Kyrgyzstan 0.38 0.00 0.75
## 61 Lao People's Democratic Republic 0.46 0.75 0.25
## 62 Latvia 0.17 0.00 0.75
## 63 Lebanon 0.36 0.75 0.75
## 64 Lesotho 0.55 0.50 0.75
## 65 Liberia 0.65 0.25 0.75
## 66 Lithuania 0.12 0.00 0.50
## 67 Luxembourg 0.08 0.00 0.75
## 68 Malawi 0.62 0.75 0.50
## 69 Mali 0.68 0.50 0.75
## 70 Malta 0.20 1.00 0.25
## 71 Mauritania 0.62 1.00 0.75
## 72 Mauritius 0.37 0.25 0.50
## 73 Mexico 0.33 0.50 0.50
## 74 Mongolia 0.32 0.00 0.25
## 75 Montenegro 0.12 0.00 0.25
## 76 Morocco 0.49 0.75 0.75
## 77 Mozambique 0.57 0.00 0.75
## 78 Myanmar 0.46 0.75 0.75
## 79 Namibia 0.46 0.25 0.25
## 80 Nepal 0.48 0.00 0.25
## 81 Netherlands 0.04 0.00 0.75
## 82 New Zealand 0.13 0.25 0.75
## 83 Nicaragua 0.46 1.00 0.25
## 84 Niger 0.65 0.75 0.75
## 85 North Macedonia 0.14 0.00 0.75
## 86 Norway 0.04 0.00 0.25
## 87 Pakistan 0.55 0.75 0.50
## 88 Panama 0.46 0.50 0.25
## 89 Paraguay 0.48 0.75 0.50
## 90 Peru 0.38 0.75 0.75
## 91 Philippines 0.42 0.75 0.75
## 92 Poland 0.12 0.50 0.75
## 93 Portugal 0.08 0.00 0.25
## 94 Romania 0.32 0.00 0.25
## 95 Rwanda 0.41 0.50 0.50
## 96 Senegal 0.52 1.00 0.50
## 97 Serbia 0.16 0.00 0.25
## 98 Sierra Leone 0.64 0.75 0.50
## 99 Singapore 0.06 0.00 0.50
## 100 Slovenia 0.07 0.00 0.25
## 101 South Africa 0.42 0.00 0.50
## 102 Spain 0.07 0.00 0.50
## 103 Sri Lanka 0.38 0.75 0.50
## 104 Sweden 0.04 0.00 0.25
## 105 Switzerland 0.04 0.00 0.75
## 106 Tajikistan 0.38 0.00 0.75
## 107 Thailand 0.38 0.50 0.75
## 108 Togo 0.57 0.50 0.75
## 109 Trinidad and Tobago 0.32 0.75 0.75
## 110 Tunisia 0.30 0.00 0.50
## 111 Turkey 0.30 0.00 0.25
## 112 Uganda 0.53 0.75 0.75
## 113 Ukraine 0.28 0.00 0.75
## 114 United Kingdom 0.12 0.75 0.75
## 115 United States 0.18 0.00 0.50
## 116 Uruguay 0.28 0.00 0.75
## 117 Uzbekistan 0.30 0.00 0.75
## 118 Viet Nam 0.31 0.00 0.75
## 119 Yemen 0.83 0.75 0.75
## 120 Zambia 0.54 0.75 0.50
## 121 Zimbabwe 0.52 0.50 0.50
## VozPolitica LibertadMov DesconfianzaSJ SecundariaC DesempleoMuj CuentaF
## 1 27.7 62.0 65.2 13.22 2.18 7.16
## 2 27.9 70.2 54.5 93.51 0.90 38.10
## 3 25.8 58.6 48.0 39.08 2.11 29.27
## 4 38.9 61.3 54.1 66.50 1.27 50.76
## 5 18.1 58.9 52.9 96.87 1.02 40.91
## 6 28.7 78.0 59.0 89.99 1.04 99.20
## 7 34.4 50.9 49.3 100.00 0.98 98.38
## 8 16.8 66.7 42.2 93.90 1.39 27.72
## 9 20.3 66.9 50.6 45.26 1.97 35.84
## 10 34.5 67.9 54.6 87.24 0.56 81.34
## 11 38.0 73.4 48.2 82.62 1.02 98.82
## 12 7.2 46.9 41.7 18.20 1.10 28.59
## 13 53.1 63.9 58.9 52.81 1.48 53.85
## 14 21.4 56.7 50.4 73.06 1.26 54.74
## 15 9.5 71.1 62.5 89.64 1.45 46.79
## 16 10.7 66.9 62.3 61.03 1.30 67.51
## 17 23.8 64.2 55.6 94.17 0.84 73.64
## 18 11.0 38.2 23.2 6.02 2.32 34.50
## 19 20.3 71.1 54.1 15.08 0.75 21.53
## 20 31.1 57.2 53.0 32.66 1.34 30.03
## 21 27.0 80.4 52.4 100.00 0.93 99.85
## 22 8.6 54.9 43.6 13.42 1.20 9.72
## 23 12.8 36.0 32.5 1.74 1.37 14.85
## 24 22.6 67.5 63.0 78.97 1.16 71.27
## 25 18.7 66.7 62.2 53.07 1.66 42.47
## 26 11.3 51.4 50.6 46.72 1.14 20.99
## 27 10.6 32.1 52.1 17.84 1.55 35.56
## 28 35.1 64.7 58.8 53.76 1.51 60.88
## 29 18.5 63.3 55.0 94.53 1.28 82.70
## 30 17.9 80.7 51.7 78.25 1.01 90.01
## 31 8.9 44.1 34.1 36.73 0.66 24.22
## 32 37.4 74.6 50.5 89.18 1.08 100.00
## 33 26.8 61.2 54.9 58.63 1.95 54.14
## 34 38.0 67.6 64.3 51.86 1.56 42.61
## 35 32.1 64.3 60.2 39.95 0.76 24.38
## 36 26.7 75.4 50.6 100.00 0.86 98.38
## 37 38.8 66.1 49.4 11.48 1.85 29.08
## 38 42.0 91.1 57.5 100.00 0.96 99.59
## 39 39.0 58.5 48.4 81.00 1.01 91.29
## 40 17.1 46.9 44.4 65.60 2.01 53.70
## 41 16.0 66.3 48.2 97.42 0.83 63.61
## 42 30.7 55.3 48.4 95.99 0.84 99.20
## 43 12.7 46.8 40.2 55.74 1.00 53.72
## 44 18.3 62.1 47.3 61.51 1.54 84.54
## 45 12.7 70.2 60.1 38.40 1.68 42.09
## 46 2.5 51.3 45.7 26.86 1.49 30.05
## 47 21.1 65.7 58.1 34.23 1.56 40.95
## 48 10.1 71.2 56.6 96.26 1.18 72.16
## 49 11.8 58.0 49.7 39.02 1.57 76.64
## 50 19.8 81.2 50.3 44.47 0.93 51.35
## 51 25.3 29.7 24.2 39.52 1.71 19.50
## 52 22.2 61.5 49.2 90.24 0.93 95.31
## 53 27.5 68.8 51.2 87.78 1.03 93.70
## 54 31.0 59.2 54.0 75.63 1.18 91.62
## 55 17.5 66.6 55.0 69.85 1.73 77.76
## 56 10.1 66.1 48.5 95.18 0.88 98.06
## 57 15.4 75.9 45.0 82.02 1.73 26.61
## 58 27.1 66.1 52.8 98.28 1.33 60.29
## 59 21.8 58.2 47.6 29.84 0.98 77.75
## 60 19.2 69.0 61.7 98.56 1.48 38.85
## 61 27.5 65.4 41.9 34.98 0.86 31.87
## 62 16.0 75.4 61.7 100.00 0.76 92.54
## 63 3.1 56.1 46.7 54.31 1.98 32.91
## 64 22.1 63.2 54.1 32.84 1.30 46.46
## 65 9.9 66.8 63.3 18.54 1.05 28.16
## 66 21.3 59.7 55.0 92.94 0.85 81.01
## 67 28.3 56.0 44.5 100.00 1.08 98.18
## 68 16.7 69.5 63.3 17.58 1.42 29.85
## 69 8.8 47.6 37.2 7.34 1.38 25.71
## 70 11.9 74.0 47.7 74.29 1.00 96.96
## 71 25.2 44.0 37.9 12.68 1.42 15.49
## 72 11.6 64.7 48.1 65.68 2.10 87.11
## 73 42.6 65.7 57.3 58.43 1.03 33.29
## 74 17.1 65.4 59.1 91.22 0.88 94.95
## 75 23.5 58.2 50.6 87.96 1.05 67.57
## 76 20.5 70.6 52.0 28.96 1.21 16.81
## 77 39.6 49.3 45.0 13.96 1.06 32.87
## 78 10.2 68.5 50.1 28.74 1.75 25.98
## 79 41.3 72.3 65.3 40.46 1.14 80.66
## 80 32.7 71.5 59.6 28.98 0.73 41.60
## 81 36.0 80.6 53.2 86.56 1.17 99.83
## 82 38.3 79.2 61.6 97.19 1.12 99.34
## 83 45.7 60.5 58.8 48.28 1.36 24.79
## 84 17.0 46.6 42.4 4.28 0.50 10.91
## 85 37.5 67.3 52.3 41.58 0.91 72.89
## 86 41.4 81.6 44.3 96.07 0.81 100.00
## 87 20.6 52.4 38.4 26.75 2.04 7.03
## 88 18.3 68.3 60.6 74.83 1.59 42.34
## 89 13.8 61.4 57.5 47.26 1.45 46.05
## 90 27.7 65.1 58.7 57.41 1.42 34.44
## 91 29.5 61.0 57.8 75.59 1.04 38.85
## 92 28.0 66.2 56.2 82.85 1.00 87.96
## 93 34.8 73.8 50.0 53.63 1.17 90.62
## 94 20.7 68.1 54.5 87.18 0.77 53.59
## 95 61.3 77.2 49.4 12.86 1.00 44.96
## 96 41.8 55.4 38.3 11.14 1.24 38.45
## 97 34.4 73.2 52.8 85.72 1.14 70.13
## 98 12.4 55.6 47.4 19.86 0.69 15.36
## 99 23.0 60.7 52.4 76.27 1.17 96.31
## 100 36.7 78.5 52.7 96.99 1.31 96.94
## 101 42.1 55.4 45.0 74.98 1.17 69.99
## 102 39.1 58.4 52.6 73.31 1.29 91.64
## 103 5.8 68.1 59.9 82.64 2.33 73.44
## 104 43.6 74.3 43.1 88.81 0.90 100.00
## 105 32.5 55.6 41.1 96.37 1.11 98.86
## 106 19.0 62.6 59.3 98.80 0.84 42.13
## 107 4.8 71.8 54.7 43.10 1.17 79.78
## 108 17.6 42.4 40.3 27.62 0.70 37.59
## 109 31.0 64.1 54.1 74.42 1.11 73.60
## 110 31.3 62.2 46.4 42.33 1.75 28.36
## 111 14.6 54.6 46.4 44.32 1.42 54.29
## 112 34.3 62.7 54.4 27.36 1.50 52.71
## 113 12.3 73.6 65.5 94.00 0.77 61.32
## 114 32.0 55.8 46.3 82.88 0.98 96.07
## 115 19.4 72.4 49.9 95.70 0.93 92.69
## 116 20.2 68.4 59.8 57.82 1.49 60.63
## 117 16.0 74.2 60.6 99.86 0.93 35.97
## 118 26.7 69.0 56.0 66.24 0.90 30.42
## 119 0.0 68.0 42.6 19.92 1.94 1.67
## 120 18.0 62.4 54.4 39.16 0.92 40.28
## 121 32.6 70.5 48.0 55.91 1.23 51.66
Estrategia de partición:
data = data[sample(nrow(data), 100), ]
data = na.omit(data)
Calculamos la distancia entre casos (filas):
g.dist = daisy(data[c(3,4,5)], metric = "gower")
Proponemos la cantidad del cluster:
set.seed(123)
pam.resultado = pam(g.dist,4,cluster.only = F)
data$clustPT = pam.resultado$cluster
Exploramos los resultados:
aggregate(cbind(MLAutonomia, MLViolencia, VozPolitica)~ clustPT, data=data, mean)
## clustPT MLAutonomia MLViolencia VozPolitica
## 1 1 0.70000000 0.7500000 19.43000
## 2 2 0.65000000 0.4250000 24.98000
## 3 3 0.05769231 0.7115385 23.85769
## 4 4 0.09375000 0.3020833 29.12500
Recodificamos:
data$clustPT=dplyr::recode(data$clustPT, `1` = 3, `2` = 2,`3` = 4,`4` = 1)
Estrategia jerárquica:
set.seed(123)
res.ward <- hcut(g.dist, k = 4, hc_func='agnes', hc_method = "ward.D")
data$clustAG = res.ward$cluster
Exploramos resultados:
aggregate(cbind(MLAutonomia, MLViolencia, VozPolitica)~ clustAG, data=data,mean)
## clustAG MLAutonomia MLViolencia VozPolitica
## 1 1 0.8000000 0.7500000 18.91000
## 2 2 0.2031250 0.7500000 23.20625
## 3 3 0.6304348 0.3913043 22.88696
## 4 4 0.0300000 0.3500000 30.18400
Recodificamos:
data$clustAG = dplyr::recode(data$clustAG, `1` = 2, `2` = 3,`3` = 4,`4` = 1)
Dendograma:
fviz_dend(res.ward, cex = 0.7, horiz = T)
## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.
Comparamos:
table(data$clustPT,data$clustAG,dnn = c('Particion','Aglomeracion'))
## Aglomeracion
## Particion 1 2 3 4
## 1 20 0 0 4
## 2 1 0 0 19
## 3 0 20 10 0
## 4 4 0 22 0
Podemos observar que hay 4 clusters y 16 valores perdidos.
Exploración de clusters (Anexo 1)
Segun nuestro marco teórico, para explicar la desigualdad de género mundial, tenemos tres latentes: participación (voz política, autonomía y desempleo), seguridad (violencia y desconfianza en el sistema judicial) y oportunidades (secundaria culminada, libertad de movimiento y cuenta financiera). En la exploración de latentes (Anexo 2) decidimos tratar con dos latentes.
modelo <- ' oportunidad =~ SecundariaC + LibertadMov + CuentaF
participacion =~ VozPolitica + MLAutonomia + DesempleoMuj'
cfa_fit <- cfa(modelo, data=data,
std.lv=TRUE,
missing="fiml")
## Warning in lav_data_full(data = data, group = group, cluster = cluster, : lavaan
## WARNING: some observed variances are (at least) a factor 1000 times larger than
## others; use varTable(fit) to investigate
Preparamos los tests:
allParamCFA = parameterEstimates(cfa_fit,standardized = T)
allFitCFA = as.list(fitMeasures(cfa_fit))
Vemos los resultados:
allParamCFA[allParamCFA$op=="=~",c("lhs","rhs","pvalue","std.all")]
## lhs rhs pvalue std.all
## 1 oportunidad SecundariaC 0.000 0.860
## 2 oportunidad LibertadMov 0.000 0.538
## 3 oportunidad CuentaF 0.000 0.824
## 4 participacion VozPolitica 0.003 0.339
## 5 participacion MLAutonomia 0.000 -0.779
## 6 participacion DesempleoMuj 0.000 -0.538
Vemos que tan bien salió el modelo:
allFitCFA[c("chisq", "df", "pvalue")]
## $chisq
## [1] 8.188701
##
## $df
## [1] 8
##
## $pvalue
## [1] 0.4152578
El ChiSquare es significativo porque el p-value es mayor a 0.05.
allFitCFA$tli
## [1] 0.9977892
El índice Tucker Lewi es significativo porque es mayor a 0.09.
allFitCFA[c('rmsea.ci.lower','rmsea' ,'rmsea.ci.upper')]
## $rmsea.ci.lower
## [1] 0
##
## $rmsea
## [1] 0.01535828
##
## $rmsea.ci.upper
## [1] 0.1189043
La raíz del error cuadrático medio es mayor a 0.05, por lo cual el modelo no es perfecto.
Vemos los scores:
lavPredict(cfa_fit)
## oprtnd prtcpc
## [1,] -1.505 -1.320
## [2,] -1.546 -0.971
## [3,] 0.307 -0.216
## [4,] -0.202 -0.144
## [5,] -1.651 -1.389
## [6,] -0.746 -1.099
## [7,] 1.535 1.068
## [8,] 0.284 -0.912
## [9,] -0.061 0.609
## [10,] 1.290 1.143
## [11,] -0.724 -1.024
## [12,] 1.291 1.308
## [13,] 1.236 1.099
## [14,] -1.020 -0.401
## [15,] 1.268 1.132
## [16,] 1.363 1.120
## [17,] -0.045 -0.348
## [18,] 0.447 0.072
## [19,] -0.974 0.235
## [20,] 0.486 0.549
## [21,] -0.780 -1.242
## [22,] 0.743 0.303
## [23,] 1.125 1.056
## [24,] 0.904 0.604
## [25,] 0.458 0.830
## [26,] 0.797 0.932
## [27,] 0.064 -0.236
## [28,] -0.938 -0.535
## [29,] -1.623 -1.608
## [30,] -1.017 -1.234
## [31,] -0.629 0.047
## [32,] -0.334 -0.868
## [33,] -1.130 -0.803
## [34,] 0.820 0.015
## [35,] -0.167 -0.788
## [36,] -0.061 -0.074
## [37,] 0.406 0.484
## [38,] -1.160 -0.477
## [39,] -0.210 -0.134
## [40,] -0.417 -0.533
## [41,] 1.343 0.893
## [42,] -0.834 -0.626
## [43,] 0.097 0.750
## [44,] 0.190 0.530
## [45,] 0.108 0.391
## [46,] 0.366 -0.122
## [47,] -0.124 0.222
## [48,] -0.676 -0.470
## [49,] 0.928 1.014
## [50,] 1.004 0.708
## [51,] -0.418 -0.539
## [52,] 0.579 0.794
## [53,] 1.166 1.089
## [54,] -0.014 -0.257
## [55,] 1.492 1.263
## [56,] -0.713 -0.667
## [57,] 1.215 1.092
## [58,] 0.955 0.828
## [59,] -0.507 -0.717
## [60,] -1.377 -1.226
## [61,] -0.774 -0.816
## [62,] -0.459 0.552
## [63,] -0.375 -0.335
## [64,] -0.331 0.192
## [65,] -0.765 -0.104
## [66,] 1.142 1.155
## [67,] -0.338 -0.067
## [68,] 0.364 0.131
## [69,] -1.691 -1.538
## [70,] -1.773 -1.585
## [71,] -0.482 -1.335
## [72,] -1.129 -0.947
## [73,] 1.346 1.192
## [74,] -1.076 -1.270
## [75,] 0.640 0.824
## [76,] 1.266 1.179
## [77,] 0.818 0.936
## [78,] 0.593 -0.494
## [79,] 0.903 1.025
## [80,] -1.186 -1.086
## [81,] 1.191 1.167
## [82,] -0.136 -0.135
## [83,] 0.213 -0.610
## [84,] 0.123 0.384
## [85,] -1.399 -0.905
## [86,] -1.795 -0.736
## [87,] -1.311 -0.766
## [88,] 0.833 0.448
## [89,] -1.337 -1.590
## [90,] 1.431 1.264
## [91,] 0.669 0.000
## [92,] 0.763 0.877
## [93,] -0.906 -1.301
## [94,] 0.831 0.943
## [95,] 0.549 0.816
## [96,] 0.492 0.854
## [97,] 0.982 1.252
## [98,] -0.223 -0.579
## [99,] -0.868 -1.026
## [100,] 0.543 0.837
allScores = as.data.frame(lavPredict(cfa_fit))
data$oportunidad=normalize(allScores$oportunidad,
method = "range",
margin=2,
range = c(0, 100))
data$participacion=normalize(allScores$participacion,
method = "range",
margin=2,
range = c(0, 100))
hipotesis=formula(DesigualdadGenero ~ oportunidad + participacion)
resultado=lm(hipotesis,data = data)
summary(resultado)
##
## Call:
## lm(formula = hipotesis, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.166031 -0.064267 -0.003859 0.059566 0.191669
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6945150 0.0190060 36.542 < 2e-16 ***
## oportunidad -0.0054142 0.0006831 -7.926 3.86e-12 ***
## participacion -0.0009997 0.0006366 -1.570 0.12
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.08651 on 97 degrees of freedom
## Multiple R-squared: 0.8131, Adjusted R-squared: 0.8092
## F-statistic: 211 on 2 and 97 DF, p-value: < 2.2e-16
El resultado nos muestra que la latente oportunidad tiene efecto significativo al 0.001. Ese efecto es inverso y la magnitud es -0.005, lo que indica cuanto varía la desigualdad de género en promedio cuando la latente oportunidad disminuye en una unidad. Por otro lado, la latente participación no tiene efecto significativo.
En este trabajo se planteó la hipótesis: “la desigualdad de género se ve afectada por la manera en que las mujeres perciben las oportunidades que tienen (concepto de oportunidad), por su participación en la sociedad (concepto de participación) y qué tan conformes se sienten con la seguridad en su país (concepto de seguridad)”. Tras la investigación, hemos comprobado que:
El concepto de seguridad no resultó significante para el análisis de variables latentes, por lo que fue descartado y la investigación prosiguió con las latentes de oportunidad y participación.
Luego de realizar la regresión lineal, el R cuadrado ajustado arroja que los conceptos de oportunidad y participación explican la desigualdad de género en un 80%.
En conclusión, nuestra hipótesis se cumplió parcialmente, puesto que de las tres latentes que esperábamos que afectaran a la desigualdad de género, solo comprobamos que la afectaban dos de ellas: la de oportunidad y la de participación. Así, en futuros papers sería interesante investigar qué factores explican la violencia hacia la mujer y la desconfianza en el poder judicial (latente de seguridad), para comprobar si es cierto que estas variables no explican la desigualdad de género.
subset1 <- data[,c("MLAutonomia", "MLViolencia", "VozPolitica")]
boxplot(subset1, horizontal=T,las=2,cex.axis=0.3)
Como los rangos difieren y los valores están muy alejados, procedemos a tipificar, es decir, buscaremos que la media sea igual a 0.
Tipificado:
boxplot(scale(subset1),horizontal=T,las=2,cex.axis=0.3)
Otra forma de reducir la media a 0 es por la suavización logarítmica:
boxplot(log(subset1),horizontal=T,las=2,cex.axis=0.3)
## Warning in bplt(at[i], wid = width[i], stats = z$stats[, i], out = z$out[z$group
## == : Outlier (-Inf) in boxplot 3 is not drawn
Se observa que los valores se alejan, por lo que preferimos la tipificación.
Para Jerárquica Aglomerativa:
set.seed(123)
fviz_nbclust(subset1, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F,hc_func = "agnes")
El gráfico indica que se debería hacer 1 cluster. Como no se puede clusterizar solo con 1, y dado que el segundo punto más alto es 4, entonces decidimos utilizar 4 clusters.
set.seed(123)
SUGERIDOS = 4
res.agnes <- hcut(g.dist, k = SUGERIDOS,hc_func = 'agnes')
fviz_silhouette(res.agnes)
## cluster size ave.sil.width
## 1 1 20 0.64
## 2 2 32 0.38
## 3 3 23 0.19
## 4 4 25 0.51
En el gráfico se observa que hay una silueta positiva porque la mayoría de los valores son positivos.
varParticipacion = c("VozPolitica", "MLAutonomia", "DesempleoMuj")
varSeguridad = c("MLViolencia", "DesconfianzaSJ")
varOportunidades = c("SecundariaC", "LibertadMov", "CuentaF")
subset2=data[,c(varParticipacion,varSeguridad,varOportunidades)]
Calculando la matriz de correlación:
corMatrix <- subset2
corMatrix = polycor::hetcor(subset2)$correlations
Sin evaluar significancia:
ggcorrplot(corMatrix)
Verificamos si los datos permiten factorizar:
psych::KMO(corMatrix)
## Kaiser-Meyer-Olkin factor adequacy
## Call: psych::KMO(r = corMatrix)
## Overall MSA = 0.73
## MSA for each item =
## VozPolitica MLAutonomia DesempleoMuj MLViolencia DesconfianzaSJ
## 0.77 0.84 0.85 0.68 0.59
## SecundariaC LibertadMov CuentaF
## 0.70 0.74 0.71
Verificamos si la matriz de correlaciones es adecuada:
cortest.bartlett(corMatrix,n=nrow(subset2))$p.value>0.05
## [1] FALSE
is.singular.matrix(corMatrix)
## [1] FALSE
Determinamos en cuantos factores o variables latentes podríamos redimensionar la data:
fa.parallel(subset2,fm = 'ML', fa = 'fa',correct = T)
## Parallel analysis suggests that the number of factors = 2 and the number of components = NA
fa.paralell sugiere que un numero de factores = 2, pero, como esperábamos 3, trataremos 3.
Redimensionamos a numero menor de factores:
resfa <- fa(subset2,
nfactors = 3,
# cor = "mixed",
rotate = "varimax",
fm = "minres")
resfa
## Factor Analysis using method = minres
## Call: fa(r = subset2, nfactors = 3, rotate = "varimax", fm = "minres")
## Standardized loadings (pattern matrix) based upon correlation matrix
## MR1 MR2 MR3 h2 u2 com
## VozPolitica 0.12 0.13 0.51 0.29 0.71295 1.2
## MLAutonomia -0.56 -0.06 -0.39 0.46 0.53560 1.8
## DesempleoMuj -0.38 -0.03 -0.33 0.25 0.74744 2.0
## MLViolencia -0.08 -0.08 -0.33 0.13 0.87487 1.3
## DesconfianzaSJ 0.08 0.83 0.10 0.70 0.30339 1.0
## SecundariaC 0.95 0.30 -0.03 1.00 0.00024 1.2
## LibertadMov 0.30 0.66 0.35 0.65 0.35013 1.9
## CuentaF 0.69 0.14 0.33 0.61 0.39405 1.5
##
## MR1 MR2 MR3
## SS loadings 1.96 1.26 0.86
## Proportion Var 0.24 0.16 0.11
## Cumulative Var 0.24 0.40 0.51
## Proportion Explained 0.48 0.31 0.21
## Cumulative Proportion 0.48 0.79 1.00
##
## Mean item complexity = 1.5
## Test of the hypothesis that 3 factors are sufficient.
##
## The degrees of freedom for the null model are 28 and the objective function was 2.38 with Chi Square of 227.29
## The degrees of freedom for the model are 7 and the objective function was 0.06
##
## The root mean square of the residuals (RMSR) is 0.03
## The df corrected root mean square of the residuals is 0.05
##
## The harmonic number of observations is 100 with the empirical chi square 3.86 with prob < 0.8
## The total number of observations was 100 with Likelihood Chi Square = 5.68 with prob < 0.58
##
## Tucker Lewis Index of factoring reliability = 1.027
## RMSEA index = 0 and the 90 % confidence intervals are 0 0.109
## BIC = -26.55
## Fit based upon off diagonal values = 0.99
## Measures of factor score adequacy
## MR1 MR2 MR3
## Correlation of (regression) scores with factors 0.99 0.87 0.78
## Multiple R square of scores with factors 0.97 0.75 0.61
## Minimum correlation of possible factor scores 0.95 0.50 0.23
print(resfa$loadings,cutoff = 0.15)
##
## Loadings:
## MR1 MR2 MR3
## VozPolitica 0.506
## MLAutonomia -0.557 -0.388
## DesempleoMuj -0.382 -0.326
## MLViolencia -0.334
## DesconfianzaSJ 0.825
## SecundariaC 0.953 0.301
## LibertadMov 0.296 0.664 0.349
## CuentaF 0.692 0.329
##
## MR1 MR2 MR3
## SS loadings 1.958 1.260 0.864
## Proportion Var 0.245 0.157 0.108
## Cumulative Var 0.245 0.402 0.510
Diagrama visual:
fa.diagram(resfa)
Tenemos que encontrar una latente significante, por eso intentamos con menos columnas:
resfa2 <- fa(data[,c(varOportunidades, varParticipacion)],
nfactors = 2,
cor = 'mixed',
rotate = "varimax",
fm="minres")
print(resfa2$loadings)
##
## Loadings:
## MR1 MR2
## SecundariaC 0.933
## LibertadMov 0.480 0.311
## CuentaF 0.756 0.227
## VozPolitica 0.138 0.716
## MLAutonomia -0.159
## DesempleoMuj -0.373 -0.237
##
## MR1 MR2
## SS loadings 1.857 0.724
## Proportion Var 0.309 0.121
## Cumulative Var 0.309 0.430
fa.diagram(resfa2)
¿Qué variables aportaron más a los factores?
sort(resfa2$communality)
## MLAutonomia DesempleoMuj LibertadMov VozPolitica CuentaF SecundariaC
## 0.03100319 0.19533453 0.32704816 0.53207739 0.62334433 0.87168149
¿Qué variables contribuyen a más de un factor?
sort(resfa2$complexity)
## SecundariaC VozPolitica CuentaF MLAutonomia DesempleoMuj LibertadMov
## 1.001282 1.074225 1.178623 1.420923 1.696662 1.714638
La exploración no da soporte a tres latentes. Solo usaremos dos.
Se han usado las siguientes librerías:
La libreria (rio) se uso para importar la data.
La librería (cluster) y (Factoextra) la usamos para obtener los cluster sugeridos y saber cuantos pedir usando la técnica jerárquica aglomerativa
La librería (sf) es un paquete que proporciona acceso a Simple Features para R. Se une a ‘GDAL’ para leer y escribir datos, a ‘GEOS’ para operaciones geométricas y a ‘PROJ’ para conversiones de proyección y transformaciones de datos.
La librería (ggplot2) para representar gráficamente los ejes, el texto de los mismos, los títulos, así como, por supuesto, los datos o la información que se gráfica, el tipo de gráfico que se utiliza, los colores, los símbolos y tamaños, entre otros.
La libreria (lavaan) para podes contrastar los modelos usando ecuaciones estructurales
La libreria BBmisc para que en base a la variable latente estratégica la calcularemos creando un indicador sumativo
La libreria (polycor) para poder calcular la matriz de correlación.
La libreria (ggcorrplot) para poder explorar las correlaciones sin evaluar la signidicancia
La libreria(psych) para poder verificar si los datos permiten factorizar
La libreria (matrixcalc) para verificar si la Matrix de correlaciones es adecuada, probando si la Matriz de correlación es una matriz singular
La libreria (GPArotation) con el fin de redimensiona a numero menor de factores
La libreria (dplyr) para filtrar por fila, seleccionar columnas específicas, reordenar filas, añadir nuevas filas y agregar datos.
ORGANIZATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT 2019 “Gender, Institutions and Development Database”. Consulta 12 de diciembre del 2021. https://stats.oecd.org/Index.aspx?DataSetCode=GIDDB2019