Trabajo Final

Introducción:

En este paper mostraremos qué está afectando la desigualdad de género en el mundo, a nivel de países, según una recopilación de data que incluye variables de la data “Gender, Institutions and Development Database (GID-DB) 2019” y el Gender Inequality Index 2019 de la ONU. Buscaremos demotrar que la desigualdad de género es afectada por la manera en que las mujeres perciben las oportunidades que tienen, por su participación en la sociedad y qué tan conformes se sienten con la seguridad en su país.

Los conceptos de dichas latentes están basados en las fuentes previamente mencionadas. La primera latente, acerca de las oportunidades, está conformada por tres indicadores: secundaria completa (porcentaje de la población de 25 a más años que ha terminado la secundaria), libertad de movimiento (porcentaje de mujeres que declaran no sentirse seguras caminando solas por la noche) y posesión de cuentas financieras (porcentaje de la población femenina de 15 años a más con una cuenta financiera).

La segunda, sobre su participación, está conformada por también tres indicadores: voz política (el porcentaje de representantes en la(s) cámaras del parlamento de cada país que son mujeres), la autonomía reproductiva (mide la protección legal que tienen las mujeres sobre sus derechos reproductivos) y el desempleo (ratio entre hombres y mujeres del país que son desempleados).

La tercera y última, sobre su seguridad, está conformada por solo dos indicadores: violencia hacia la mujer (mide la protección legal que tienen las mujeres sobre la violencia de género) y la desconfianza hacia el sistema judicial de su país (porcentaje de mujeres que declaran no confiar en el poder judicial de su país).

library(rio)
library(ggplot2)
library(cluster)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(factoextra)

## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

library(polycor)
library(ggcorrplot)
library(psych)

## 
## Attaching package: 'psych'

## The following object is masked from 'package:polycor':
## 
##     polyserial

## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha

library(matrixcalc)
library(GPArotation)
library(lavaan)

## This is lavaan 0.6-9
## lavaan is FREE software! Please report any bugs.

## 
## Attaching package: 'lavaan'

## The following object is masked from 'package:psych':
## 
##     cor2cov

library(BBmisc)

## 
## Attaching package: 'BBmisc'

## The following objects are masked from 'package:dplyr':
## 
##     coalesce, collapse

## The following object is masked from 'package:base':
## 
##     isFALSE

github="https://raw.githubusercontent.com/rafa0303/Trabajo-final/main/desigualdad.csv"
data=import(github)
data.frame(data)

##                                 Pais DesigualdadGenero MLAutonomia MLViolencia
## 1                        Afghanistan              0.58        0.75        0.75
## 2                            Albania              0.23        0.00        0.50
## 3                            Algeria              0.44        0.75        0.50
## 4                          Argentina              0.35        0.50        0.75
## 5                            Armenia              0.26        0.00        0.75
## 6                          Australia              0.10        0.00        0.75
## 7                            Austria              0.07        0.00        0.25
## 8                         Azerbaijan              0.32        0.00        0.75
## 9                         Bangladesh              0.54        0.75        0.75
## 10                           Belarus              0.12        0.00        0.75
## 11                           Belgium              0.04        0.00        0.50
## 12                             Benin              0.61        0.50        0.50
## 13                           Bolivia              0.45        0.25        0.25
## 14            Bosnia and Herzegovina              0.16        0.00        0.50
## 15                          Botswana              0.46        0.25        0.75
## 16                            Brazil              0.39        0.50        0.25
## 17                          Bulgaria              0.22        0.00        0.75
## 18                      Burkina Faso              0.61        0.50        0.75
## 19                          Cambodia              0.47        0.00        0.50
## 20                          Cameroon              0.57        0.50        0.75
## 21                            Canada              0.08        0.00        0.25
## 22          Central African Republic              0.68        0.25        0.25
## 23                              Chad              0.70        0.25        0.75
## 24                             Chile              0.29        0.50        0.75
## 25                          Colombia              0.41        0.50        0.25
## 26                             Congo              0.58        1.00        0.75
## 27                   Costa de Marfil              0.66        0.75        0.75
## 28                        Costa Rica              0.28        0.75        0.75
## 29                           Croatia              0.12        0.00        0.25
## 30                            Cyprus              0.09        0.25        0.25
## 31  Democratic Republic of the Congo              0.66        0.75        0.75
## 32                           Denmark              0.04        0.00        0.50
## 33                Dominican Republic              0.45        0.75        0.25
## 34                           Ecuador              0.39        0.50        0.50
## 35                       El Salvador              0.40        1.00        0.50
## 36                           Estonia              0.09        0.00        0.25
## 37                          Ethiopia              0.51        0.25        0.50
## 38                           Finland              0.05        0.25        0.75
## 39                            France              0.05        0.00        0.25
## 40                             Gabon              0.53        1.00        0.75
## 41                           Georgia              0.35        0.00        0.75
## 42                           Germany              0.08        0.00        0.75
## 43                             Ghana              0.54        0.25        0.75
## 44                            Greece              0.12        0.00        0.25
## 45                         Guatemala              0.49        0.75        0.75
## 46                             Haiti              0.62        1.00        0.75
## 47                          Honduras              0.48        1.00        0.25
## 48                           Hungary              0.26        0.25        0.75
## 49                             India              0.50        0.25        0.50
## 50                         Indonesia              0.45        0.50        0.75
## 51                              Iraq              0.54        0.75        0.75
## 52                           Ireland              0.09        0.75        0.25
## 53                            Israel              0.10        0.25        0.75
## 54                             Italy              0.07        0.00        0.75
## 55                           Jamaica              0.41        0.75        0.75
## 56                             Japan              0.10        0.50        0.75
## 57                            Jordan              0.47        0.75        0.75
## 58                        Kazakhstan              0.20        0.00        0.75
## 59                             Kenya              0.54        0.75        0.50
## 60                        Kyrgyzstan              0.38        0.00        0.75
## 61  Lao People's Democratic Republic              0.46        0.75        0.25
## 62                            Latvia              0.17        0.00        0.75
## 63                           Lebanon              0.36        0.75        0.75
## 64                           Lesotho              0.55        0.50        0.75
## 65                           Liberia              0.65        0.25        0.75
## 66                         Lithuania              0.12        0.00        0.50
## 67                        Luxembourg              0.08        0.00        0.75
## 68                            Malawi              0.62        0.75        0.50
## 69                              Mali              0.68        0.50        0.75
## 70                             Malta              0.20        1.00        0.25
## 71                        Mauritania              0.62        1.00        0.75
## 72                         Mauritius              0.37        0.25        0.50
## 73                            Mexico              0.33        0.50        0.50
## 74                          Mongolia              0.32        0.00        0.25
## 75                        Montenegro              0.12        0.00        0.25
## 76                           Morocco              0.49        0.75        0.75
## 77                        Mozambique              0.57        0.00        0.75
## 78                           Myanmar              0.46        0.75        0.75
## 79                           Namibia              0.46        0.25        0.25
## 80                             Nepal              0.48        0.00        0.25
## 81                       Netherlands              0.04        0.00        0.75
## 82                       New Zealand              0.13        0.25        0.75
## 83                         Nicaragua              0.46        1.00        0.25
## 84                             Niger              0.65        0.75        0.75
## 85                   North Macedonia              0.14        0.00        0.75
## 86                            Norway              0.04        0.00        0.25
## 87                          Pakistan              0.55        0.75        0.50
## 88                            Panama              0.46        0.50        0.25
## 89                          Paraguay              0.48        0.75        0.50
## 90                              Peru              0.38        0.75        0.75
## 91                       Philippines              0.42        0.75        0.75
## 92                            Poland              0.12        0.50        0.75
## 93                          Portugal              0.08        0.00        0.25
## 94                           Romania              0.32        0.00        0.25
## 95                            Rwanda              0.41        0.50        0.50
## 96                           Senegal              0.52        1.00        0.50
## 97                            Serbia              0.16        0.00        0.25
## 98                      Sierra Leone              0.64        0.75        0.50
## 99                         Singapore              0.06        0.00        0.50
## 100                         Slovenia              0.07        0.00        0.25
## 101                     South Africa              0.42        0.00        0.50
## 102                            Spain              0.07        0.00        0.50
## 103                        Sri Lanka              0.38        0.75        0.50
## 104                           Sweden              0.04        0.00        0.25
## 105                      Switzerland              0.04        0.00        0.75
## 106                       Tajikistan              0.38        0.00        0.75
## 107                         Thailand              0.38        0.50        0.75
## 108                             Togo              0.57        0.50        0.75
## 109              Trinidad and Tobago              0.32        0.75        0.75
## 110                          Tunisia              0.30        0.00        0.50
## 111                           Turkey              0.30        0.00        0.25
## 112                           Uganda              0.53        0.75        0.75
## 113                          Ukraine              0.28        0.00        0.75
## 114                   United Kingdom              0.12        0.75        0.75
## 115                    United States              0.18        0.00        0.50
## 116                          Uruguay              0.28        0.00        0.75
## 117                       Uzbekistan              0.30        0.00        0.75
## 118                         Viet Nam              0.31        0.00        0.75
## 119                            Yemen              0.83        0.75        0.75
## 120                           Zambia              0.54        0.75        0.50
## 121                         Zimbabwe              0.52        0.50        0.50
##     VozPolitica LibertadMov DesconfianzaSJ SecundariaC DesempleoMuj CuentaF
## 1          27.7        62.0           65.2       13.22         2.18    7.16
## 2          27.9        70.2           54.5       93.51         0.90   38.10
## 3          25.8        58.6           48.0       39.08         2.11   29.27
## 4          38.9        61.3           54.1       66.50         1.27   50.76
## 5          18.1        58.9           52.9       96.87         1.02   40.91
## 6          28.7        78.0           59.0       89.99         1.04   99.20
## 7          34.4        50.9           49.3      100.00         0.98   98.38
## 8          16.8        66.7           42.2       93.90         1.39   27.72
## 9          20.3        66.9           50.6       45.26         1.97   35.84
## 10         34.5        67.9           54.6       87.24         0.56   81.34
## 11         38.0        73.4           48.2       82.62         1.02   98.82
## 12          7.2        46.9           41.7       18.20         1.10   28.59
## 13         53.1        63.9           58.9       52.81         1.48   53.85
## 14         21.4        56.7           50.4       73.06         1.26   54.74
## 15          9.5        71.1           62.5       89.64         1.45   46.79
## 16         10.7        66.9           62.3       61.03         1.30   67.51
## 17         23.8        64.2           55.6       94.17         0.84   73.64
## 18         11.0        38.2           23.2        6.02         2.32   34.50
## 19         20.3        71.1           54.1       15.08         0.75   21.53
## 20         31.1        57.2           53.0       32.66         1.34   30.03
## 21         27.0        80.4           52.4      100.00         0.93   99.85
## 22          8.6        54.9           43.6       13.42         1.20    9.72
## 23         12.8        36.0           32.5        1.74         1.37   14.85
## 24         22.6        67.5           63.0       78.97         1.16   71.27
## 25         18.7        66.7           62.2       53.07         1.66   42.47
## 26         11.3        51.4           50.6       46.72         1.14   20.99
## 27         10.6        32.1           52.1       17.84         1.55   35.56
## 28         35.1        64.7           58.8       53.76         1.51   60.88
## 29         18.5        63.3           55.0       94.53         1.28   82.70
## 30         17.9        80.7           51.7       78.25         1.01   90.01
## 31          8.9        44.1           34.1       36.73         0.66   24.22
## 32         37.4        74.6           50.5       89.18         1.08  100.00
## 33         26.8        61.2           54.9       58.63         1.95   54.14
## 34         38.0        67.6           64.3       51.86         1.56   42.61
## 35         32.1        64.3           60.2       39.95         0.76   24.38
## 36         26.7        75.4           50.6      100.00         0.86   98.38
## 37         38.8        66.1           49.4       11.48         1.85   29.08
## 38         42.0        91.1           57.5      100.00         0.96   99.59
## 39         39.0        58.5           48.4       81.00         1.01   91.29
## 40         17.1        46.9           44.4       65.60         2.01   53.70
## 41         16.0        66.3           48.2       97.42         0.83   63.61
## 42         30.7        55.3           48.4       95.99         0.84   99.20
## 43         12.7        46.8           40.2       55.74         1.00   53.72
## 44         18.3        62.1           47.3       61.51         1.54   84.54
## 45         12.7        70.2           60.1       38.40         1.68   42.09
## 46          2.5        51.3           45.7       26.86         1.49   30.05
## 47         21.1        65.7           58.1       34.23         1.56   40.95
## 48         10.1        71.2           56.6       96.26         1.18   72.16
## 49         11.8        58.0           49.7       39.02         1.57   76.64
## 50         19.8        81.2           50.3       44.47         0.93   51.35
## 51         25.3        29.7           24.2       39.52         1.71   19.50
## 52         22.2        61.5           49.2       90.24         0.93   95.31
## 53         27.5        68.8           51.2       87.78         1.03   93.70
## 54         31.0        59.2           54.0       75.63         1.18   91.62
## 55         17.5        66.6           55.0       69.85         1.73   77.76
## 56         10.1        66.1           48.5       95.18         0.88   98.06
## 57         15.4        75.9           45.0       82.02         1.73   26.61
## 58         27.1        66.1           52.8       98.28         1.33   60.29
## 59         21.8        58.2           47.6       29.84         0.98   77.75
## 60         19.2        69.0           61.7       98.56         1.48   38.85
## 61         27.5        65.4           41.9       34.98         0.86   31.87
## 62         16.0        75.4           61.7      100.00         0.76   92.54
## 63          3.1        56.1           46.7       54.31         1.98   32.91
## 64         22.1        63.2           54.1       32.84         1.30   46.46
## 65          9.9        66.8           63.3       18.54         1.05   28.16
## 66         21.3        59.7           55.0       92.94         0.85   81.01
## 67         28.3        56.0           44.5      100.00         1.08   98.18
## 68         16.7        69.5           63.3       17.58         1.42   29.85
## 69          8.8        47.6           37.2        7.34         1.38   25.71
## 70         11.9        74.0           47.7       74.29         1.00   96.96
## 71         25.2        44.0           37.9       12.68         1.42   15.49
## 72         11.6        64.7           48.1       65.68         2.10   87.11
## 73         42.6        65.7           57.3       58.43         1.03   33.29
## 74         17.1        65.4           59.1       91.22         0.88   94.95
## 75         23.5        58.2           50.6       87.96         1.05   67.57
## 76         20.5        70.6           52.0       28.96         1.21   16.81
## 77         39.6        49.3           45.0       13.96         1.06   32.87
## 78         10.2        68.5           50.1       28.74         1.75   25.98
## 79         41.3        72.3           65.3       40.46         1.14   80.66
## 80         32.7        71.5           59.6       28.98         0.73   41.60
## 81         36.0        80.6           53.2       86.56         1.17   99.83
## 82         38.3        79.2           61.6       97.19         1.12   99.34
## 83         45.7        60.5           58.8       48.28         1.36   24.79
## 84         17.0        46.6           42.4        4.28         0.50   10.91
## 85         37.5        67.3           52.3       41.58         0.91   72.89
## 86         41.4        81.6           44.3       96.07         0.81  100.00
## 87         20.6        52.4           38.4       26.75         2.04    7.03
## 88         18.3        68.3           60.6       74.83         1.59   42.34
## 89         13.8        61.4           57.5       47.26         1.45   46.05
## 90         27.7        65.1           58.7       57.41         1.42   34.44
## 91         29.5        61.0           57.8       75.59         1.04   38.85
## 92         28.0        66.2           56.2       82.85         1.00   87.96
## 93         34.8        73.8           50.0       53.63         1.17   90.62
## 94         20.7        68.1           54.5       87.18         0.77   53.59
## 95         61.3        77.2           49.4       12.86         1.00   44.96
## 96         41.8        55.4           38.3       11.14         1.24   38.45
## 97         34.4        73.2           52.8       85.72         1.14   70.13
## 98         12.4        55.6           47.4       19.86         0.69   15.36
## 99         23.0        60.7           52.4       76.27         1.17   96.31
## 100        36.7        78.5           52.7       96.99         1.31   96.94
## 101        42.1        55.4           45.0       74.98         1.17   69.99
## 102        39.1        58.4           52.6       73.31         1.29   91.64
## 103         5.8        68.1           59.9       82.64         2.33   73.44
## 104        43.6        74.3           43.1       88.81         0.90  100.00
## 105        32.5        55.6           41.1       96.37         1.11   98.86
## 106        19.0        62.6           59.3       98.80         0.84   42.13
## 107         4.8        71.8           54.7       43.10         1.17   79.78
## 108        17.6        42.4           40.3       27.62         0.70   37.59
## 109        31.0        64.1           54.1       74.42         1.11   73.60
## 110        31.3        62.2           46.4       42.33         1.75   28.36
## 111        14.6        54.6           46.4       44.32         1.42   54.29
## 112        34.3        62.7           54.4       27.36         1.50   52.71
## 113        12.3        73.6           65.5       94.00         0.77   61.32
## 114        32.0        55.8           46.3       82.88         0.98   96.07
## 115        19.4        72.4           49.9       95.70         0.93   92.69
## 116        20.2        68.4           59.8       57.82         1.49   60.63
## 117        16.0        74.2           60.6       99.86         0.93   35.97
## 118        26.7        69.0           56.0       66.24         0.90   30.42
## 119         0.0        68.0           42.6       19.92         1.94    1.67
## 120        18.0        62.4           54.4       39.16         0.92   40.28
## 121        32.6        70.5           48.0       55.91         1.23   51.66

Clusterización:

Estrategia de partición:

data = data[sample(nrow(data), 100), ]
data = na.omit(data)

Calculamos la distancia entre casos (filas):

g.dist = daisy(data[c(3,4,5)], metric = "gower")

Proponemos la cantidad del cluster:

set.seed(123)
pam.resultado = pam(g.dist,4,cluster.only = F)

data$clustPT = pam.resultado$cluster

Exploramos los resultados:

aggregate(cbind(MLAutonomia, MLViolencia, VozPolitica)~ clustPT, data=data, mean)

##   clustPT MLAutonomia MLViolencia VozPolitica
## 1       1  0.70000000   0.7500000    19.43000
## 2       2  0.65000000   0.4250000    24.98000
## 3       3  0.05769231   0.7115385    23.85769
## 4       4  0.09375000   0.3020833    29.12500

Recodificamos:

data$clustPT=dplyr::recode(data$clustPT, `1` = 3, `2` = 2,`3` = 4,`4` = 1)

Estrategia jerárquica:

Aglomerativa:

set.seed(123)
res.ward <- hcut(g.dist, k = 4, hc_func='agnes', hc_method = "ward.D")
data$clustAG = res.ward$cluster

Exploramos resultados:

aggregate(cbind(MLAutonomia, MLViolencia, VozPolitica)~ clustAG, data=data,mean)

##   clustAG MLAutonomia MLViolencia VozPolitica
## 1       1   0.8000000   0.7500000    18.91000
## 2       2   0.2031250   0.7500000    23.20625
## 3       3   0.6304348   0.3913043    22.88696
## 4       4   0.0300000   0.3500000    30.18400

Recodificamos:

data$clustAG = dplyr::recode(data$clustAG, `1` = 2, `2` = 3,`3` = 4,`4` = 1)

Dendograma:

fviz_dend(res.ward, cex = 0.7, horiz = T)

## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.

Comparamos:

table(data$clustPT,data$clustAG,dnn = c('Particion','Aglomeracion'))

##          Aglomeracion
## Particion  1  2  3  4
##         1 20  0  0  4
##         2  1  0  0 19
##         3  0 20 10  0
##         4  4  0 22  0

Podemos observar que hay 4 clusters y 16 valores perdidos.

Exploración de clusters (Anexo 1)

Preparación de latentes:

Segun nuestro marco teórico, para explicar la desigualdad de género mundial, tenemos tres latentes: participación (voz política, autonomía y desempleo), seguridad (violencia y desconfianza en el sistema judicial) y oportunidades (secundaria culminada, libertad de movimiento y cuenta financiera). En la exploración de latentes (Anexo 2) decidimos tratar con dos latentes.

modelo <- ' oportunidad =~ SecundariaC + LibertadMov + CuentaF
           participacion =~ VozPolitica + MLAutonomia + DesempleoMuj'

cfa_fit <- cfa(modelo, data=data, 
           std.lv=TRUE,  
           missing="fiml")

## Warning in lav_data_full(data = data, group = group, cluster = cluster, : lavaan
## WARNING: some observed variances are (at least) a factor 1000 times larger than
## others; use varTable(fit) to investigate

Preparamos los tests:

allParamCFA = parameterEstimates(cfa_fit,standardized = T)
allFitCFA = as.list(fitMeasures(cfa_fit))

Vemos los resultados:

allParamCFA[allParamCFA$op=="=~",c("lhs","rhs","pvalue","std.all")]

##             lhs          rhs pvalue std.all
## 1   oportunidad  SecundariaC  0.000   0.860
## 2   oportunidad  LibertadMov  0.000   0.538
## 3   oportunidad      CuentaF  0.000   0.824
## 4 participacion  VozPolitica  0.003   0.339
## 5 participacion  MLAutonomia  0.000  -0.779
## 6 participacion DesempleoMuj  0.000  -0.538

Vemos que tan bien salió el modelo:

allFitCFA[c("chisq", "df", "pvalue")]

## $chisq
## [1] 8.188701
## 
## $df
## [1] 8
## 
## $pvalue
## [1] 0.4152578

El ChiSquare es significativo porque el p-value es mayor a 0.05.

allFitCFA$tli

## [1] 0.9977892

El índice Tucker Lewi es significativo porque es mayor a 0.09.

allFitCFA[c('rmsea.ci.lower','rmsea' ,'rmsea.ci.upper')]

## $rmsea.ci.lower
## [1] 0
## 
## $rmsea
## [1] 0.01535828
## 
## $rmsea.ci.upper
## [1] 0.1189043

La raíz del error cuadrático medio es mayor a 0.05, por lo cual el modelo no es perfecto.

Vemos los scores:

lavPredict(cfa_fit)

##        oprtnd prtcpc
##   [1,] -1.505 -1.320
##   [2,] -1.546 -0.971
##   [3,]  0.307 -0.216
##   [4,] -0.202 -0.144
##   [5,] -1.651 -1.389
##   [6,] -0.746 -1.099
##   [7,]  1.535  1.068
##   [8,]  0.284 -0.912
##   [9,] -0.061  0.609
##  [10,]  1.290  1.143
##  [11,] -0.724 -1.024
##  [12,]  1.291  1.308
##  [13,]  1.236  1.099
##  [14,] -1.020 -0.401
##  [15,]  1.268  1.132
##  [16,]  1.363  1.120
##  [17,] -0.045 -0.348
##  [18,]  0.447  0.072
##  [19,] -0.974  0.235
##  [20,]  0.486  0.549
##  [21,] -0.780 -1.242
##  [22,]  0.743  0.303
##  [23,]  1.125  1.056
##  [24,]  0.904  0.604
##  [25,]  0.458  0.830
##  [26,]  0.797  0.932
##  [27,]  0.064 -0.236
##  [28,] -0.938 -0.535
##  [29,] -1.623 -1.608
##  [30,] -1.017 -1.234
##  [31,] -0.629  0.047
##  [32,] -0.334 -0.868
##  [33,] -1.130 -0.803
##  [34,]  0.820  0.015
##  [35,] -0.167 -0.788
##  [36,] -0.061 -0.074
##  [37,]  0.406  0.484
##  [38,] -1.160 -0.477
##  [39,] -0.210 -0.134
##  [40,] -0.417 -0.533
##  [41,]  1.343  0.893
##  [42,] -0.834 -0.626
##  [43,]  0.097  0.750
##  [44,]  0.190  0.530
##  [45,]  0.108  0.391
##  [46,]  0.366 -0.122
##  [47,] -0.124  0.222
##  [48,] -0.676 -0.470
##  [49,]  0.928  1.014
##  [50,]  1.004  0.708
##  [51,] -0.418 -0.539
##  [52,]  0.579  0.794
##  [53,]  1.166  1.089
##  [54,] -0.014 -0.257
##  [55,]  1.492  1.263
##  [56,] -0.713 -0.667
##  [57,]  1.215  1.092
##  [58,]  0.955  0.828
##  [59,] -0.507 -0.717
##  [60,] -1.377 -1.226
##  [61,] -0.774 -0.816
##  [62,] -0.459  0.552
##  [63,] -0.375 -0.335
##  [64,] -0.331  0.192
##  [65,] -0.765 -0.104
##  [66,]  1.142  1.155
##  [67,] -0.338 -0.067
##  [68,]  0.364  0.131
##  [69,] -1.691 -1.538
##  [70,] -1.773 -1.585
##  [71,] -0.482 -1.335
##  [72,] -1.129 -0.947
##  [73,]  1.346  1.192
##  [74,] -1.076 -1.270
##  [75,]  0.640  0.824
##  [76,]  1.266  1.179
##  [77,]  0.818  0.936
##  [78,]  0.593 -0.494
##  [79,]  0.903  1.025
##  [80,] -1.186 -1.086
##  [81,]  1.191  1.167
##  [82,] -0.136 -0.135
##  [83,]  0.213 -0.610
##  [84,]  0.123  0.384
##  [85,] -1.399 -0.905
##  [86,] -1.795 -0.736
##  [87,] -1.311 -0.766
##  [88,]  0.833  0.448
##  [89,] -1.337 -1.590
##  [90,]  1.431  1.264
##  [91,]  0.669  0.000
##  [92,]  0.763  0.877
##  [93,] -0.906 -1.301
##  [94,]  0.831  0.943
##  [95,]  0.549  0.816
##  [96,]  0.492  0.854
##  [97,]  0.982  1.252
##  [98,] -0.223 -0.579
##  [99,] -0.868 -1.026
## [100,]  0.543  0.837

allScores = as.data.frame(lavPredict(cfa_fit))

data$oportunidad=normalize(allScores$oportunidad,
                    method = "range", 
                    margin=2,
                    range = c(0, 100))
data$participacion=normalize(allScores$participacion,
                    method = "range", 
                    margin=2,
                    range = c(0, 100))

Regresión y prueba de hipótesis:

hipotesis=formula(DesigualdadGenero ~ oportunidad + participacion)

resultado=lm(hipotesis,data = data)
summary(resultado)

## 
## Call:
## lm(formula = hipotesis, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.166031 -0.064267 -0.003859  0.059566  0.191669 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    0.6945150  0.0190060  36.542  < 2e-16 ***
## oportunidad   -0.0054142  0.0006831  -7.926 3.86e-12 ***
## participacion -0.0009997  0.0006366  -1.570     0.12    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08651 on 97 degrees of freedom
## Multiple R-squared:  0.8131, Adjusted R-squared:  0.8092 
## F-statistic:   211 on 2 and 97 DF,  p-value: < 2.2e-16

El resultado nos muestra que la latente oportunidad tiene efecto significativo al 0.001. Ese efecto es inverso y la magnitud es -0.005, lo que indica cuanto varía la desigualdad de género en promedio cuando la latente oportunidad disminuye en una unidad. Por otro lado, la latente participación no tiene efecto significativo.

Conclusiones:

En este trabajo se planteó la hipótesis: “la desigualdad de género se ve afectada por la manera en que las mujeres perciben las oportunidades que tienen (concepto de oportunidad), por su participación en la sociedad (concepto de participación) y qué tan conformes se sienten con la seguridad en su país (concepto de seguridad)”. Tras la investigación, hemos comprobado que:

El concepto de seguridad no resultó significante para el análisis de variables latentes, por lo que fue descartado y la investigación prosiguió con las latentes de oportunidad y participación.
Luego de realizar la regresión lineal, el R cuadrado ajustado arroja que los conceptos de oportunidad y participación explican la desigualdad de género en un 80%.

En conclusión, nuestra hipótesis se cumplió parcialmente, puesto que de las tres latentes que esperábamos que afectaran a la desigualdad de género, solo comprobamos que la afectaban dos de ellas: la de oportunidad y la de participación. Así, en futuros papers sería interesante investigar qué factores explican la violencia hacia la mujer y la desconfianza en el poder judicial (latente de seguridad), para comprobar si es cierto que estas variables no explican la desigualdad de género.

Anexos:

Anexo 1:

Saber si se transformará las variables numéricas:

subset1 <- data[,c("MLAutonomia", "MLViolencia", "VozPolitica")]

boxplot(subset1, horizontal=T,las=2,cex.axis=0.3)

Como los rangos difieren y los valores están muy alejados, procedemos a tipificar, es decir, buscaremos que la media sea igual a 0.

Tipificado:

boxplot(scale(subset1),horizontal=T,las=2,cex.axis=0.3)

Otra forma de reducir la media a 0 es por la suavización logarítmica:

boxplot(log(subset1),horizontal=T,las=2,cex.axis=0.3)

## Warning in bplt(at[i], wid = width[i], stats = z$stats[, i], out = z$out[z$group
## == : Outlier (-Inf) in boxplot 3 is not drawn

Se observa que los valores se alejan, por lo que preferimos la tipificación.

Saber cuántos clusters pedir:

Para Jerárquica Aglomerativa:

set.seed(123)
fviz_nbclust(subset1, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F,hc_func = "agnes")

El gráfico indica que se debería hacer 1 cluster. Como no se puede clusterizar solo con 1, y dado que el segundo punto más alto es 4, entonces decidimos utilizar 4 clusters.

set.seed(123)
SUGERIDOS = 4
res.agnes <- hcut(g.dist, k = SUGERIDOS,hc_func = 'agnes')
fviz_silhouette(res.agnes)

##   cluster size ave.sil.width
## 1       1   20          0.64
## 2       2   32          0.38
## 3       3   23          0.19
## 4       4   25          0.51

En el gráfico se observa que hay una silueta positiva porque la mayoría de los valores son positivos.

Anexo 2:

varParticipacion = c("VozPolitica", "MLAutonomia", "DesempleoMuj")
varSeguridad = c("MLViolencia", "DesconfianzaSJ")
varOportunidades = c("SecundariaC", "LibertadMov", "CuentaF")


subset2=data[,c(varParticipacion,varSeguridad,varOportunidades)]

Calculando la matriz de correlación:

corMatrix <- subset2

corMatrix = polycor::hetcor(subset2)$correlations

Exploramos las correlaciones:

Sin evaluar significancia:

ggcorrplot(corMatrix)

Verificamos si los datos permiten factorizar:

psych::KMO(corMatrix)

## Kaiser-Meyer-Olkin factor adequacy
## Call: psych::KMO(r = corMatrix)
## Overall MSA =  0.73
## MSA for each item = 
##    VozPolitica    MLAutonomia   DesempleoMuj    MLViolencia DesconfianzaSJ 
##           0.77           0.84           0.85           0.68           0.59 
##    SecundariaC    LibertadMov        CuentaF 
##           0.70           0.74           0.71

Verificamos si la matriz de correlaciones es adecuada:

cortest.bartlett(corMatrix,n=nrow(subset2))$p.value>0.05

## [1] FALSE

is.singular.matrix(corMatrix)

## [1] FALSE

Determinamos en cuantos factores o variables latentes podríamos redimensionar la data:

fa.parallel(subset2,fm = 'ML', fa = 'fa',correct = T)

## Parallel analysis suggests that the number of factors =  2  and the number of components =  NA

fa.paralell sugiere que un numero de factores = 2, pero, como esperábamos 3, trataremos 3.

Redimensionamos a numero menor de factores:

resfa <- fa(subset2,
            nfactors = 3,
            # cor = "mixed",
            rotate = "varimax",
            fm = "minres")
resfa

## Factor Analysis using method =  minres
## Call: fa(r = subset2, nfactors = 3, rotate = "varimax", fm = "minres")
## Standardized loadings (pattern matrix) based upon correlation matrix
##                  MR1   MR2   MR3   h2      u2 com
## VozPolitica     0.12  0.13  0.51 0.29 0.71295 1.2
## MLAutonomia    -0.56 -0.06 -0.39 0.46 0.53560 1.8
## DesempleoMuj   -0.38 -0.03 -0.33 0.25 0.74744 2.0
## MLViolencia    -0.08 -0.08 -0.33 0.13 0.87487 1.3
## DesconfianzaSJ  0.08  0.83  0.10 0.70 0.30339 1.0
## SecundariaC     0.95  0.30 -0.03 1.00 0.00024 1.2
## LibertadMov     0.30  0.66  0.35 0.65 0.35013 1.9
## CuentaF         0.69  0.14  0.33 0.61 0.39405 1.5
## 
##                        MR1  MR2  MR3
## SS loadings           1.96 1.26 0.86
## Proportion Var        0.24 0.16 0.11
## Cumulative Var        0.24 0.40 0.51
## Proportion Explained  0.48 0.31 0.21
## Cumulative Proportion 0.48 0.79 1.00
## 
## Mean item complexity =  1.5
## Test of the hypothesis that 3 factors are sufficient.
## 
## The degrees of freedom for the null model are  28  and the objective function was  2.38 with Chi Square of  227.29
## The degrees of freedom for the model are 7  and the objective function was  0.06 
## 
## The root mean square of the residuals (RMSR) is  0.03 
## The df corrected root mean square of the residuals is  0.05 
## 
## The harmonic number of observations is  100 with the empirical chi square  3.86  with prob <  0.8 
## The total number of observations was  100  with Likelihood Chi Square =  5.68  with prob <  0.58 
## 
## Tucker Lewis Index of factoring reliability =  1.027
## RMSEA index =  0  and the 90 % confidence intervals are  0 0.109
## BIC =  -26.55
## Fit based upon off diagonal values = 0.99
## Measures of factor score adequacy             
##                                                    MR1  MR2  MR3
## Correlation of (regression) scores with factors   0.99 0.87 0.78
## Multiple R square of scores with factors          0.97 0.75 0.61
## Minimum correlation of possible factor scores     0.95 0.50 0.23

print(resfa$loadings,cutoff = 0.15)

## 
## Loadings:
##                MR1    MR2    MR3   
## VozPolitica                   0.506
## MLAutonomia    -0.557        -0.388
## DesempleoMuj   -0.382        -0.326
## MLViolencia                  -0.334
## DesconfianzaSJ         0.825       
## SecundariaC     0.953  0.301       
## LibertadMov     0.296  0.664  0.349
## CuentaF         0.692         0.329
## 
##                  MR1   MR2   MR3
## SS loadings    1.958 1.260 0.864
## Proportion Var 0.245 0.157 0.108
## Cumulative Var 0.245 0.402 0.510

Diagrama visual:

fa.diagram(resfa)

Tenemos que encontrar una latente significante, por eso intentamos con menos columnas:

resfa2 <- fa(data[,c(varOportunidades, varParticipacion)],
            nfactors = 2,
            cor = 'mixed',
            rotate = "varimax",
            fm="minres")
print(resfa2$loadings)

## 
## Loadings:
##              MR1    MR2   
## SecundariaC   0.933       
## LibertadMov   0.480  0.311
## CuentaF       0.756  0.227
## VozPolitica   0.138  0.716
## MLAutonomia  -0.159       
## DesempleoMuj -0.373 -0.237
## 
##                  MR1   MR2
## SS loadings    1.857 0.724
## Proportion Var 0.309 0.121
## Cumulative Var 0.309 0.430

fa.diagram(resfa2)

Evaluamos los resultados:

¿Qué variables aportaron más a los factores?

sort(resfa2$communality)

##  MLAutonomia DesempleoMuj  LibertadMov  VozPolitica      CuentaF  SecundariaC 
##   0.03100319   0.19533453   0.32704816   0.53207739   0.62334433   0.87168149

¿Qué variables contribuyen a más de un factor?

sort(resfa2$complexity)

##  SecundariaC  VozPolitica      CuentaF  MLAutonomia DesempleoMuj  LibertadMov 
##     1.001282     1.074225     1.178623     1.420923     1.696662     1.714638

La exploración no da soporte a tres latentes. Solo usaremos dos.

Anexo 3:

Se han usado las siguientes librerías:

La libreria (rio) se uso para importar la data.
La librería (cluster) y (Factoextra) la usamos para obtener los cluster sugeridos y saber cuantos pedir usando la técnica jerárquica aglomerativa
La librería (sf) es un paquete que proporciona acceso a Simple Features para R. Se une a ‘GDAL’ para leer y escribir datos, a ‘GEOS’ para operaciones geométricas y a ‘PROJ’ para conversiones de proyección y transformaciones de datos.
La librería (ggplot2) para representar gráficamente los ejes, el texto de los mismos, los títulos, así como, por supuesto, los datos o la información que se gráfica, el tipo de gráfico que se utiliza, los colores, los símbolos y tamaños, entre otros.
La libreria (lavaan) para podes contrastar los modelos usando ecuaciones estructurales
La libreria BBmisc para que en base a la variable latente estratégica la calcularemos creando un indicador sumativo
La libreria (polycor) para poder calcular la matriz de correlación.
La libreria (ggcorrplot) para poder explorar las correlaciones sin evaluar la signidicancia
La libreria(psych) para poder verificar si los datos permiten factorizar
La libreria (matrixcalc) para verificar si la Matrix de correlaciones es adecuada, probando si la Matriz de correlación es una matriz singular
La libreria (GPArotation) con el fin de redimensiona a numero menor de factores
La libreria (dplyr) para filtrar por fila, seleccionar columnas específicas, reordenar filas, añadir nuevas filas y agregar datos.

Bibliografía:

ORGANIZATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT 2019 “Gender, Institutions and Development Database”. Consulta 12 de diciembre del 2021. https://stats.oecd.org/Index.aspx?DataSetCode=GIDDB2019

Trabajo Final Estadística 2

Talisha Panduro (20194740), Nicolle Huerto (20190898) y Rafael Vargas (20181696)

8/12/2021