#Abrimos las liberias

library(rio)
library(sp)
library(geojsonio)
## 
## Attaching package: 'geojsonio'
## The following object is masked from 'package:base':
## 
##     pretty
library(htmltab)
library(rgdal)
## rgdal: version: 1.5-16, (SVN revision 1050)
## Geospatial Data Abstraction Library extensions to R successfully loaded
## Loaded GDAL runtime: GDAL 2.2.2, released 2017/09/15
## Path to GDAL shared files: /usr/share/gdal/2.2
## GDAL binary built with GEOS: TRUE 
## Loaded PROJ runtime: Rel. 4.9.2, 08 September 2015, [PJ_VERSION: 492]
## Path to PROJ shared files: (autodetected)
## Linking to sp version:1.4-2
library(jsonlite)
## 
## Attaching package: 'jsonlite'
## The following object is masked from 'package:geojsonio':
## 
##     validate
library(carData)
library(car)
library(stringr)
library(magrittr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
## 
##     recode
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(cluster)
library(plyr)
## ------------------------------------------------------------------------------
## You have loaded plyr after dplyr - this is likely to cause problems.
## If you need functions from both plyr and dplyr, please load plyr first, then dplyr:
## library(plyr); library(dplyr)
## ------------------------------------------------------------------------------
## 
## Attaching package: 'plyr'
## The following objects are masked from 'package:dplyr':
## 
##     arrange, count, desc, failwith, id, mutate, rename, summarise,
##     summarize
library(psych)
## 
## Attaching package: 'psych'
## The following object is masked from 'package:car':
## 
##     logit
library(knitr)
library(kableExtra)
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
library(factoextra) #visualización de clusters
## Loading required package: ggplot2
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggrepel) #para que las etiquetas de los graficos no se superpongan
library(htmltab)
library(dplyr)
library(factoextra)
library(stargazer)
## 
## Please cite as:
##  Hlavac, Marek (2018). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.2. https://CRAN.R-project.org/package=stargazer

#Data DEPENDIENTE: MUJERES PARLAMENTARIAS Esta data representa nuestra variable dependiente, en donde observaremos cuantas mujeres participan en política con cargos parlamentarios por país. Hemos tomado un rango de años del 2009 al 2019 para observar más detalladamente las variables independientes¨

library(rio)
parlamentariaslink='https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Mujeres%20pol%C3%ADticas%20en%20el%20parlamento.xls'

parlamentarias=import(parlamentariaslink)

head(parlamentarias)
##     Country Name Country Code
## 1          Aruba          ABW
## 2     Afganistán          AFG
## 3         Angola          AGO
## 4        Albania          ALB
## 5        Andorra          AND
## 6 El mundo árabe          ARB
##                                                                 Indicator Name
## 1 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 2 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 3 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 4 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 5 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 6 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
##   Indicator Code 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971
## 1 SG.GEN.PARL.ZS   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 2 SG.GEN.PARL.ZS   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 3 SG.GEN.PARL.ZS   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 4 SG.GEN.PARL.ZS   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 5 SG.GEN.PARL.ZS   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 6 SG.GEN.PARL.ZS   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
##   1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986
## 1   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 2   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 3   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 4   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 5   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 6   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
##   1987 1988 1989 1990 1991 1992 1993 1994 1995 1996     1997      1998
## 1   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA       NA        NA
## 2   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA       NA        NA
## 3   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 9.545455 15.454545
## 4   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA       NA        NA
## 5   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 7.142857  7.142857
## 6   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 3.747161  3.457447
##        1999      2000      2001      2002      2003      2004      2005
## 1        NA        NA        NA        NA        NA        NA        NA
## 2        NA        NA        NA        NA        NA        NA 27.309237
## 3 15.454545 15.454545 15.454545 15.454545 15.454545 15.000000 15.000000
## 4  5.161290  5.161290  5.714286  5.714286  5.714286  6.428571  7.142857
## 5  7.142857  7.142857 14.285714 14.285714 14.285714 14.285714 28.571429
## 6  3.616776  3.770681  4.621265  6.130932  6.048110  6.693043  7.036766
##        2006      2007      2008      2009     2010     2011     2012     2013
## 1        NA        NA        NA        NA       NA       NA       NA       NA
## 2 27.309237 27.685950 27.685950 27.309237 27.71084 27.71084 27.71084 27.71084
## 3 15.000000 15.000000 37.272727 38.636364 38.63636 38.18182 34.09091 34.09091
## 4  7.142857  7.142857  7.142857 16.428571 16.42857 15.71429 15.71429 17.85714
## 5 28.571429 28.571429 25.000000 35.714286 35.71429 50.00000 50.00000 50.00000
## 6  9.349593  9.753765  9.801578  9.902309 11.91967 11.32850 14.87204 17.36931
##       2014     2015     2016     2017     2018     2019
## 1       NA       NA       NA       NA       NA       NA
## 2 27.71084 27.71084 27.71084 27.71084       NA 27.86885
## 3 36.81818 36.81818 36.81818 30.45455 30.45455 30.00000
## 4 20.00000 20.71429 22.85714 27.85714 27.85714 29.50820
## 5 50.00000 39.28571 32.14286 32.14286 32.14286 46.42857
## 6 17.79340 18.77984 19.27561 18.88402 19.06077 17.56654
parlamentarias[,c(4:53)]=NULL
head(parlamentarias)
##     Country Name Country Code
## 1          Aruba          ABW
## 2     Afganistán          AFG
## 3         Angola          AGO
## 4        Albania          ALB
## 5        Andorra          AND
## 6 El mundo árabe          ARB
##                                                                 Indicator Name
## 1 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 2 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 3 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 4 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 5 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 6 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
##        2009     2010     2011     2012     2013     2014     2015     2016
## 1        NA       NA       NA       NA       NA       NA       NA       NA
## 2 27.309237 27.71084 27.71084 27.71084 27.71084 27.71084 27.71084 27.71084
## 3 38.636364 38.63636 38.18182 34.09091 34.09091 36.81818 36.81818 36.81818
## 4 16.428571 16.42857 15.71429 15.71429 17.85714 20.00000 20.71429 22.85714
## 5 35.714286 35.71429 50.00000 50.00000 50.00000 50.00000 39.28571 32.14286
## 6  9.902309 11.91967 11.32850 14.87204 17.36931 17.79340 18.77984 19.27561
##       2017     2018     2019
## 1       NA       NA       NA
## 2 27.71084       NA 27.86885
## 3 30.45455 30.45455 30.00000
## 4 27.85714 27.85714 29.50820
## 5 32.14286 32.14286 46.42857
## 6 18.88402 19.06077 17.56654
parlamentarias[,c(1,3)]=NULL
head(parlamentarias)
##   Country Code      2009     2010     2011     2012     2013     2014     2015
## 1          ABW        NA       NA       NA       NA       NA       NA       NA
## 2          AFG 27.309237 27.71084 27.71084 27.71084 27.71084 27.71084 27.71084
## 3          AGO 38.636364 38.63636 38.18182 34.09091 34.09091 36.81818 36.81818
## 4          ALB 16.428571 16.42857 15.71429 15.71429 17.85714 20.00000 20.71429
## 5          AND 35.714286 35.71429 50.00000 50.00000 50.00000 50.00000 39.28571
## 6          ARB  9.902309 11.91967 11.32850 14.87204 17.36931 17.79340 18.77984
##       2016     2017     2018     2019
## 1       NA       NA       NA       NA
## 2 27.71084 27.71084       NA 27.86885
## 3 36.81818 30.45455 30.45455 30.00000
## 4 22.85714 27.85714 27.85714 29.50820
## 5 32.14286 32.14286 32.14286 46.42857
## 6 19.27561 18.88402 19.06077 17.56654
parlamentarias[,c(2,6,7,8,11,13,14)]=NULL
library(dplyr)
parlamentarias$'Porcentaje de Parlamentarias 2010-2019'= rowMeans (parlamentarias[ ,2:7])
parlamentarias[,c(2:7)]=NULL
parlamentarias=na.omit(parlamentarias)
names(parlamentarias)=c("Pais", "Porcentaje de Parlamentarias 2010-2019")

Lo guardamos en GitHub

#Variable INDEPENDIENTE: VIOLENCIA CONTRA LA MUJER –> Violencia Doméstica y Violencia Física y Psicológica de la mujer entre 15 y 45 años

Violencia Doméstica

Sexual Abuse

sexual_link='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Sexual%20Abuse.xls'

sexual=import(sexual_link)
sexual$'Mujeres golpeadas por negarse a tener sexo'= rowMeans(sexual[,4:23], na.rm = T)
sexual[,c(3:23)]=NULL
sexual$`Mujeres golpeadas por negarse a tener sexo`=as.numeric(sexual$`Mujeres golpeadas por negarse a tener sexo`)
str(sexual)
## 'data.frame':    264 obs. of  3 variables:
##  $ Country Name                              : chr  "Aruba" "Afghanistan" "Angola" "Albania" ...
##  $ Country Code                              : chr  "ABW" "AFG" "AGO" "ALB" ...
##  $ Mujeres golpeadas por negarse a tener sexo: num  NaN 33.4 11.5 6.17 NaN ...
sexual$`Mujeres golpeadas por negarse a tener sexo`= gsub('NaN', NA, sexual$`Mujeres golpeadas por negarse a tener sexo`)
sexual=na.omit(sexual)
sexual[,c(1)]=NULL

Argue abuse

arguelink='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Argue%20Abuse.xls'

argue=import(arguelink)
argue$'Mujeres golpeadas por discutir'= rowMeans(argue[,5:24], na.rm = T)
argue[,c(4:24)]=NULL
argue[,c(1,3,4)]=NULL
argue$`Mujeres golpeadas por discutir`=gsub('NaN', NA, argue$`Mujeres golpeadas por discutir`)
argue=na.omit(argue)

Goes without telling him

goes_link='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Goes%20without%20telling%20him%20abuse.xls'

goes=import(goes_link)
goes$'Mujeres golpeadas por salir sin avisar'= rowMeans(goes[4:24], na.rm = T)
goes[,c(1,3:24)]=NULL
goes$`Mujeres golpeadas por salir sin avisar`=gsub('NaN', NA, goes$`Mujeres golpeadas por salir sin avisar`)
goes=na.omit(goes)

Merge de Violencia Doméstica

sexual$`Country Code`=trimws(sexual$`Country Code`,whitespace = "[\\h\\v]")
argue$`Country Code`=trimws(argue$`Country Code`,whitespace = "[\\h\\v]")
goes$`Country Code`=trimws(goes$`Country Code`,whitespace = "[\\h\\v]")
sexualargue=merge(sexual,argue, all.x = T, all.y = T)
violencia_domestica=merge(sexualargue, goes, all.x = T, all.y = T)
violencia_domestica[,-1]=lapply(violencia_domestica[,-1], as.numeric)
str(violencia_domestica)
## 'data.frame':    83 obs. of  4 variables:
##  $ Country Code                              : chr  "AFG" "AGO" "ALB" "ARM" ...
##  $ Mujeres golpeadas por negarse a tener sexo: num  33.4 11.5 6.17 3.05 14.2 ...
##  $ Mujeres golpeadas por discutir            : num  59.2 15.2 7.53 10.22 31.3 ...
##  $ Mujeres golpeadas por salir sin avisar    : num  66.9 14.5 13.1 9.62 42.5 ...
names(violencia_domestica)=c("Pais", "Mujeres golpeadas por negarse a tener sexo", "Mujeres golpeadas por discutir con su pareja", "Mujeres golpeadas por salir sin avisar a su pareja")
violencia_domestica$'Violencia Domestica'=rowMeans(violencia_domestica[2:4], na.rm = T)
violencia_domestica[,c(2:4)]=NULL

Violencia Psicológica

library(rio)
violencialink='https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Violencia%20psicologica%20y%20fisica%20contra%20la%20mujer.csv'

violencia=import(violencialink)
## Warning in fread(dec = ".", input = structure("/tmp/Rtmp9PRd1a/
## file2f857ed77f2.csv", class = c("rio_csv", : Found and resolved improper quoting
## in first 100 rows. If the fields are not quoted (e.g. field separator does not
## appear within any field), try quote="" to avoid this warning.
library(stringr)

violencia$Pais=str_split(violencia$`Country, ""Age Group"` , ',', simplify=T)[,1]
violencia$Edad= str_split (violencia$`Country, ""Age Group"` , ',', simplify=T)[,2]
violencia[,c(1)]=NULL
names(violencia)
## [1] "\"Year\""                                                                                                                                                                          
## [2] "\"Proportion of ever-partnered women and girls aged 15-49 years subjected to physical and/or sexual violence by a current or former intimate partner in the previous 12 months\"\""
## [3] "Pais"                                                                                                                                                                              
## [4] "Edad"
violencia$Year=violencia$"\"Year\""
violencia$'Proporcion de violencia psicologica y fisica contra la mujer'=violencia$"\"Proportion of ever-partnered women and girls aged 15-49 years subjected to physical and/or sexual violence by a current or former intimate partner in the previous 12 months\"\""
violencia[,c(1,2)]=NULL
violencia$Edad=str_extract_all(violencia$Edad, 
                "\\d+\\-*\\d*")
violencia$Year=str_extract_all(violencia$Year, 
                "\\d+\\-*\\d*")
library(readr)
violencia$`Proporcion de violencia psicologica y fisica contra la mujer` = parse_number(violencia$`Proporcion de violencia psicologica y fisica contra la mujer`)
str(violencia)
## 'data.frame':    558 obs. of  4 variables:
##  $ Pais                                                        : chr  "AFG" "AFG" "AFG" "AFG" ...
##  $ Edad                                                        :List of 558
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "18-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "18-49"
##   ..$ : chr "15-49"
##   ..$ : chr "18-49"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-29"
##   ..$ : chr "30-39"
##   ..$ : chr "15-49"
##   ..$ : chr "40-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   ..$ : chr "25-29"
##   ..$ : chr "30-34"
##   ..$ : chr "35-39"
##   ..$ : chr "40-44"
##   ..$ : chr "15-49"
##   ..$ : chr "45-49"
##   ..$ : chr "15-19"
##   ..$ : chr "20-24"
##   .. [list output truncated]
##  $ Year                                                        :List of 558
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2012"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2012"
##   ..$ : chr "2016"
##   ..$ : chr "2012"
##   ..$ : chr "2010"
##   ..$ : chr "2010"
##   ..$ : chr "2010"
##   ..$ : chr "2010"
##   ..$ : chr "2010"
##   ..$ : chr "2010"
##   ..$ : chr "2010"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2005"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   .. [list output truncated]
##  $ Proporcion de violencia psicologica y fisica contra la mujer: num  28.7 41.1 48.6 49.3 49.1 45.2 46.1 51.9 24.3 32.9 ...

Nos quedamos con el rango de edad de 15 a 49 años

violencia=violencia[-c(1:6),]
violencia=violencia[-c(2),]
violencia=violencia[-c(2:7,9),]
violencia=violencia[-c(3:8,10,12:17,19,20:25,27),]
violencia=violencia[-c(10:14,16,17:22,24,26:31,33,34:39),]
violencia=violencia[-c(15:18,20:26,28:34,36:42,44:50,52:58),]
violencia=violencia[-c(21,25:30,32,34:39,41,43:48,50:56),]
#fila 159
violencia=violencia[-c(30:34,36,38:43,45:50,52,55:60,62:68,70,72:77,79),]
#fila 208
violencia=violencia[-c(41:46,48:54,56:62,64,66:71,73,76:81,83:89,91:97,99,101:106),]
#fila 275
violencia=violencia[-c(53:59,61,63:68,70,73:78,80:86,88:94,96,98:102,104,106:110,112:118),]
#fila 342
violencia=violencia[-c(66:70,72:78,80:86,88:94,96,98:103,105:111,113:119,121,124:129,131:137,139),]
#fila 418
violencia=violencia[-c(80:85,87,89:93,95,97:102,104:110,112:118,120,126:131,133:139,141:147,149:154),]
#fila 494
violencia=violencia[-c(96:101,103:106,108,110:115,117:123,125,127:132,134,137:141,143:149,151:157,159),]
#toda la data

Borramos la columna y cambiamos de nombre

violencia[,c(2)]=NULL
str(violencia)
## 'data.frame':    107 obs. of  3 variables:
##  $ Pais                                                        : chr  "AFG" "AGO" "ARM" "AUT" ...
##  $ Year                                                        :List of 107
##   ..$ : chr "2015"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2012"
##   ..$ : chr "2006"
##   ..$ : chr "2015"
##   ..$ : chr "2012"
##   ..$ : chr "2016"
##   ..$ : chr "2012"
##   ..$ : chr "2010"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2005"
##   ..$ : chr "2014"
##   ..$ : chr "2014"
##   ..$ : chr "2006"
##   ..$ : chr "2015"
##   ..$ : chr "2015"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2014"
##   ..$ : chr "2012"
##   ..$ : chr "2013"
##   ..$ : chr "2011"
##   ..$ : chr "2014"
##   ..$ : chr "2013-2014"
##   ..$ : chr "2011"
##   ..$ : chr "2012"
##   ..$ : chr "2016"
##   ..$ : chr "2010-2011"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2013"
##   ..$ : chr "2012"
##   ..$ : chr "2008"
##   ..$ : chr "2012"
##   ..$ : chr "2014-2015"
##   ..$ : chr "2016-2017"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2016"
##   ..$ : chr "2012"
##   ..$ : chr "2014"
##   ..$ : chr "2008"
##   ..$ : chr "2012"
##   ..$ : chr "2014"
##   ..$ : chr "2012"
##   ..$ : chr "2007"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2006"
##   ..$ : chr "2006"
##   ..$ : chr "2012"
##   ..$ : chr "2014"
##   ..$ : chr "2016"
##   ..$ : chr "2014"
##   ..$ : chr "2017"
##   ..$ : chr "2015"
##   ..$ : chr "2015-2016"
##   ..$ : chr "2013"
##   ..$ : chr "2016"
##   ..$ : chr "2012"
##   ..$ : chr "2011-2012"
##   ..$ : chr "2013"
##   ..$ : chr "2013"
##   ..$ : chr "2009"
##   ..$ : chr "2008"
##   ..$ : chr "2016"
##   ..$ : chr "2017"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2005"
##   ..$ : chr "2012"
##   ..$ : chr "2015"
##   ..$ : chr "2000"
##   ..$ : chr "2009"
##   ..$ : chr "2017"
##   ..$ : chr "2013"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2008"
##   ..$ : chr "2012"
##   ..$ : chr "2012"
##   ..$ : chr "2017"
##   ..$ : chr "2016"
##   ..$ : chr "2014"
##   ..$ : chr "2009"
##   ..$ : chr "2017"
##   ..$ : chr "2014"
##   ..$ : chr "2007"
##   ..$ : chr "2016"
##   .. [list output truncated]
##  $ Proporcion de violencia psicologica y fisica contra la mujer: num  46.1 25.9 3.5 4 9.8 28.8 8 27.1 9 9.3 ...
#Eliminamos el año
violencia[,c(2)]=NULL
names(violencia)=c("Pais","Violencia contra la mujer 15-49 años")
violencia$Pais=trimws(violencia$Pais,whitespace = "[\\h\\v]")
str(violencia)
## 'data.frame':    107 obs. of  2 variables:
##  $ Pais                                : chr  "AFG" "AGO" "ARM" "AUT" ...
##  $ Violencia contra la mujer 15-49 años: num  46.1 25.9 3.5 4 9.8 28.8 8 27.1 9 9.3 ...

Merge de data violencia

mergeviolencia=merge(violencia, violencia_domestica, all.x=TRUE, all.y=TRUE)

Lo subimos a GitHub

#VARIABLE INDEPENDIENTE: Calidad de vida de la mujer –> Fuerza Laboral Femenina y Esperanza de vida de las mujeres

Fuerza labora Femenina

library(rio)
fuerzalink= "https://github.com/Natalia-Aquize/Trabajo-de-Estad-stica./raw/master/Data_Extract_From_World_Development_Indicators-2.xlsx"

fuerza=import(fuerzalink)

Limpieza

fuerza$`Series Name`=NULL
fuerza$`Series Code`=NULL
fuerza$`Country Name`=NULL
names(fuerza)= c("Country","Fuerza laboral femenina")
fuerza$`Fuerza laboral femenina`=as.numeric(fuerza$`Fuerza laboral femenina`)
## Warning: NAs introduced by coercion
fuerza$`Fuerza laboral femenina`=round(fuerza$`Fuerza laboral femenina`, 1)
fuerza= na.omit(fuerza)

Esperanza de vida de la mujer

esperanzalink= "https://github.com/Natalia-Aquize/Trabajo-de-Estad-stica./raw/master/Esperanza%20de%20vida.xlsx"
esperanza= import(esperanzalink)
esperanza$`GDP - per capita (PPP)`= NULL
esperanza= na.omit(esperanza)

MERGE

names(esperanza)= c("Pais", "Esperanza de vida de mujeres")

names(fuerza)= c("Pais", "Fuerza laboral femenina")
calidad=merge(fuerza,esperanza,all.x=T,all.y=T)
head(calidad)
##   Pais Fuerza laboral femenina Esperanza de vida de mujeres
## 1  ABW                      NA                         80.7
## 2  AFG                    19.8                         54.4
## 3  AGO                    50.1                         63.4
## 4  AIA                      NA                         84.5
## 5  ALB                    41.4                         81.9
## 6  AND                      NA                         85.4
calidad=na.omit(calidad)

#Variable INDEPENDIENTE: Brecha Educacional –> Alfabetización y Educación

library(rio)

linkEdu1 = "https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataEducacionSuperiorFem%20Sucia.xlsx"

DataEduF = import(linkEdu1)

linkEdu2 = "https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataEducacionSuperiorM%20Sucia.xlsx"

DataEduM = import(linkEdu2)

Limpieza Base de Datos Femenina

#Borrando columnas 

DataEduF$`Series Name` =NULL
DataEduF$`Series Code` =NULL
DataEduF$`Country Name`=NULL
#Cambiando el nombre de las columnas

names(DataEduF) = c("Pais", "2009F", "2010F", "2011F", "2012F", "2013F", "2014F", "2015F", "2016F", "2017F", "2018F", "2019F" )
#Eliminando filas vacías

DataEduF <- DataEduF[-c(218:222), ]
str(DataEduF)
## 'data.frame':    217 obs. of  12 variables:
##  $ Pais : chr  "AFG" "ALB" "DEU" "AND" ...
##  $ 2009F: chr  "1.4121300000000001" "38.669890000000002" ".." ".." ...
##  $ 2010F: chr  ".." "51.571089999999998" ".." ".." ...
##  $ 2011F: chr  "1.82724" "58.230139999999999" ".." ".." ...
##  $ 2012F: chr  ".." "69.719620000000006" ".." ".." ...
##  $ 2013F: chr  ".." "76.316509999999994" "59.433990000000001" ".." ...
##  $ 2014F: chr  "3.4870199999999998" "78.319590000000005" "63.942869999999999" ".." ...
##  $ 2015F: chr  ".." "73.530119999999997" "67.043909999999997" ".." ...
##  $ 2016F: chr  ".." "70.076769999999996" "69.462860000000006" ".." ...
##  $ 2017F: chr  ".." "69.810360000000003" "70.706890000000001" ".." ...
##  $ 2018F: chr  "4.9050799999999999" "67.578609999999998" ".." ".." ...
##  $ 2019F: chr  ".." ".." ".." ".." ...
#Convirtiendo a numérica

DataEduF[2:12]=lapply(DataEduF[2:12], as.numeric)
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
#Verificando valores perdidos

DataEduF[!complete.cases(DataEduF),]
##     Pais     2009F     2010F     2011F     2012F     2013F     2014F     2015F
## 1    AFG   1.41213        NA   1.82724        NA        NA   3.48702        NA
## 2    ALB  38.66989  51.57109  58.23014  69.71962  76.31651  78.31959  73.53012
## 3    DEU        NA        NA        NA        NA  59.43399  63.94287  67.04391
## 4    AND        NA        NA        NA        NA        NA        NA        NA
## 5    AGO        NA        NA   3.32261        NA   7.84724        NA   7.40054
## 6    ATG  20.71307  24.15147  20.26235  34.28886        NA        NA        NA
## 7    SAU  35.50794  39.29681  42.21555  47.03119  51.31625  58.07670  61.44342
## 8    DZA  35.32708  35.42107  37.07264  38.56113  40.87643  41.85668  45.04758
## 9    ARG  84.18764  87.82828  92.92044  94.67601  96.55508 100.30122 104.51591
## 10   ARM  56.61935  58.03413  57.70820  49.85343  48.49313  50.08286  50.51742
## 11   ABW  41.73998  43.93540  46.84075  45.58515  22.57240  23.03694  21.37302
## 12   AUS        NA        NA        NA        NA        NA        NA 140.95175
## 13   AUT        NA        NA        NA        NA  86.94741  86.27942  88.00541
## 14   AZE  18.93108  19.15638  19.80818  20.92553  22.62382  24.75323  27.48078
## 15   BHS        NA        NA        NA        NA        NA        NA        NA
## 16   BHR        NA        NA  57.50120  60.93734  57.90605  57.54474  59.30616
## 17   BGD   8.11878        NA  11.19707  11.55667        NA  11.74298        NA
## 18   BRB 104.26209  95.81395  90.57161        NA        NA        NA        NA
## 19   BLR  89.14320  94.59196 101.82048 107.92172 108.11110 105.10836 102.61460
## 20   BEL  72.61032  75.92278  78.31387  80.14380  81.53801  82.77246  84.66545
## 21   BLZ  27.96540  26.86474  27.30625  30.29557  30.03308  29.90883  28.67228
## 22   BEN   5.73935   7.18678   5.48830   7.14151   8.76919   8.50553   7.74509
## 23   BMU  47.19807  41.37597  43.14968  42.11310  41.94037  36.93416  35.26949
## 24   BTN   4.94325   5.51626   7.36334   7.91529   9.43436        NA        NA
## 25   BOL        NA        NA        NA        NA        NA  38.80000  42.10000
## 26   BIH        NA        NA        NA  57.30000  61.50000        NA        NA
## 27   BWA        NA        NA        NA        NA        NA  30.01804  34.61948
## 28   BRA  42.16417        NA  49.34314  51.67467  53.86612  57.58743  58.50373
## 29   BRN  21.67991  20.37801  22.48696  28.98388  32.04040  41.09151  39.92528
## 30   BGR  62.18039  66.09698  66.97068  69.00306  72.10170  75.57675  79.11971
## 31   BFA   2.29505   2.30869   2.73884   3.00833   3.13864   3.30469   3.46127
## 32   BDI        NA   2.29263   1.94214   2.47249   2.80636   2.54646        NA
## 33   CPV  17.45392  20.32140  23.87553  23.91381  27.20810  28.54298  27.45799
## 34   KHM   8.44712  10.47134  11.42138        NA        NA        NA  11.81066
## 35   CMR   7.97536  10.00334  10.22344  11.41226  13.33969  14.25631  15.10736
## 36   CAN  73.92633  71.82283  73.63206  73.58981  74.91763  75.26596  74.48037
## 37   TCD   0.59154   0.62069   0.85090        NA        NA   1.12839   1.45916
## 38   CHL  62.75647  70.32853  75.75654  80.23166  84.24253  87.45525  89.94314
## 39   CHN  22.87581  24.95607  26.78327  30.26018  34.55895  45.75697  50.17866
## 40   CYP  48.46208  45.62976  47.29882  49.71835  53.69162  62.59883  69.39547
## 41   COL  38.52225  41.34383  45.15120  48.16623  52.15952  55.21668  57.43417
## 42   COM   4.90223   4.92626   7.03765   8.05181   8.12646   8.04879        NA
## 43   COG   2.16834        NA   6.42889   7.71339   7.99310        NA        NA
## 44   COD   3.19054        NA   5.02359   5.87524   4.33428        NA        NA
## 45   KOR  86.80551  86.81078  85.59628  83.19102  82.11578  81.89217  81.95525
## 46   PRK  20.57362        NA        NA        NA        NA        NA  19.95625
## 47   CRI        NA        NA  51.08759  53.54599  54.00439  57.89230  60.28377
## 48   CIV   5.72048   5.16145   2.72639        NA   6.23510   6.04756   6.90346
## 49   HRV  54.80814  62.11654  66.98620  70.16679  75.53334  78.29661  76.73714
## 50   CUB 143.19979 118.62490 101.22367  77.80103  62.12298        NA  42.50212
## 51   CUW        NA        NA        NA        NA  29.58909        NA        NA
## 52   DNK  88.40519  87.44201  90.58639  93.11795  94.50234  95.33990  96.29026
## 53   DJI   2.99078   3.08424   4.56802        NA        NA        NA        NA
## 54   DMA        NA        NA        NA        NA        NA        NA        NA
## 55   ECU        NA        NA        NA  45.33185        NA        NA  48.39747
## 56   EGY  28.87459  30.01423  25.52576  26.15459  28.37723  29.29898  34.32684
## 57   SLV  26.89196  27.38869  28.30200  29.05800  29.51501  29.13171  29.36202
## 58   ARE        NA        NA        NA        NA        NA        NA        NA
## 59   ERI   1.31449   1.78270        NA        NA        NA   2.54506   2.73688
## 60   SVN 103.93128 107.43621 108.85567 104.51341 101.60661  97.87918  95.95792
## 61   ESP  79.57560  84.16237  88.74741  90.69085  92.07241  93.49333  93.24180
## 62   USA        NA 108.25285 109.49806 108.93757 103.11261 102.59939 102.74733
## 63   EST  85.19986  85.85200  86.85179  88.40093  89.13724  88.72938  87.47979
## 64   SWZ        NA        NA   7.10970        NA   6.56377        NA        NA
## 65   ETH   3.28954   4.49457   4.78586   5.21049        NA   5.26314        NA
## 66   RUS  86.81824        NA  87.41099  85.22917  86.30337  85.77799  87.55020
## 67   FJI        NA        NA        NA        NA        NA        NA        NA
## 68   PHL  31.54392  32.91117  34.13121  34.46018  37.46534  40.11325        NA
## 69   FIN 101.06711 103.07247 105.00136 101.96106  99.76842  97.26281  95.81939
## 70   FRA  59.16200  61.24571  61.97702  64.59659  66.50814  68.30630  69.71964
## 71   GAB        NA        NA        NA   6.40000   6.70000        NA        NA
## 72   GMB        NA   1.61020   2.31587   2.24482        NA        NA        NA
## 74   GHA   6.69563        NA   8.94769   9.21102  10.81400  12.35505  12.85441
## 75   GIB        NA        NA        NA        NA        NA        NA        NA
## 76   GRD  75.27603        NA        NA        NA        NA        NA 102.53085
## 77   GRC        NA 107.34075 112.53123 117.12008 119.13316 124.95822        NA
## 78   GRL        NA        NA        NA        NA        NA        NA        NA
## 79   GUM        NA        NA        NA        NA        NA        NA        NA
## 80   GTM        NA        NA        NA        NA  20.03382  19.17984  23.55790
## 81   GIN   4.65416   5.24045   5.61431   5.52467   6.57626   6.99001        NA
## 82   GNQ        NA        NA        NA        NA        NA        NA        NA
## 83   GNB        NA        NA        NA        NA        NA        NA        NA
## 84   GUY  14.65204  16.33976  15.91532  15.38762        NA        NA        NA
## 85   HTI        NA        NA        NA   3.30000   3.50000        NA        NA
## 86   HND        NA  20.94901        NA  22.29288  22.83794  23.06304  23.62654
## 87   HKG  55.19316  59.46156  63.46442  62.55570  70.67348  73.26067  73.97787
## 88   HUN  75.02001  73.77801  71.79922  70.02634  64.57958  58.88083  54.69771
## 89   IND  13.28658  15.05774  20.09418        NA  23.16391  25.39835  26.81881
## 90   IDN  22.34470  22.47408  24.21068  31.01600  32.72562  32.65576  35.04789
## 91   IRN  39.10785  44.10528  49.88759  56.39154  57.32222  63.75927        NA
## 92   IRQ        NA        NA   7.94626   8.52452   8.35641        NA        NA
## 93   IRL  60.38679  65.41380  70.45540  70.17842  73.44940  75.85867  80.58055
## 94   IMN        NA        NA        NA        NA        NA        NA        NA
## 95   MAF        NA        NA        NA        NA        NA        NA        NA
## 96   ISL  97.54238 101.54269 102.59843 103.83879 101.78220 104.14990  98.04906
## 97   CYM        NA        NA        NA        NA        NA        NA        NA
## 98   CHI        NA        NA        NA        NA        NA        NA        NA
## 99   FRO        NA        NA        NA        NA        NA        NA        NA
## 100  MHL        NA        NA        NA  23.80952        NA        NA        NA
## 101  SLB        NA        NA        NA        NA        NA        NA        NA
## 102  TCA        NA        NA        NA        NA        NA        NA        NA
## 103  VIR        NA        NA        NA        NA        NA        NA        NA
## 104  VGB  89.58810        NA        NA        NA        NA        NA  54.23038
## 105  ISR  71.46137  74.55251  76.01062  78.23892  77.19343  77.05110  76.33288
## 106  ITA  78.64561  77.70516  77.63033  75.69786  73.01086  72.09432  70.84647
## 107  JAM  33.14470  37.79228  36.98515  39.02760  38.24911        NA  34.69339
## 108  JPN        NA        NA        NA        NA  85.52455  86.43157        NA
## 109  JOR  43.92889  39.59065  39.07156  44.84537        NA        NA  38.18288
## 110  KAZ        NA  51.68813  54.27813  57.78616  56.42265  54.52119  52.09302
## 111  KEN   3.27667        NA        NA        NA        NA        NA   7.67757
## 112  KGZ  50.88197  47.75469  45.84192  49.06526  53.58782  52.03380  52.98461
## 113  KIR        NA        NA        NA        NA        NA        NA        NA
## 114  XKX        NA        NA        NA        NA        NA        NA        NA
## 115  KWT        NA        NA        NA        NA        NA  68.93841  76.50117
## 116  LSO        NA        NA        NA  13.63424  12.97684  12.87611  12.23677
## 117  LVA  95.32370  88.43245  84.82514  81.64253  83.75312  83.77707  91.13356
## 118  LBN        NA        NA        NA        NA        NA        NA        NA
## 119  LBR        NA   6.57833        NA   9.15192        NA        NA        NA
## 120  LBY        NA        NA        NA        NA        NA        NA        NA
## 121  LIE  22.52592  27.35761  29.93513  30.07246        NA  24.14105  21.88919
## 122  LTU 107.20506 104.55157 101.42798  95.52589  88.28057  84.18322  82.67658
## 123  LUX        NA  19.22441        NA  20.68606        NA        NA  20.82938
## 124  MKD  42.65954  40.39520        NA  42.56701  42.24759  42.83583  45.85842
## 125  MDG   3.31752   3.50057   3.91773   3.96282   4.15512   4.61272   4.56489
## 126  MYS  40.58598  42.99131  41.41298  43.28743  45.21575  45.43081  51.66175
## 127  MWI        NA   0.53521   0.63539        NA        NA        NA        NA
## 128  MDV        NA        NA        NA        NA        NA  20.05411        NA
## 129  MLI   3.47904   3.56360   3.25185   3.96207   3.76000   3.50106   3.23422
## 130  MLT  41.02061  42.94957  46.12488  49.10042  50.55391  50.68875  55.02756
## 131  MNP        NA        NA        NA        NA        NA        NA        NA
## 132  MAR  12.82843  13.82102  15.71061  18.68467  22.11936  24.89558  27.78318
## 133  MUS  35.01564  36.91036  40.10380  44.43012  44.12455  43.20239  42.51898
## 134  MRT   2.20143   2.49808   2.76017   3.05489   3.29982        NA   3.72727
## 135  MEX  26.28900  27.25701  28.03772  29.16375  29.95729  30.83395  31.56362
## 136  FSM        NA        NA        NA        NA        NA        NA        NA
## 137  MCO        NA        NA        NA        NA        NA        NA        NA
## 138  MNG  62.58965  65.11734  66.50181  69.12226  72.72528  75.22428  78.85986
## 139  MNE  55.85345  58.33446        NA        NA        NA        NA        NA
## 140  MOZ   2.95838   3.66594   3.77800   4.08279   4.44917   5.13915   5.58368
## 141  MMR        NA        NA  16.19707  14.85785        NA        NA        NA
## 142  NAM        NA        NA        NA        NA        NA  24.46697  25.97564
## 143  NRU        NA        NA        NA        NA        NA        NA        NA
## 144  NPL   8.57949  11.29164  11.61579        NA  15.38884        NA  14.53834
## 145  NIC        NA        NA        NA  36.52467        NA        NA        NA
## 146  NER   0.74401   0.79320   0.83970   0.88261        NA        NA   2.12514
## 147  NGA        NA   8.12430   8.30040        NA        NA        NA        NA
## 148  NOR  91.17895  91.21774  90.82011  90.52381  92.30117  92.21053  92.93425
## 149  NCL        NA        NA        NA        NA        NA        NA        NA
## 150  NZL        NA        NA        NA        NA  92.91371  92.62178  94.90342
## 151  OMN  27.41112  28.48786  33.11747        NA  40.97861  48.94705  54.19620
## 152  NLD  64.58091  67.26598  80.12400  80.35700        NA        NA  86.12705
## 153  PAK   6.22182        NA   7.96285   9.18671   9.63351   9.96779   8.58921
## 154  PLW        NA        NA        NA        NA  66.40212        NA        NA
## 155  PAN  52.49909  53.70443  51.42041  53.56288        NA  54.83029  57.99223
## 156  PNG        NA        NA        NA        NA        NA        NA        NA
## 157  PRY  43.64765  40.88207        NA        NA        NA        NA        NA
## 158  PER        NA        NA        NA        NA        NA        NA        NA
## 159  PYF        NA        NA        NA        NA        NA        NA        NA
## 160  POL  85.73164  90.67485  91.70821  90.97769  88.36505  83.49285  81.07876
## 161  PRT  67.98629  71.16144  74.47559  74.29771  70.88008  70.28986  65.59141
## 162  PRI 102.79306 106.90958 106.28214 108.07624 108.86268 110.12694 114.48715
## 163  QAT  25.71725  26.28676  30.45212  31.26685  34.41750  40.28215  45.03147
## 164  MAC  51.69932  54.09354  58.11605  56.65824  64.68257  72.97984  80.82486
## 165  GBR  66.94900  67.52451  67.49652  67.86715  65.08417  64.50465  64.65976
## 166  SYR  23.16242  23.94380  25.75019  30.59374  32.81329  42.08946  44.76589
## 167  CAF   1.54665   1.30820        NA   1.60102        NA        NA        NA
## 168  CZE  71.04753  74.88850  77.27000  77.35479  76.76360  76.91578  75.68125
## 169  MDA  44.66556  43.73392  45.41286  45.70634  46.63651  47.27736  47.36551
## 170  LAO  14.45276  14.37842  14.99190  15.87804  17.71403  17.65301  17.66563
## 171  DOM        NA        NA        NA  59.82908        NA  60.91206  66.98925
## 172  SVK  69.17988  69.61710  68.51109  68.36272  66.28194  64.27144  61.80662
## 173  PSE  52.69877  54.86599  57.79266  56.93336  55.21823  54.67535  55.63197
## 174  ROU  79.34246  74.36121  67.22347  55.85264  52.34859  52.68204  52.21331
## 175  RWA   4.57224   5.18612   5.99487   6.06047   6.52209   6.74895   6.72255
## 176  KNA        NA        NA        NA        NA        NA  86.11252 115.88089
## 177  WSM        NA        NA        NA        NA        NA        NA        NA
## 178  ASM        NA        NA        NA        NA        NA        NA        NA
## 179  SMR        NA  69.69309  68.12500  58.71122        NA        NA        NA
## 180  VCT        NA        NA        NA        NA        NA  33.77758  29.77217
## 181  LCA  25.13349  17.82500  20.56317  13.75149  18.09859  22.26636  21.41597
## 182  STP   3.80336   4.27038        NA   7.63000        NA   9.05152  13.65164
## 183  SEN   5.80993   5.60403   7.32529   7.40009   7.60871   7.92605   8.02511
## 184  SRB  56.38332  55.62779  58.84335  61.16691  64.54011  66.01105  66.87789
## 185  SYC        NA        NA   4.05210   2.15641   4.55587   9.64306  20.02915
## 186  SLE        NA        NA        NA   5.41692   5.67353        NA        NA
## 187  SGP        NA        NA        NA        NA        NA        NA        NA
## 188  SXM        NA        NA        NA   9.69426        NA   8.32812   8.96226
## 189  SOM        NA        NA        NA        NA        NA        NA        NA
## 190  LKA        NA  20.87313  19.10599  21.02698  22.91369  21.67235  23.93362
## 191  ZAF        NA        NA        NA  22.40702  23.38007  23.22680        NA
## 192  SDN  16.56876  17.19209  15.87546  16.66896  18.64729  17.43428  17.06071
## 193  SSD        NA        NA        NA        NA        NA        NA        NA
## 194  SWE  87.15156  89.57827  88.07282  84.13793  77.36019  75.74329  75.63381
## 195  CHE  50.34146  52.65946  54.25391  55.48953  56.61547  57.71653  58.53498
## 196  SUR        NA        NA        NA        NA        NA        NA        NA
## 197  THA  53.96824  56.55100  58.60076  57.67101  57.46897  57.78680        NA
## 198  TZA        NA   1.94126        NA   2.80986   2.57994        NA   2.80330
## 199  TJK  15.72754  15.78600  15.23598  15.56074  16.44065  18.63707  21.33957
## 200  TLS  13.55747  14.81589        NA        NA        NA        NA        NA
## 201  TGO        NA        NA        NA   4.55551        NA   6.14726   6.56010
## 202  TON        NA        NA        NA        NA        NA        NA        NA
## 203  TTO        NA        NA        NA        NA        NA        NA        NA
## 204  TUN  42.20645  43.22497  43.82184  44.00836  43.16219  44.12122  44.07345
## 205  TKM        NA        NA        NA        NA        NA   6.19576        NA
## 206  TUR        NA        NA        NA  59.63784        NA        NA        NA
## 207  TUV        NA        NA        NA        NA        NA        NA        NA
## 208  UKR  92.03856  89.53580  89.28795  87.59632  87.38717  88.81466        NA
## 209  UGA   3.74244   3.48630   3.86962   3.19570        NA   4.09987        NA
## 210  URY        NA        NA        NA        NA        NA        NA        NA
## 211  UZB   8.14687   7.58018   6.89394   5.99372   6.01359   6.17377   6.31776
## 212  VUT        NA        NA        NA        NA        NA        NA        NA
## 213  VEN        NA        NA        NA        NA        NA        NA        NA
## 214  VNM  20.30738  23.01379  25.27843        NA  23.95194  31.56581  29.15524
## 215  YEM        NA   6.50644   6.16967        NA        NA        NA        NA
## 216  ZMB        NA        NA   2.26496   3.50167        NA        NA        NA
## 217  ZWE        NA   5.71466   5.55479   5.72372   6.09897        NA   9.17213
##         2016F     2017F     2018F    2019F
## 1          NA        NA   4.90508       NA
## 2    70.07677  69.81036  67.57861       NA
## 3    69.46286  70.70689        NA       NA
## 4          NA        NA        NA       NA
## 5     8.45325        NA        NA       NA
## 6          NA        NA        NA       NA
## 7    67.53541  69.34002  69.87621       NA
## 8    53.59891  57.24471  64.42081       NA
## 9   109.16721 112.79844        NA       NA
## 10   57.11542  58.67676  62.64839       NA
## 11   20.69792        NA        NA       NA
## 12  143.02353 133.33777        NA       NA
## 13   90.82589  92.46150        NA       NA
## 14   28.13302  29.03385  29.69345       NA
## 15         NA        NA        NA       NA
## 16   62.99215  64.26851  67.84063       NA
## 17   14.68115  14.91033  16.98329       NA
## 18         NA        NA        NA       NA
## 19   99.74855  98.34385  95.09214       NA
## 20   86.02862  90.46261        NA       NA
## 21   29.93244  30.48455        NA       NA
## 22    7.64171   7.46639        NA       NA
## 23         NA  22.46104  22.90533       NA
## 24         NA        NA  15.49214       NA
## 25         NA        NA        NA       NA
## 26         NA        NA        NA       NA
## 27   30.35431  29.24466        NA       NA
## 28   58.75485  59.44738        NA       NA
## 29   40.27507  42.00012  38.71807       NA
## 30   79.28095  78.82418        NA       NA
## 31    3.75034   4.09469   4.76497       NA
## 32    3.51356   3.75480        NA       NA
## 33   28.93060  29.34471  28.34652       NA
## 34         NA  12.16869  12.93279       NA
## 35   11.68883  11.44435        NA       NA
## 36   76.38456  79.29239        NA       NA
## 37         NA        NA        NA       NA
## 38   92.58558  94.66281        NA       NA
## 39   52.74170  53.97915  55.88122       NA
## 40   73.41246  82.35413        NA       NA
## 41   59.74896  60.83253  59.72434       NA
## 42         NA        NA        NA       NA
## 43         NA  10.14620        NA       NA
## 44    4.73101        NA        NA       NA
## 45   82.19882  82.84250        NA       NA
## 46         NA        NA  18.18409       NA
## 47   59.41439  62.16411  60.68018       NA
## 48    7.24935   7.63550        NA       NA
## 49   77.37743  78.83716        NA       NA
## 50   40.00702  50.50682  51.00784       NA
## 51         NA        NA        NA       NA
## 52   93.95383  93.57748        NA       NA
## 53         NA        NA        NA       NA
## 54         NA        NA        NA       NA
## 55         NA        NA        NA       NA
## 56   34.24900  35.77688        NA       NA
## 57   29.47254  30.15279  31.14780       NA
## 58         NA        NA        NA       NA
## 59    2.78561        NA        NA       NA
## 60   92.14177  93.02170        NA       NA
## 61   94.41169  97.02816        NA       NA
## 62  102.29380 102.01133        NA       NA
## 63   86.44786  84.82447        NA       NA
## 64         NA        NA        NA       NA
## 65         NA        NA        NA       NA
## 66   87.72641  89.11636        NA       NA
## 67         NA        NA        NA       NA
## 68         NA  40.41902        NA       NA
## 69   94.50517  95.74750        NA       NA
## 70   71.73220  72.78425        NA       NA
## 71         NA        NA        NA       NA
## 72         NA        NA        NA       NA
## 74   12.96393  13.42023  13.56528       NA
## 75         NA        NA        NA       NA
## 76  107.93140 110.33797 116.22426       NA
## 77  132.72473 136.99724        NA       NA
## 78         NA        NA        NA       NA
## 79         NA        NA        NA       NA
## 80         NA        NA        NA       NA
## 81         NA        NA        NA       NA
## 82         NA        NA        NA       NA
## 83         NA        NA        NA       NA
## 84         NA        NA        NA       NA
## 85         NA        NA        NA       NA
## 86   24.33926  28.12971  30.28331       NA
## 87   77.50577  78.54645  81.11762       NA
## 88   53.47320  53.91295        NA       NA
## 89   27.04352  28.03872  29.06165       NA
## 90   37.69703  38.99032  38.99366       NA
## 91   64.26306  62.85649        NA       NA
## 92         NA        NA        NA       NA
## 93   81.56447  81.99678        NA       NA
## 94         NA        NA        NA       NA
## 95         NA        NA        NA       NA
## 96   96.79791  94.42382        NA       NA
## 97         NA        NA        NA       NA
## 98         NA        NA        NA       NA
## 99         NA        NA        NA       NA
## 100        NA        NA        NA       NA
## 101        NA        NA        NA       NA
## 102        NA        NA        NA       NA
## 103        NA        NA        NA       NA
## 104  50.74627        NA  20.94340       NA
## 105  76.04325  74.47486        NA       NA
## 106  70.65632  71.51538        NA       NA
## 107        NA        NA        NA       NA
## 108        NA        NA        NA       NA
## 109  36.82399  33.25256  37.37089       NA
## 110  51.64216  56.12924  60.03320 68.44193
## 111   9.40628   9.73054        NA       NA
## 112  50.74468  47.51968  46.73536       NA
## 113        NA        NA        NA       NA
## 114        NA        NA        NA       NA
## 115  81.53469  77.46966  76.13706       NA
## 116        NA  13.33513  12.39755       NA
## 117  98.10533 105.05897        NA       NA
## 118        NA        NA        NA       NA
## 119        NA        NA        NA       NA
## 120        NA        NA        NA       NA
## 121  24.75158  27.35507        NA       NA
## 122  82.54948  84.00104        NA       NA
## 123  20.63326  20.14930        NA       NA
## 124        NA  48.55228        NA       NA
## 125   4.62497   5.09647   5.21415       NA
## 126  50.57597  47.06639  49.85466       NA
## 127        NA        NA        NA       NA
## 128        NA  59.77832        NA       NA
## 129   2.53251   2.66183        NA       NA
## 130  56.54726  63.17398        NA       NA
## 131        NA        NA        NA       NA
## 132  30.72886  33.29096  35.69778       NA
## 133  43.79940  47.45723        NA       NA
## 134   3.57665   3.33115        NA       NA
## 135  38.56783  40.62317        NA       NA
## 136        NA        NA        NA       NA
## 137        NA        NA        NA       NA
## 138  74.38400  75.31888  76.65813       NA
## 139  63.88608  66.11125  64.91357       NA
## 140   6.34235   6.34179   6.53364       NA
## 141        NA        NA  21.98387       NA
## 142  27.83812  30.26425        NA       NA
## 143        NA        NA        NA       NA
## 144  11.49555  11.64118  12.82445       NA
## 145        NA        NA        NA       NA
## 146   2.50417   2.44505   2.56518       NA
## 147        NA        NA        NA       NA
## 148  96.63700  98.72165        NA       NA
## 149        NA        NA        NA       NA
## 150  96.40853  97.17176        NA       NA
## 151  59.53948  54.81871  55.55291       NA
## 152  85.34627  90.91987        NA       NA
## 153   8.39577   8.67735   8.32044       NA
## 154        NA        NA        NA       NA
## 155  58.59022        NA        NA       NA
## 156        NA        NA        NA       NA
## 157        NA        NA        NA       NA
## 158  73.55465  72.67321        NA       NA
## 159        NA        NA        NA       NA
## 160  80.97906  81.88045        NA       NA
## 161  66.67509  67.69994        NA       NA
## 162 116.24908        NA        NA       NA
## 163  48.10350  51.58690  54.86746       NA
## 164  89.56997  96.16884 104.46099       NA
## 165  67.22568  69.37931        NA       NA
## 166  42.79074        NA        NA       NA
## 167        NA        NA        NA       NA
## 168  74.81392  75.27370        NA       NA
## 169  47.21759  46.66393  45.71871       NA
## 170  17.17160  16.04950  15.51763       NA
## 171  69.95907  77.01242        NA       NA
## 172  57.94619  56.63234        NA       NA
## 173  54.18773  54.22384  54.34769       NA
## 174  54.19454  55.43648        NA       NA
## 175   6.70845   6.97135   6.01428       NA
## 176        NA        NA        NA       NA
## 177        NA        NA        NA       NA
## 178        NA        NA        NA       NA
## 179        NA        NA  35.95238       NA
## 180        NA        NA        NA       NA
## 181  25.06278  26.50514  18.68560       NA
## 182        NA        NA        NA       NA
## 183   8.11605   8.64482  10.30509       NA
## 184  70.86127  76.85531  78.25281       NA
## 185  24.10714  27.91195  23.30402       NA
## 186        NA        NA        NA       NA
## 187  90.57452  91.19697        NA       NA
## 188        NA        NA        NA       NA
## 189        NA        NA        NA       NA
## 190  22.90363  22.82258  23.44222       NA
## 191  24.47296  26.37453        NA       NA
## 192        NA        NA        NA       NA
## 193        NA        NA        NA       NA
## 194  77.50260  82.07651        NA       NA
## 195  58.63094  60.32979        NA       NA
## 196        NA        NA        NA       NA
## 197  57.76924        NA        NA       NA
## 198        NA        NA        NA       NA
## 199  24.36750  26.85371        NA       NA
## 200        NA        NA        NA       NA
## 201   7.52287   8.11988   9.79750       NA
## 202        NA        NA        NA       NA
## 203        NA        NA        NA       NA
## 204  41.80367  41.66291  41.23498       NA
## 205        NA        NA        NA       NA
## 206        NA        NA        NA       NA
## 207        NA        NA        NA       NA
## 208        NA        NA        NA       NA
## 209        NA        NA        NA       NA
## 210  96.65391  98.19565        NA       NA
## 211   6.61392   6.90254   8.24900       NA
## 212        NA        NA        NA       NA
## 213        NA        NA        NA       NA
## 214  31.71716        NA        NA       NA
## 215        NA        NA        NA       NA
## 216        NA        NA        NA       NA
## 217        NA        NA        NA       NA
#Verificar qué columna tiene mas NA's


sum(is.na(DataEduF$"2009F"))
## [1] 94
sum(is.na(DataEduF$"2010F"))
## [1] 91
sum(is.na(DataEduF$"2011F"))
## [1] 86
sum(is.na(DataEduF$"2012F"))
## [1] 81
sum(is.na(DataEduF$"2013F"))
## [1] 92
sum(is.na(DataEduF$"2014F"))
## [1] 90
sum(is.na(DataEduF$"2015F"))
## [1] 88
sum(is.na(DataEduF$"2016F"))
## [1] 94
sum(is.na(DataEduF$"2017F"))
## [1] 97
sum(is.na(DataEduF$"2018F"))
## [1] 157
#Promedio Mujeres

DataEduF$'Promedio Educación 2009-2019'=rowMeans(DataEduF[,c(2:12)], na.rm = TRUE)
DataEduF$`Promedio Educación 2009-2019`=gsub("NaN", NA, DataEduF$`Promedio Educación 2009-2019`)
DataEduF[,c(2:12)]=NULL
#Borramos NA
DataEduF=na.omit(DataEduF)
DataEduF$`Promedio Educación 2009-2019`=as.numeric(DataEduF$`Promedio Educación 2009-2019`)
#Redondeamos
DataEduF$`Promedio Educación 2009-2019`=round(DataEduF$`Promedio Educación 2009-2019`,1)
DataEduF$Pais=trimws(DataEduF$Pais,whitespace = "[\\h\\v]")

ALFABETIZACION

#2

library(rio)

linkAlfa = "https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataAlfabetizacionTotal%20Sucia.xlsx"

DataAlfa = import(linkAlfa)

Limpieza

#Borrando columnas 

DataAlfa$`Series Name` =NULL
DataAlfa$`Series Code` =NULL
DataAlfa$`Country Name`=NULL
#Cambiando el nombre de las columnas

names(DataAlfa) = c("Pais", "2009F", "2010F", "2011F", "2012F", "2013F", "2014F", "2015F", "2016F", "2017F", "2018F", "2019F" )
#Eliminando filas vacías

DataAlfa <- DataAlfa[-c(218:222), ]
str(DataAlfa)
## 'data.frame':    217 obs. of  12 variables:
##  $ Pais : chr  "AFG" "ALB" "DEU" "AND" ...
##  $ 2009F: chr  ".." ".." ".." ".." ...
##  $ 2010F: chr  ".." ".." ".." ".." ...
##  $ 2011F: chr  "31.741119999999999" "96.845299999999995" ".." ".." ...
##  $ 2012F: chr  ".." "97.246970000000005" ".." ".." ...
##  $ 2013F: chr  ".." ".." ".." ".." ...
##  $ 2014F: chr  ".." ".." "98.1" ".." ...
##  $ 2015F: chr  ".." ".." ".." ".." ...
##  $ 2016F: chr  ".." ".." ".." ".." ...
##  $ 2017F: chr  ".." ".." ".." ".." ...
##  $ 2018F: chr  "43.01972" "98.141149999999996" ".." ".." ...
##  $ 2019F: chr  ".." ".." ".." ".." ...
#Convirtiendo a numérica

DataAlfa[2:12]=lapply(DataAlfa[2:12], as.numeric)
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion

## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
#Verificando valores perdidos

DataAlfa[!complete.cases(DataAlfa),]
##     Pais    2009F    2010F    2011F    2012F    2013F    2014F    2015F
## 1    AFG       NA       NA 31.74112       NA       NA       NA       NA
## 2    ALB       NA       NA 96.84530 97.24697       NA       NA       NA
## 3    DEU       NA       NA       NA       NA       NA 98.10000       NA
## 4    AND       NA       NA       NA       NA       NA       NA       NA
## 5    AGO       NA       NA       NA       NA       NA 66.03011       NA
## 6    ATG       NA       NA 98.95000       NA       NA       NA 98.95000
## 7    SAU       NA       NA       NA       NA 94.42634       NA       NA
## 8    DZA       NA       NA       NA       NA       NA       NA       NA
## 9    ARG 98.98342 98.95497 99.10833 99.10523 99.12195 98.99389 99.17996
## 10   ARM       NA       NA 99.74441       NA       NA       NA       NA
## 11   ABW       NA 96.82264       NA       NA       NA       NA       NA
## 12   AUS       NA       NA       NA       NA 97.80000       NA       NA
## 13   AUT       NA       NA       NA       NA       NA       NA 98.90000
## 14   AZE 99.75984 99.77114 99.77863 99.77577 99.78936 99.78899 99.78806
## 15   BHS       NA       NA       NA       NA       NA       NA       NA
## 16   BHR       NA 90.97740       NA       NA       NA       NA       NA
## 17   BGD       NA       NA 58.76918 57.86075 61.01554 61.09330 65.13733
## 18   BRB       NA       NA       NA       NA       NA 99.60000       NA
## 19   BLR 99.61706       NA       NA       NA       NA       NA       NA
## 20   BEL       NA       NA       NA       NA 98.20000       NA       NA
## 21   BLZ       NA       NA       NA       NA       NA       NA       NA
## 22   BEN       NA       NA       NA 32.94882       NA       NA       NA
## 23   BMU       NA       NA       NA       NA       NA       NA       NA
## 24   BTN       NA       NA       NA 57.03360       NA       NA       NA
## 25   BOL 91.16783       NA 92.22615 94.46057 93.80000 93.30000 92.45508
## 26   BIH       NA       NA 98.14204       NA 96.99177       NA       NA
## 27   BWA       NA       NA       NA       NA 86.82318       NA       NA
## 28   BRA 90.29821 90.37918 91.41124 91.33785 91.48424 91.72943 92.04790
## 29   BRN       NA       NA 96.08556       NA       NA       NA       NA
## 30   BGR       NA       NA 98.35245       NA       NA       NA       NA
## 31   BFA       NA       NA       NA       NA       NA 34.59940       NA
## 32   BDI       NA       NA       NA       NA       NA 61.56973       NA
## 33   CPV       NA       NA       NA 85.32779       NA       NA 86.79029
## 34   KHM 73.90003       NA       NA       NA       NA 78.05509 80.52649
## 35   CMR       NA 71.29051       NA       NA       NA       NA       NA
## 36   CAN       NA       NA       NA       NA       NA       NA       NA
## 37   TCD       NA       NA       NA       NA       NA       NA 26.00299
## 38   CHL 98.55368       NA 96.70301       NA 96.26706       NA 96.87413
## 39   CHN       NA 95.12448       NA       NA       NA       NA       NA
## 40   CYP       NA       NA 98.67843       NA       NA       NA       NA
## 41   COL 93.24469 93.37233 93.58053       NA       NA 94.18625 94.24505
## 42   COM       NA       NA       NA 49.19614       NA       NA       NA
## 43   COG       NA       NA 79.31117       NA       NA       NA       NA
## 44   COD       NA       NA       NA 75.01719       NA       NA       NA
## 45   KOR       NA       NA       NA       NA 96.80000       NA       NA
## 46   PRK       NA       NA       NA       NA       NA       NA       NA
## 47   CRI       NA       NA 97.40658       NA       NA       NA       NA
## 48   CIV       NA       NA       NA 40.98163       NA 43.90842       NA
## 49   HRV       NA       NA 99.12536       NA       NA       NA       NA
## 50   CUB       NA       NA       NA 99.75253       NA       NA       NA
## 51   CUW       NA       NA       NA       NA       NA       NA       NA
## 52   DNK       NA       NA       NA       NA       NA       NA       NA
## 53   DJI       NA       NA       NA       NA       NA       NA       NA
## 54   DMA       NA       NA       NA       NA       NA       NA       NA
## 55   ECU 92.24976 91.85404 91.58690 92.06473 93.29463 94.22264 94.45566
## 56   EGY       NA 72.04785       NA 73.86559 75.06073       NA       NA
## 57   SLV 84.10289 84.49272 85.49399       NA 86.76758       NA 87.96985
## 58   ARE       NA       NA       NA       NA       NA       NA 93.22714
## 59   ERI       NA       NA       NA       NA       NA       NA       NA
## 60   SVN       NA       NA       NA       NA       NA 99.70000       NA
## 61   ESP 97.67927 97.74890 97.78375 97.89454 98.07913 98.09372 98.14326
## 62   USA       NA       NA       NA       NA       NA 95.80000       NA
## 63   EST       NA       NA 99.88579       NA       NA       NA       NA
## 64   SWZ       NA 83.09829       NA       NA       NA       NA       NA
## 65   ETH       NA       NA       NA       NA       NA       NA       NA
## 66   RUS       NA 99.68427       NA       NA       NA       NA       NA
## 67   FJI       NA       NA       NA       NA       NA       NA       NA
## 68   PHL       NA       NA       NA       NA 96.39800       NA 98.18255
## 69   FIN       NA       NA       NA 99.80000       NA       NA       NA
## 70   FRA       NA       NA       NA 94.10000       NA       NA       NA
## 71   GAB       NA       NA       NA 82.28380       NA 83.10000       NA
## 72   GMB       NA       NA       NA       NA 41.95005       NA 50.77797
## 73   GEO       NA       NA       NA       NA       NA 99.58619       NA
## 74   GHA       NA 71.49707       NA       NA       NA       NA       NA
## 75   GIB       NA       NA       NA       NA       NA       NA       NA
## 76   GRD       NA       NA       NA       NA       NA 98.60000       NA
## 77   GRC 93.90511       NA 97.36874       NA       NA       NA       NA
## 78   GRL       NA       NA       NA       NA       NA       NA       NA
## 79   GUM       NA       NA       NA       NA       NA       NA       NA
## 80   GTM       NA       NA       NA 78.26486 77.03867 81.28590       NA
## 81   GIN       NA 25.30774       NA       NA       NA 32.00384       NA
## 82   GNQ       NA 94.37054       NA       NA       NA       NA       NA
## 83   GNB       NA       NA       NA       NA       NA 45.58116       NA
## 84   GUY 84.99401       NA       NA       NA       NA 85.63973       NA
## 85   HTI       NA 53.50000 58.20000       NA       NA       NA       NA
## 86   HND       NA 84.75536 85.12330 85.35555 85.46442 87.19753 87.90683
## 87   HKG       NA       NA       NA       NA       NA       NA       NA
## 88   HUN       NA       NA       NA       NA       NA 99.10000       NA
## 89   IND       NA       NA 69.30256       NA       NA       NA       NA
## 90   IDN 92.58170       NA 92.81191       NA       NA 95.11622 95.21793
## 91   IRN       NA       NA       NA 83.62599 84.62680 84.70524       NA
## 92   IRQ       NA       NA       NA 77.20000 72.70000 82.20000       NA
## 93   IRL       NA       NA       NA 93.20000 93.50000       NA       NA
## 94   IMN       NA       NA       NA       NA       NA       NA       NA
## 95   MAF       NA       NA       NA       NA       NA       NA       NA
## 96   ISL       NA       NA       NA       NA       NA       NA       NA
## 97   CYM       NA       NA       NA       NA       NA       NA       NA
## 98   CHI       NA       NA       NA       NA       NA       NA       NA
## 99   FRO       NA       NA       NA       NA       NA       NA       NA
## 100  MHL       NA       NA 98.26508       NA       NA       NA       NA
## 101  SLB 76.60000       NA       NA       NA       NA       NA       NA
## 102  TCA       NA       NA       NA       NA       NA       NA       NA
## 103  VIR       NA       NA       NA       NA       NA       NA       NA
## 104  VGB       NA       NA       NA       NA       NA       NA       NA
## 105  ISR       NA       NA       NA       NA       NA       NA       NA
## 106  ITA       NA       NA 98.84828       NA       NA       NA       NA
## 107  JAM       NA       NA       NA       NA       NA 88.10000       NA
## 108  JPN       NA       NA       NA       NA       NA 95.60000       NA
## 109  JOR       NA 92.55104 95.90445 97.89032       NA       NA       NA
## 110  KAZ 99.73241 99.78163       NA       NA       NA       NA       NA
## 111  KEN       NA       NA       NA       NA       NA 78.73304       NA
## 112  KGZ 99.24343       NA       NA       NA       NA       NA       NA
## 113  KIR       NA       NA       NA       NA       NA       NA       NA
## 114  XKX       NA       NA       NA       NA       NA       NA       NA
## 115  KWT       NA 94.46901       NA 95.51317 95.58582       NA 95.68545
## 116  LSO 75.80020       NA       NA       NA       NA 76.63520       NA
## 117  LVA       NA       NA 99.89590       NA       NA       NA       NA
## 118  LBN 91.18419       NA       NA       NA       NA       NA       NA
## 119  LBR       NA       NA       NA       NA       NA       NA       NA
## 120  LBY       NA       NA       NA       NA       NA       NA       NA
## 121  LIE       NA       NA       NA       NA       NA       NA       NA
## 122  LTU       NA       NA 99.81560       NA       NA       NA       NA
## 123  LUX       NA       NA       NA       NA       NA       NA       NA
## 124  MKD       NA       NA       NA       NA       NA 97.80000       NA
## 125  MDG 64.48091       NA       NA 71.57262       NA       NA       NA
## 126  MYS       NA 93.11789       NA       NA       NA       NA       NA
## 127  MWI       NA 61.30972       NA       NA       NA 65.14537 62.14354
## 128  MDV       NA       NA       NA       NA       NA 98.61012       NA
## 129  MLI       NA 31.09975 33.56094       NA       NA       NA 33.06889
## 130  MLT       NA       NA 93.30736       NA       NA       NA       NA
## 131  MNP       NA       NA       NA       NA       NA       NA       NA
## 132  MAR 56.08367       NA 67.08416 69.42539       NA       NA       NA
## 133  MUS       NA       NA 89.24984 91.76601 91.49003 92.47476 92.70760
## 134  MRT       NA       NA       NA       NA       NA       NA       NA
## 135  MEX 93.44188 93.06894 93.51998 94.22840 93.96285 94.55588 94.47228
## 136  FSM       NA       NA       NA       NA       NA       NA       NA
## 137  MCO       NA       NA       NA       NA       NA       NA       NA
## 138  MNG       NA 98.25700       NA       NA       NA       NA       NA
## 139  MNE       NA       NA 98.44221       NA       NA       NA       NA
## 140  MOZ 50.58381       NA       NA       NA       NA       NA 56.03900
## 141  MMR       NA       NA       NA       NA       NA       NA       NA
## 142  NAM       NA       NA 88.27463       NA       NA       NA       NA
## 143  NRU       NA       NA       NA       NA       NA       NA       NA
## 144  NPL       NA       NA 59.62725       NA       NA       NA       NA
## 145  NIC       NA       NA       NA 81.14315       NA       NA 82.61455
## 146  NER       NA       NA       NA 30.56039       NA       NA       NA
## 147  NGA       NA       NA       NA       NA       NA       NA       NA
## 148  NOR       NA       NA       NA       NA       NA       NA       NA
## 149  NCL       NA       NA       NA       NA       NA 97.80000       NA
## 150  NZL       NA       NA       NA       NA       NA       NA       NA
## 151  OMN       NA 86.93900       NA       NA       NA 91.98120 93.03861
## 152  NLD       NA       NA       NA       NA 98.70000       NA       NA
## 153  PAK 54.89264 55.37519 54.73802 56.76434 55.59499 56.97715       NA
## 154  PLW       NA       NA       NA       NA 99.50313       NA 96.59374
## 155  PAN       NA 94.09412       NA       NA       NA       NA       NA
## 156  PNG       NA 61.60000       NA       NA       NA       NA       NA
## 157  PRY 93.75424 93.87092       NA 94.19747 95.05904 95.03481 95.55484
## 158  PER       NA       NA       NA 93.84173       NA 93.70795 94.16234
## 159  PYF       NA       NA       NA       NA       NA       NA       NA
## 160  POL       NA       NA       NA       NA 94.60000 95.30000       NA
## 161  PRT       NA       NA 94.47705       NA       NA       NA       NA
## 162  PRI       NA 91.96523       NA       NA       NA       NA       NA
## 163  QAT 94.72429       NA       NA       NA 90.63299 91.32722       NA
## 164  MAC       NA       NA 95.64004       NA       NA       NA       NA
## 165  GBR       NA       NA       NA       NA       NA       NA       NA
## 166  SYR       NA       NA       NA       NA       NA       NA       NA
## 167  CAF       NA 36.75261       NA       NA       NA       NA       NA
## 168  CZE       NA       NA       NA       NA       NA       NA       NA
## 169  MDA       NA       NA       NA 99.13831       NA 99.35989       NA
## 170  LAO       NA       NA 58.28794       NA       NA       NA 84.66104
## 171  DOM       NA 89.53873 90.10638 90.15518 90.85815 91.76376 91.99121
## 172  SVK       NA       NA       NA       NA       NA       NA       NA
## 173  PSE 94.59917 94.93201 95.26724 95.90622 96.28490 96.42839 96.69073
## 174  ROU       NA       NA 98.60429       NA       NA       NA       NA
## 175  RWA       NA 65.85227       NA 68.33103       NA 70.80413       NA
## 176  KNA       NA       NA       NA       NA       NA       NA       NA
## 177  WSM       NA       NA 98.97326       NA       NA       NA       NA
## 178  ASM       NA       NA       NA       NA       NA       NA       NA
## 179  SMR       NA       NA       NA       NA       NA       NA       NA
## 180  VCT       NA       NA       NA       NA       NA       NA       NA
## 181  LCA       NA       NA       NA       NA       NA       NA       NA
## 182  STP       NA       NA       NA 90.14310       NA       NA       NA
## 183  SEN 49.69513       NA 52.05196       NA 42.81750       NA       NA
## 184  SRB       NA       NA 97.96241       NA       NA       NA       NA
## 185  SYC       NA 93.95423       NA       NA       NA       NA       NA
## 186  SLE       NA       NA 31.80000 32.20000 32.42617       NA       NA
## 187  SGP       NA 95.85733 96.18608 96.36979 96.54808 96.71666 96.82549
## 188  SXM       NA       NA       NA       NA       NA       NA       NA
## 189  SOM       NA       NA       NA       NA       NA       NA       NA
## 190  LKA       NA 91.18136       NA       NA       NA       NA       NA
## 191  ZAF 92.89486 92.87732 93.10214 93.72947       NA 94.13990 94.36792
## 192  SDN       NA       NA       NA       NA       NA       NA       NA
## 193  SSD       NA       NA       NA       NA       NA       NA       NA
## 194  SWE       NA       NA       NA       NA       NA       NA       NA
## 195  CHE       NA       NA       NA 98.70000       NA       NA       NA
## 196  SUR       NA 94.67575       NA 92.86866       NA       NA       NA
## 197  THA       NA 96.43091       NA       NA 93.70207       NA 92.86831
## 198  TZA       NA 67.80070       NA 78.10059       NA       NA 77.88723
## 199  TJK       NA       NA       NA       NA       NA 99.80000       NA
## 200  TLS       NA 58.30898       NA       NA       NA       NA       NA
## 201  TGO 57.09338       NA 60.40994       NA       NA       NA 63.74562
## 202  TON       NA       NA 99.38553       NA       NA       NA       NA
## 203  TTO       NA 98.70000       NA       NA       NA       NA       NA
## 204  TUN       NA 79.13058 79.65391 80.21875       NA 79.03643       NA
## 205  TKM       NA       NA       NA       NA       NA 99.70000       NA
## 206  TUR 90.81672 92.66060 94.10609 94.91975 95.25666 95.43963 95.60142
## 207  TUV       NA       NA       NA       NA       NA       NA       NA
## 208  UKR       NA       NA       NA 99.97435       NA       NA       NA
## 209  UGA       NA 73.21188       NA 70.19822       NA       NA       NA
## 210  URY 98.26723 98.07271 98.33590 98.39594 98.36387 98.43593 98.52387
## 211  UZB       NA       NA       NA       NA 99.99486 99.98055 99.98383
## 212  VUT       NA       NA       NA       NA       NA 84.70000       NA
## 213  VEN 95.51199       NA 94.77022       NA       NA       NA 96.60522
## 214  VNM 93.52045       NA       NA       NA       NA       NA       NA
## 215  YEM       NA       NA       NA       NA       NA       NA       NA
## 216  ZMB       NA 83.00767       NA       NA       NA       NA       NA
## 217  ZWE       NA       NA 83.58271       NA       NA 88.69342       NA
##        2016F    2017F    2018F 2019F
## 1         NA       NA 43.01972    NA
## 2         NA       NA 98.14115    NA
## 3         NA       NA       NA    NA
## 4         NA       NA       NA    NA
## 5         NA       NA       NA    NA
## 6         NA       NA       NA    NA
## 7         NA 95.32863       NA    NA
## 8         NA       NA 81.40784    NA
## 9   99.12501       NA 99.00387    NA
## 10        NA 99.73607       NA    NA
## 11        NA       NA 97.80742    NA
## 12        NA       NA       NA    NA
## 13        NA       NA       NA    NA
## 14  99.79006 99.79123       NA    NA
## 15        NA       NA       NA    NA
## 16  97.06668 97.40389 97.46419    NA
## 17  72.75872 72.89297 73.91220    NA
## 18        NA       NA       NA    NA
## 19        NA       NA 99.75656    NA
## 20        NA       NA       NA    NA
## 21        NA       NA       NA    NA
## 22        NA       NA 42.36240    NA
## 23        NA       NA       NA    NA
## 24        NA 66.56115       NA    NA
## 25  92.50000 92.60000 93.10000    NA
## 26        NA       NA       NA    NA
## 27        NA       NA       NA    NA
## 28  92.80844 93.07582 93.22750    NA
## 29        NA       NA 97.21411    NA
## 30        NA       NA       NA    NA
## 31        NA       NA 41.22445    NA
## 32        NA 68.37533       NA    NA
## 33        NA       NA       NA    NA
## 34        NA       NA       NA    NA
## 35        NA       NA 77.07104    NA
## 36        NA       NA       NA    NA
## 37  22.31155       NA       NA    NA
## 38        NA 96.40228       NA    NA
## 39        NA       NA 96.84089    NA
## 40        NA       NA       NA    NA
## 41  94.65385       NA 95.09251    NA
## 42        NA       NA 58.81702    NA
## 43        NA       NA 80.29876    NA
## 44  77.04268       NA       NA    NA
## 45        NA       NA       NA    NA
## 46        NA       NA       NA    NA
## 47        NA       NA 97.86379    NA
## 48        NA       NA 47.16535    NA
## 49        NA       NA       NA    NA
## 50        NA       NA       NA    NA
## 51        NA       NA       NA    NA
## 52        NA       NA       NA    NA
## 53        NA       NA       NA    NA
## 54        NA       NA       NA    NA
## 55  94.35023 92.82979       NA    NA
## 56        NA 71.16825       NA    NA
## 57  88.14177 88.48271 89.00860    NA
## 58        NA       NA       NA    NA
## 59        NA       NA 76.57052    NA
## 60        NA       NA       NA    NA
## 61  98.25051       NA 98.43650    NA
## 62        NA       NA       NA    NA
## 63        NA       NA       NA    NA
## 64        NA       NA 88.41938    NA
## 65        NA 51.77118       NA    NA
## 66        NA       NA 99.73006    NA
## 67        NA 99.08211       NA    NA
## 68        NA       NA       NA    NA
## 69        NA       NA       NA    NA
## 70        NA       NA       NA    NA
## 71        NA       NA 84.66716    NA
## 72        NA       NA       NA    NA
## 73        NA 99.36426       NA    NA
## 74        NA       NA 79.03964    NA
## 75        NA       NA       NA    NA
## 76        NA       NA       NA    NA
## 77        NA       NA 97.93595    NA
## 78        NA       NA       NA    NA
## 79        NA       NA       NA    NA
## 80        NA       NA       NA    NA
## 81        NA       NA       NA    NA
## 82        NA       NA       NA    NA
## 83        NA       NA       NA    NA
## 84        NA       NA       NA    NA
## 85  61.69135       NA       NA    NA
## 86  88.98748       NA 87.20524    NA
## 87        NA       NA       NA    NA
## 88        NA       NA       NA    NA
## 89        NA       NA 74.37299    NA
## 90  95.37697       NA 95.65856    NA
## 91  85.54425       NA       NA    NA
## 92  83.30000 85.60000       NA    NA
## 93        NA       NA       NA    NA
## 94        NA       NA       NA    NA
## 95        NA       NA       NA    NA
## 96        NA       NA       NA    NA
## 97        NA       NA       NA    NA
## 98        NA       NA       NA    NA
## 99        NA       NA       NA    NA
## 100       NA       NA       NA    NA
## 101       NA       NA       NA    NA
## 102       NA       NA       NA    NA
## 103       NA       NA       NA    NA
## 104       NA       NA       NA    NA
## 105       NA       NA       NA    NA
## 106       NA       NA 99.15576    NA
## 107       NA       NA       NA    NA
## 108       NA       NA       NA    NA
## 109       NA       NA 98.22711    NA
## 110       NA       NA 99.78163    NA
## 111       NA       NA 81.53497    NA
## 112       NA       NA 99.58600    NA
## 113       NA       NA       NA    NA
## 114       NA       NA       NA    NA
## 115       NA 96.03595 96.05647    NA
## 116       NA       NA       NA    NA
## 117       NA       NA 99.88931    NA
## 118       NA       NA 95.06944    NA
## 119       NA 48.30136       NA    NA
## 120       NA       NA       NA    NA
## 121       NA       NA       NA    NA
## 122       NA       NA       NA    NA
## 123       NA       NA       NA    NA
## 124       NA       NA       NA    NA
## 125       NA       NA 74.80432    NA
## 126 93.73470 95.08265 94.85441    NA
## 127       NA       NA       NA    NA
## 128 97.73495       NA       NA    NA
## 129       NA       NA 35.47377    NA
## 130       NA       NA 94.50319    NA
## 131       NA       NA       NA    NA
## 132       NA       NA 73.75001    NA
## 133 93.15784       NA 91.32539    NA
## 134       NA 53.49759       NA    NA
## 135 94.85962 94.97278 95.37991    NA
## 136       NA       NA       NA    NA
## 137       NA       NA       NA    NA
## 138       NA       NA 98.42312    NA
## 139       NA       NA 98.84718    NA
## 140       NA 60.65543       NA    NA
## 141 75.55120       NA       NA    NA
## 142       NA       NA 91.52727    NA
## 143       NA       NA       NA    NA
## 144       NA       NA 67.90843    NA
## 145       NA       NA       NA    NA
## 146       NA       NA       NA    NA
## 147       NA       NA 62.01601    NA
## 148       NA       NA       NA    NA
## 149       NA       NA       NA    NA
## 150       NA       NA       NA    NA
## 151 94.89999 95.57600 95.65153    NA
## 152       NA       NA       NA    NA
## 153       NA 59.13205       NA    NA
## 154       NA       NA       NA    NA
## 155       NA       NA 95.41181    NA
## 156       NA       NA       NA    NA
## 157 94.65024       NA 94.02080    NA
## 158 94.17367 94.14961 94.40827    NA
## 159       NA       NA       NA    NA
## 160       NA       NA       NA    NA
## 161       NA       NA 96.13759    NA
## 162       NA 92.39000       NA    NA
## 163 93.14530 93.46397       NA    NA
## 164 96.53849       NA       NA    NA
## 165       NA       NA       NA    NA
## 166       NA       NA       NA    NA
## 167       NA       NA 37.39582    NA
## 168       NA       NA       NA    NA
## 169       NA       NA       NA    NA
## 170       NA       NA       NA    NA
## 171 93.77846       NA       NA    NA
## 172       NA       NA       NA    NA
## 173 96.93023       NA 97.21861    NA
## 174       NA       NA 98.84450    NA
## 175       NA       NA 73.21559    NA
## 176       NA       NA       NA    NA
## 177       NA       NA 99.09577    NA
## 178       NA       NA       NA    NA
## 179       NA       NA 99.91643    NA
## 180       NA       NA       NA    NA
## 181       NA       NA       NA    NA
## 182       NA       NA 92.81664    NA
## 183       NA 51.90042       NA    NA
## 184 98.84151       NA       NA    NA
## 185       NA       NA 95.86771    NA
## 186       NA       NA 43.20633    NA
## 187 97.04959 97.20225 97.34486    NA
## 188       NA       NA       NA    NA
## 189       NA       NA       NA    NA
## 190 92.38690 91.89575 91.70982    NA
## 191       NA 87.04667       NA    NA
## 192       NA       NA 60.69718    NA
## 193       NA       NA 34.52276    NA
## 194       NA       NA       NA    NA
## 195       NA       NA       NA    NA
## 196       NA       NA 94.38327    NA
## 197       NA       NA 93.76776    NA
## 198       NA       NA       NA    NA
## 199       NA       NA       NA    NA
## 200       NA       NA 68.06683    NA
## 201       NA       NA       NA    NA
## 202       NA       NA 99.41437    NA
## 203       NA       NA       NA    NA
## 204       NA       NA       NA    NA
## 205       NA       NA       NA    NA
## 206 96.16733 96.15053 96.20000    NA
## 207       NA       NA       NA    NA
## 208       NA       NA       NA    NA
## 209       NA       NA 76.52750    NA
## 210 98.56147 98.61572 98.70386    NA
## 211 99.98657       NA 99.99289    NA
## 212       NA       NA 87.50631    NA
## 213 97.12709       NA       NA    NA
## 214       NA       NA 95.00038    NA
## 215       NA       NA       NA    NA
## 216       NA       NA 86.74796    NA
## 217       NA       NA       NA    NA
#Verificar qué columna tiene mas NA's

sum(is.na(DataAlfa$"2009F"))
## [1] 183
sum(is.na(DataAlfa$"2010F"))
## [1] 166
sum(is.na(DataAlfa$"2011F"))
## [1] 157
sum(is.na(DataAlfa$"2012F"))
## [1] 166
sum(is.na(DataAlfa$"2013F"))
## [1] 176
sum(is.na(DataAlfa$"2014F"))
## [1] 158
sum(is.na(DataAlfa$"2015F"))
## [1] 174
sum(is.na(DataAlfa$"2016F"))
## [1] 181
sum(is.na(DataAlfa$"2017F"))
## [1] 183
sum(is.na(DataAlfa$"2018F"))
## [1] 137
#Promedio de variables

DataAlfa$'Promedio Alfabetización 2009-2019'=rowMeans(DataAlfa[,c(2:12)], na.rm = TRUE)
DataAlfa$`Promedio Alfabetización 2009-2019`=gsub("NaN", NA, DataAlfa$`Promedio Alfabetización 2009-2019`)
DataAlfa[,c(2:12)]=NULL
#Borramos NA
DataAlfa=na.omit(DataAlfa)
DataAlfa$`Promedio Alfabetización 2009-2019`=as.numeric(DataAlfa$`Promedio Alfabetización 2009-2019`)
#Redondeamos
DataAlfa$`Promedio Alfabetización 2009-2019`=round(DataAlfa$`Promedio Alfabetización 2009-2019`,1)
DataAlfa$Pais=trimws(DataAlfa$Pais,whitespace = "[\\h\\v]")

MERGE

'educacionmujer'=merge(DataAlfa,DataEduF,by.x = 'Pais', by.y = 'Pais')

Lo guardamos en GitHub

#Variable INDEPENDIENTE: AUTONOMÍA DE LA MUJER –> Acceso a anticonceptivos y Acceso de cuentas bancarias

ANTICONCEPTIVOS

Traemos la data del respositorio github

library(rio)
antilink="https://github.com/ALEJANDRODELAGUILA/BRECHA-DIGITAL/raw/main/promedio%20acceso%20anticonceptivos.xlsx"

anti=import(antilink)

banklink="https://github.com/ALEJANDRODELAGUILA/BRECHA-DIGITAL/raw/main/PROMEDIO%20ACCESO.xlsx"

bank=import(banklink)

La data recavada esta casi limpia, solo falta pasarla a numerica y redondear los decimales. Esto se realziara posterior al proceso del merge.

Ahora realizamos el merge:

autonomia=merge(anti,bank)

Procedemos a quitar los valores perdidos:

autonomia=na.omit(autonomia)
autonomia[,c(2:3)]=lapply(autonomia[,c(2:3)],as.numeric)

Lo subimos a GitHub

#MERGE PARA LAS DATAS FINAL

Variable dependiente Parlamentarias

github1='https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Mujeres%20Parlamentarias%20(1).csv'
parlamentarias_merge=import(github1)
parlamentarias_merge$`Porcentaje de Parlamentarias 2010-2019`=round(parlamentarias_merge$`Porcentaje de Parlamentarias 2010-2019`,1)

Variable Brecha

library(rio)
github2='https://raw.githubusercontent.com/ALEJANDRODELAGUILA/TRABAJO-ESTADISTICA/master/DATA%20AUTONOMIA.csv'

brecha_merge=import(github2)
brecha_merge=na.omit(brecha_merge)
names(brecha_merge)=c("Pais", "Promedio acceso a cuenta bancaria y servicio telefonico", "Promedio acceso anticonceptivo")
brecha_merge$`Promedio acceso a cuenta bancaria y servicio telefonico`=round(brecha_merge$`Promedio acceso a cuenta bancaria y servicio telefonico`, 1)

brecha_merge$`Promedio acceso anticonceptivo`=round(brecha_merge$`Promedio acceso anticonceptivo`, 1)

Variable Calidad de Vida

github3='https://github.com/Natalia-Aquize/Trabajo-de-Estad-stica./raw/master/datafinal.csv'
vida_merge=import(github3)

Variable Violencia

github4='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Violencia%20Final.xlsx'

violencia_merge=import(github4)
violencia_merge$`Violencia fisica y psicologica de la mujer de 15 - 49 años`=gsub("NA", NA, violencia_merge$`Violencia fisica y psicologica de la mujer de 15 - 49 años`)

violencia_merge$`Violencia Domestica`=gsub("NA", NA, violencia_merge$`Violencia Domestica`)

str(violencia_merge)
## 'data.frame':    155 obs. of  3 variables:
##  $ Pais                                                      : chr  "AFG" "AGO" "ALB" "ARG" ...
##  $ Violencia fisica y psicologica de la mujer de 15 - 49 años: chr  "46.1" "25.9" "18.100000000000001" "52.9" ...
##  $ Violencia Domestica                                       : chr  "53.1666666666667" "13.733333333333301" "8.93333333333333" "11.6" ...
violencia_merge[,-1]=lapply(violencia_merge[,-1], as.numeric)
str(violencia_merge)
## 'data.frame':    155 obs. of  3 variables:
##  $ Pais                                                      : chr  "AFG" "AGO" "ALB" "ARG" ...
##  $ Violencia fisica y psicologica de la mujer de 15 - 49 años: num  46.1 25.9 18.1 52.9 3.5 2.6 4 9.8 27.9 8 ...
##  $ Violencia Domestica                                       : num  53.17 13.73 8.93 11.6 7.63 ...
violencia_merge=na.omit(violencia_merge)
violencia_merge$`Violencia Domestica`=round(violencia_merge$`Violencia Domestica`, 1)

Variable educacion

github5='https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataEducacionMujer.csv'

educacion_merge=import(github5)
names(educacion_merge)=c("Pais", "Promedio Alfabetizacion 2009-2019", "Promedio Educacion 2009-2019")
educacion_merge$`Promedio Alfabetizacion 2009-2019`=round(educacion_merge$`Promedio Alfabetizacion 2009-2019`, 1)

Empezamos con Parlamentarias y Calidad de vida

parcal=merge(parlamentarias_merge, vida_merge, by.x = "Pais", by.y = "Pais")

Luego con Brecha

parcalbre=merge(parcal, brecha_merge, by.x = "Pais", by.y = "Pais")

Luego con Violencia

parcalbrevio=merge(parcalbre, violencia_merge, by.x="Pais", by.y = "Pais")
parcalbrevio[,-1]=lapply(parcalbrevio[,-1], as.numeric)
str(parcalbrevio)
## 'data.frame':    93 obs. of  8 variables:
##  $ Pais                                                      : chr  "AFG" "AGO" "ALB" "ARG" ...
##  $ Porcentaje de Parlamentarias 2010-2019                    : num  27.7 34.7 21.3 37.9 13.4 27 16.4 33.7 8.2 13.4 ...
##  $ Fuerza laboral femenina                                   : num  19.8 50.1 41.4 42 46.1 46.2 48.8 52 49.1 44.7 ...
##  $ Esperanza de vida de mujeres                              : num  54.4 63.4 81.9 81.1 79.2 85 76.9 68.8 63.3 64.5 ...
##  $ Promedio acceso a cuenta bancaria y servicio telefonico   : num  21.8 13.7 46 44.5 24.6 98.9 22.6 27.4 15.4 23.9 ...
##  $ Promedio acceso anticonceptivo                            : num  4.5 27.8 31.5 68.3 56 67.3 54.9 6.4 17.3 19.3 ...
##  $ Violencia fisica y psicologica de la mujer de 15 - 49 años: num  46.1 25.9 18.1 52.9 3.5 2.6 9.8 27.9 47 9.3 ...
##  $ Violencia Domestica                                       : num  53.2 13.7 8.9 11.6 7.6 3.2 29.3 39.5 22.3 40.8 ...

Finalmente con Educacion

merge_data_final=merge(parcalbrevio,educacion_merge, by.x = "Pais", by.y = "Pais")
str(merge_data_final)
## 'data.frame':    92 obs. of  10 variables:
##  $ Pais                                                      : chr  "AFG" "AGO" "ALB" "ARG" ...
##  $ Porcentaje de Parlamentarias 2010-2019                    : num  27.7 34.7 21.3 37.9 13.4 27 16.4 33.7 8.2 13.4 ...
##  $ Fuerza laboral femenina                                   : num  19.8 50.1 41.4 42 46.1 46.2 48.8 52 49.1 44.7 ...
##  $ Esperanza de vida de mujeres                              : num  54.4 63.4 81.9 81.1 79.2 85 76.9 68.8 63.3 64.5 ...
##  $ Promedio acceso a cuenta bancaria y servicio telefonico   : num  21.8 13.7 46 44.5 24.6 98.9 22.6 27.4 15.4 23.9 ...
##  $ Promedio acceso anticonceptivo                            : num  4.5 27.8 31.5 68.3 56 67.3 54.9 6.4 17.3 19.3 ...
##  $ Violencia fisica y psicologica de la mujer de 15 - 49 años: num  46.1 25.9 18.1 52.9 3.5 2.6 9.8 27.9 47 9.3 ...
##  $ Violencia Domestica                                       : num  53.2 13.7 8.9 11.6 7.6 3.2 29.3 39.5 22.3 40.8 ...
##  $ Promedio Alfabetizacion 2009-2019                         : num  37.4 66 97.4 99.1 99.7 97.8 99.8 65 37.7 37.9 ...
##  $ Promedio Educacion 2009-2019                              : num  2.9 6.8 65.4 98.1 55 ...

Una vez obtenido la data final, lo pasaremos a subir a Github para poder tener un acceso más simple para la data

#OBSERVAMOS LA DATA FINAL

library(rio)
github_final="https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Data%20Final%20Mergeada%20(1).csv"
DATAFINAL=import(github_final)
#Debido a la longitud de los nombres de las variables pasaremos a abreviarlas
names(DATAFINAL)=c("Pais","Parlamentarias","FLF","VIDA","BANK","ANTI","VIOFI","VIODO","ALFA","EDU")
head(DATAFINAL)
##   Pais Parlamentarias  FLF VIDA BANK ANTI VIOFI VIODO ALFA   EDU
## 1  AFG           27.7 19.8 54.4 21.8  4.5  46.1  53.2 37.4   2.9
## 2  AGO           34.7 50.1 63.4 13.7 27.8  25.9  13.7 66.0   6.8
## 3  ALB           21.3 41.4 81.9 46.0 31.5  18.1   8.9 97.4  65.4
## 4  ARG           37.9 42.0 81.1 44.5 68.3  52.9  11.6 99.1  98.1
## 5  ARM           13.4 46.1 79.2 24.6 56.0   3.5   7.6 99.7  55.0
## 6  AUS           27.0 46.2 85.0 98.9 67.3   2.6   3.2 97.8 139.1

#ANÁLISIS UNIVARIADO

Debemos empezar con el análisis univariado

#De esta manera, podemos observar los datos más importantes de nuestras variables
summary(DATAFINAL, na.rm=TRUE)
##      Pais           Parlamentarias       FLF             VIDA      
##  Length:92          Min.   : 3.30   Min.   :13.50   Min.   :53.00  
##  Class :character   1st Qu.:12.55   1st Qu.:40.27   1st Qu.:68.75  
##  Mode  :character   Median :19.00   Median :44.85   Median :76.35  
##                     Mean   :20.18   Mean   :41.65   Mean   :74.23  
##                     3rd Qu.:26.48   3rd Qu.:47.85   3rd Qu.:80.05  
##                     Max.   :42.60   Max.   :55.90   Max.   :89.50  
##       BANK            ANTI           VIOFI            VIODO       
##  Min.   : 4.90   Min.   : 4.50   Min.   : 2.000   Min.   : 0.700  
##  1st Qu.:23.57   1st Qu.:35.00   1st Qu.: 8.375   1st Qu.: 6.825  
##  Median :38.15   Median :55.45   Median :14.050   Median :15.950  
##  Mean   :46.35   Mean   :51.58   Mean   :19.435   Mean   :20.546  
##  3rd Qu.:70.05   3rd Qu.:68.08   3rd Qu.:26.400   3rd Qu.:30.850  
##  Max.   :99.80   Max.   :85.50   Max.   :83.100   Max.   :79.600  
##       ALFA             EDU        
##  Min.   : 24.20   Min.   :  0.60  
##  1st Qu.: 71.72   1st Qu.:  7.65  
##  Median : 92.90   Median : 36.55  
##  Mean   : 83.02   Mean   : 39.88  
##  3rd Qu.: 98.40   3rd Qu.: 65.50  
##  Max.   :100.00   Max.   :139.10

Desviación estandar para todas las variables

#desviacion estandar:
sd(DATAFINAL$Parlamentarias,na.rm = TRUE)
## [1] 9.977362
sd(DATAFINAL$FLF,na.rm = TRUE)
## [1] 9.333144
sd(DATAFINAL$VIDA,na.rm = TRUE)
## [1] 8.052171
sd(DATAFINAL$BANK,na.rm = TRUE)
## [1] 26.98959
sd(DATAFINAL$VIOFI,na.rm = TRUE)
## [1] 15.51055
sd(DATAFINAL$VIODO,na.rm = TRUE)
## [1] 17.20985
sd(DATAFINAL$ALFA,na.rm = TRUE)
## [1] 19.42325
sd(DATAFINAL$EDU,na.rm = TRUE)
## [1] 33.27135

Varianza de todas las variables

#varianza:
var(DATAFINAL$Parlamentarias,na.rm = TRUE)
## [1] 99.54774
var(DATAFINAL$FLF,na.rm = TRUE)
## [1] 87.10758
var(DATAFINAL$VIDA,na.rm = TRUE)
## [1] 64.83746
var(DATAFINAL$BANK,na.rm = TRUE)
## [1] 728.4381
var(DATAFINAL$VIOFI,na.rm = TRUE)
## [1] 240.5772
var(DATAFINAL$VIODO,na.rm = TRUE)
## [1] 296.1788
var(DATAFINAL$ALFA,na.rm = TRUE)
## [1] 377.2625
var(DATAFINAL$EDU,na.rm = TRUE)
## [1] 1106.983

#ANÁLISIS BIVARIADO

Prueba de normalidad

#Empezamos con la prueba de normalidad

library(ggplot2) #para hacer graficos
library(Hmisc)   #para correlacion
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
## 
## Attaching package: 'Hmisc'
## The following object is masked from 'package:psych':
## 
##     describe
## The following objects are masked from 'package:plyr':
## 
##     is.discrete, summarize
## The following objects are masked from 'package:dplyr':
## 
##     src, summarize
## The following objects are masked from 'package:base':
## 
##     format.pval, units
library(nortest) #para normalidad Kolmogorov-Smirnov (Más de 50 casos)

lillie.test(DATAFINAL$Parlamentarias)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$Parlamentarias
## D = 0.093272, p-value = 0.0467
lillie.test(DATAFINAL$FLF)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$FLF
## D = 0.20041, p-value = 8.797e-10
lillie.test(DATAFINAL$VIDA)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$VIDA
## D = 0.12183, p-value = 0.00181
lillie.test(DATAFINAL$BANK)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$BANK
## D = 0.13845, p-value = 0.0001659
lillie.test(DATAFINAL$ANTI)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$ANTI
## D = 0.11071, p-value = 0.007305
lillie.test(DATAFINAL$VIOFI)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$VIOFI
## D = 0.15253, p-value = 1.643e-05
lillie.test(DATAFINAL$VIODO)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$VIODO
## D = 0.15492, p-value = 1.08e-05
lillie.test(DATAFINAL$ALFA)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$ALFA
## D = 0.2284, p-value = 6.822e-13
lillie.test(DATAFINAL$EDU)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  DATAFINAL$EDU
## D = 0.15003, p-value = 2.525e-05

Observamos que todas las variables son, por lo que se realizará la prueba de correlación de Pearson

#Correlación de Pearson -> Parlamentarias - Fuerza Laboral Femenina
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$FLF, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$FLF
## t = 2.589, df = 90, p-value = 0.01123
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.06178809 0.44414164
## sample estimates:
##       cor 
## 0.2632737
#Correlación de Pearson -> Parlamentarias - Esperanza de Vida
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$VIDA, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$VIDA
## t = 1.281, df = 90, p-value = 0.2035
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.07300516  0.32959716
## sample estimates:
##       cor 
## 0.1338131
#Correlación de Pearson -> Parlamentarias - Acceso a Cuentas Bancarias
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$BANK, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$BANK
## t = 1.3445, df = 90, p-value = 0.1822
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.06640141  0.33549928
## sample estimates:
##       cor 
## 0.1403244
#Correlación de Pearson -> Parlamentarias - Acceso Anticonceptivos
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$ANTI, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$ANTI
## t = 3.1448, df = 90, p-value = 0.002253
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1173982 0.4880166
## sample estimates:
##       cor 
## 0.3146498
#Correlación de Pearson -> Parlamentarias - Violencia Física
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$VIOFI, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$VIOFI
## t = -0.66265, df = 90, p-value = 0.5093
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.2706342  0.1370948
## sample estimates:
##         cor 
## -0.06967917
#Correlación de Pearson -> Parlamentarias - Violencia Doméstica
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$VIODO, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$VIODO
## t = -1.3911, df = 90, p-value = 0.1676
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.33980024  0.06156689
## sample estimates:
##      cor 
## -0.14508
#Correlación de Pearson -> Parlamentarias - Alfabetización
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$ALFA, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$ALFA
## t = 1.4422, df = 90, p-value = 0.1527
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.0562557  0.3445060
## sample estimates:
##       cor 
## 0.1502934
#Correlación de Pearson -> Parlamentarias - Educación
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$EDU, method = c("pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DATAFINAL$Parlamentarias and DATAFINAL$EDU
## t = 1.8179, df = 90, p-value = 0.07241
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.01728521  0.37842884
## sample estimates:
##       cor 
## 0.1881985

Gráfico de dispersión de puntos

#Gráfico de dispersión de puntos: Parlamentarias - Fuerza Laboral Femenina

plot(DATAFINAL$FLF, DATAFINAL$Parlamentarias, xlab="Fuerza Laboral Femenina", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Esperanza de Vida de la Mujer

plot(DATAFINAL$VIDA, DATAFINAL$Parlamentarias, xlab="Esperanza de Vida de la Mujer", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Acceso a Cuentas Bancarias

plot(DATAFINAL$BANK, DATAFINAL$Parlamentarias, xlab="Acceso a Cuentas Bancarias", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Acceso a Anticonceptivos

plot(DATAFINAL$ANTI, DATAFINAL$Parlamentarias, xlab="Acceso a Anticonceptivos", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Violencia Doméstica

plot(DATAFINAL$VIODO, DATAFINAL$Parlamentarias, xlab="Violencia Domestica", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Violencia Física

plot(DATAFINAL$VIOFI, DATAFINAL$Parlamentarias, xlab="Violencia Física y Psicológica de la mujer", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Alfabetización

plot(DATAFINAL$ALFA, DATAFINAL$Parlamentarias, xlab="Alfabetización", ylab="Porcentaje de Parlamentarias")

#Gráfico de dispersión de puntos: Parlamentarias - Educación

plot(DATAFINAL$EDU, DATAFINAL$Parlamentarias, xlab="Educación", ylab="Porcentaje de Parlamentarias")

#CLUSTERIZACIÓN Debemos observar primero cuál es la mejor forma de clusterizar: -Para ello, veremos el estadístico GAP y las siluetas.

inputDATAFINAL=DATAFINAL[,c(2:10)] #Realizamos un subset para trabajar tranquilamente con la DATAFINAL
g.dist =daisy(inputDATAFINAL, metric="gower")
#Número de clusters recomendados para partición

fviz_nbclust(inputDATAFINAL, pam,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F)

Clusters recomendados para partición = 4

#Clusters recomendados para Jerarquico
fviz_nbclust(inputDATAFINAL, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F)

Clusters recomendados para jerárquico= 4

res.pam = pam(g.dist,4,cluster.only = F)
res.agnes = hcut(g.dist, k = 4,hc_func='agnes',hc_method = "ward.D")
res.diana = hcut(g.dist, k = 4,hc_func='diana')
#Gráfico para Partición (Siluetas)
fviz_silhouette(res.pam)
##   cluster size ave.sil.width
## 1       1   15          0.29
## 2       2   25          0.05
## 3       3   26          0.17
## 4       4   26          0.27

#Gráfico para Aglomerativo
fviz_silhouette(res.agnes)
##   cluster size ave.sil.width
## 1       1   30          0.28
## 2       2   28          0.12
## 3       3   23          0.38
## 4       4   11          0.14

#Gráfico para Divisivo
fviz_silhouette(res.diana)
##   cluster size ave.sil.width
## 1       1    7          0.13
## 2       2   33          0.29
## 3       3   46          0.37
## 4       4    6          0.18

Observamos entonces que por el width, debemos escoger la clusterización jerárquica divisiva, además de que tiene menos cantidad de siluetas negativas

#Agregamos la clusterización al subset
inputDATAFINAL$clustdiana=res.diana$cluster
inputDATAFINAL$Pais=DATAFINAL$Pais #Para observar por países

De esta manera, podemos observar que los clusters están ordenados de esta manerea: 3, 4 , 2 y 1 –> Siendo 3 los países donde se encuentran la mayor cantidad de parlamentarias mujeres y 1 los países con menor cantidad de parlamentarias.

#ANÁLISIS FACTORIAL EXPLORATORIO

#Pasaremos a realizar el Análisis Factorial Exploratorio dado que es una data lista para usar

#Empezando primero hallando la matriz de correlación

dontselect=c("Pais", "Parlamentarias")
select=setdiff(names(DATAFINAL),dontselect) 
theData=DATAFINAL[,select] #Sin los países ni la variable dependiente
# esta es:
library(polycor)
## 
## Attaching package: 'polycor'
## The following object is masked from 'package:psych':
## 
##     polyserial
corMatrix=polycor::hetcor(theData)$correlations
#Pasamos a observar las correlaciones significativas con el gráfico
library(ggcorrplot)
ggcorrplot(corMatrix,
          p.mat = cor_pmat(corMatrix),
          insig = "blank")

Para una operacionalización mejor, convertiremos esas variables inversamente proporcionales a directamente proporcionales. Para ello, debemos realizar lo siguiente:

#Cambiamos el sentido a la data 
theData$VIOFI=theData$VIOFI - 100
theData$VIOFI=theData$VIOFI * -1

theData$VIODO=theData$VIODO - 100
theData$VIODO=theData$VIODO * -1
#Volvemos a operacionalizar 

library(polycor)
corMatrix=polycor::hetcor(theData)$correlations

ggcorrplot(corMatrix,
          p.mat = cor_pmat(corMatrix),
          insig = "blank")

Observamos a primera vista que existen datos que se correlacionan. Paso 2: Diagnóstico de nuestra matríz de correlaciones

#Primero, verificar si datos permiten factorizar:

library(psych)
psych::KMO(corMatrix) 
## Kaiser-Meyer-Olkin factor adequacy
## Call: psych::KMO(r = corMatrix)
## Overall MSA =  0.85
## MSA for each item = 
##   FLF  VIDA  BANK  ANTI VIOFI VIODO  ALFA   EDU 
##  0.48  0.83  0.87  0.92  0.77  0.84  0.85  0.88

Resultado de KMO: Observamos que el KMO es de 0.85, por lo que podemos indicar que los datos sí se pueden factorizar

#Realizamos el test de Bartlett para verificar si es una matriz de identidad 
cortest.bartlett(corMatrix,n=nrow(theData))$p.value>0.05
## [1] FALSE
#Además, realizamos el test de Singular Square Matrix para verificar si es una matriz singular

library(matrixcalc)

is.singular.matrix(corMatrix)
## [1] FALSE

Aquí podemos comprobar que no existen problemas para operacionalizar la data, así que no hay nada por reportar y seguimos con el EFA

Paso 3: Identificamos el número recomendado de factores y solicitamos el EFA

#Determinamos en cuantas variables latentes podemos redimensionar nuestra data:
fa.parallel(theData,fm = 'ML', fa = 'fa')

## Parallel analysis suggests that the number of factors =  2  and the number of components =  NA

El número sugerido para redimensionar nuestras variables es 2

#Pasamos a solicitar el número de factores

library(GPArotation)
resfa <- fa(theData,nfactors = 2,cor = 'mixed',rotate = "varimax",fm="minres")


print(resfa$loadings,cutoff = 0.5) #Observamos directamente el resultado mejorado
## 
## Loadings:
##       MR1    MR2   
## FLF           0.512
## VIDA   0.914       
## BANK   0.655       
## ANTI   0.770       
## VIOFI         0.689
## VIODO         0.543
## ALFA   0.833       
## EDU    0.842       
## 
##                  MR1   MR2
## SS loadings    3.577 1.173
## Proportion Var 0.447 0.147
## Cumulative Var 0.447 0.594

En este pequeño gráfico se puede observar que la distribución de las nuevas latentes sería: MR1 : VIDA, BANK, ANTI, ALFA, EDU (5)

MR2: FLF, VIOFI, VIODO (3)

#Veamoslo en un gráfico

fa.diagram(resfa)

Paso 4: Evaluando los resultados obtenidos

#¿La Raíz del error cuadrático medio corregida está cerca a cero?
resfa$crms
## [1] 0.06173478

Vemos que sí, el resultado es 0.06 el cual es un valor cercano a 0. Esto indica un buen ajuste

#¿La Raíz del error cuadrático medio de aproximación es menor a 0.05?

resfa$RMSEA
##      RMSEA      lower      upper confidence 
## 0.10354444 0.04284476 0.16321243 0.90000000

El valor obtenido en RMSEA es 1, por lo que debemos reportar este valor. Esto indicaría que no existe un buen ajuste, además de una insuficiencia de validez

#¿El índice de Tucker-Lewis es mayor a 0.9?

resfa$TLI
## [1] 0.9217458

Debido a que el valor es mayor a 0.9 es importante indicar que el modelo tiene un buen ajuste.

#¿Qué variables aportaron mas a los factores?
sort(resfa$communality)
##       FLF      BANK     VIODO     VIOFI      ANTI      ALFA       EDU      VIDA 
## 0.2654277 0.4773675 0.5259596 0.5566852 0.6242040 0.7017952 0.7625156 0.8360326

Debemos mencionar los 3 valores que más aportan a los factores El primero es VIDA con 0.84, le sigue EDU con 0.76 y finalmente ALFA con 0.70

#¿Qué variables contribuyen a mas de un factor?
sort(resfa$complexity)
##     VIDA      FLF     ALFA     ANTI      EDU     BANK    VIOFI    VIODO 
## 1.000017 1.021180 1.024616 1.105275 1.150484 1.220877 1.336727 1.970984

Podemos observar eque no existe ni una variable que contribuya a más de un factor, sin embargo se debe mencionar que VIODO está cercano a formar parte de ambos factores, pero no logra serlo

#REGRESIÓN LINEAL MÚLTIPLE

#Redistribuímos las nuevas latentes describiendo el modelo de regresión lineal --> Con los resultados formamos una nueva Data

DATAFINALFA=cbind(DATAFINAL[2],as.data.frame(resfa$scores))

names(DATAFINALFA)=c("Parlamentarias", "Brecha", "Integridad") #le cambiamos los nombres

De esta manera, MR1 sería, Brecha Sociocultural y MR2 sería Integridad de la Mujer

#Presentamos el modelo de regresión lineal

modelo1=formula(Parlamentarias~Brecha+Integridad)
library(stargazer)
reg1=lm(modelo1,data=DATAFINALFA)
stargazer(reg1,type = "text",intercept.bottom = FALSE)
## 
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                           Parlamentarias       
## -----------------------------------------------
## Constant                     20.180***         
##                               (1.023)          
##                                                
## Brecha                        1.903*           
##                               (1.074)          
##                                                
## Integridad                     1.589           
##                               (1.260)          
##                                                
## -----------------------------------------------
## Observations                    92             
## R2                             0.054           
## Adjusted R2                    0.033           
## Residual Std. Error       9.812 (df = 89)      
## F Statistic             2.544* (df = 2; 89)    
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

Pruebas Post hoc

#No multicolinealidad
library(car)
vif(reg1)
##     Brecha Integridad 
##   1.005507   1.005507
#LINEALIDAD
#Gráfico
plot(reg1, 1)

Normalidad de residuos

residuos=reg1$residuals
ks.test(residuos, pnorm, mean(residuos), sd(residuos))
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  residuos
## D = 0.079894, p-value = 0.5721
## alternative hypothesis: two-sided

Homocedasticidad

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(reg1)
## 
##  studentized Breusch-Pagan test
## 
## data:  reg1
## BP = 0.28808, df = 2, p-value = 0.8659

No autocorrelación de residuos

library(lmtest)
dwtest(Parlamentarias~Brecha+Integridad, alternative="greater", data=DATAFINALFA)
## Warning in dwtest(Parlamentarias ~ Brecha + Integridad, alternative =
## "greater", : exact p value cannot be computed (not in [0,1]), approximate p
## value will be used
## 
##  Durbin-Watson test
## 
## data:  Parlamentarias ~ Brecha + Integridad
## DW = 2.048, p-value = 0.5832
## alternative hypothesis: true autocorrelation is greater than 0

Valores Influyentes

checkreg1=as.data.frame(influence.measures(reg1)$is.inf)

checkreg1[checkreg1$cook.d | checkreg1$hat,]
##    dfb.1_ dfb.Brch dfb.Intg dffit cov.r cook.d  hat
## 26  FALSE    FALSE    FALSE FALSE  TRUE  FALSE TRUE
## 42  FALSE    FALSE    FALSE  TRUE  TRUE  FALSE TRUE
## 55  FALSE    FALSE    FALSE FALSE  TRUE  FALSE TRUE
#Valores influyentes: Argelia, Iraq y Sri Lanka
plot(reg1, 5)

Pasa 5 de 6 pruebas Post Hoc

Debido a que vemos que existe una significancia en el valor MR1, es necesario observar cuales de las variables que conforman esta latente son significantes, para tener un resultado más preciso

#REGRESIÓN LINEAL 2

modelo2=formula(Parlamentarias~VIDA+BANK+ANTI+ALFA+EDU+FLF+VIOFI+VIODO)
library(stargazer)
reg2=lm(modelo2,data=DATAFINAL)
stargazer(reg2,type = "text",intercept.bottom = FALSE)
## 
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                           Parlamentarias       
## -----------------------------------------------
## Constant                      -0.799           
##                              (16.922)          
##                                                
## VIDA                           0.028           
##                               (0.240)          
##                                                
## BANK                          -0.051           
##                               (0.053)          
##                                                
## ANTI                         0.203***          
##                               (0.074)          
##                                                
## ALFA                          -0.071           
##                               (0.090)          
##                                                
## EDU                            0.037           
##                               (0.056)          
##                                                
## FLF                          0.321***          
##                               (0.121)          
##                                                
## VIOFI                          0.080           
##                               (0.081)          
##                                                
## VIODO                          0.011           
##                               (0.079)          
##                                                
## -----------------------------------------------
## Observations                    92             
## R2                             0.187           
## Adjusted R2                    0.109           
## Residual Std. Error       9.418 (df = 83)      
## F Statistic            2.391** (df = 8; 83)    
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

Si bien la variable FLF también es significante, debemos entender que la variable MR2 donde está incluída esta variable no lo es, por lo que no se tomará en cuenta.

Mientras, en la latente MR1, se observa que la úniac significante es la variable ANTI. El R2 Ajustado observado es de 0.109, por lo que este modelo explica 10.9%.