#Abrimos las liberias
library(rio)
library(sp)
library(geojsonio)
##
## Attaching package: 'geojsonio'
## The following object is masked from 'package:base':
##
## pretty
library(htmltab)
library(rgdal)
## rgdal: version: 1.5-16, (SVN revision 1050)
## Geospatial Data Abstraction Library extensions to R successfully loaded
## Loaded GDAL runtime: GDAL 2.2.2, released 2017/09/15
## Path to GDAL shared files: /usr/share/gdal/2.2
## GDAL binary built with GEOS: TRUE
## Loaded PROJ runtime: Rel. 4.9.2, 08 September 2015, [PJ_VERSION: 492]
## Path to PROJ shared files: (autodetected)
## Linking to sp version:1.4-2
library(jsonlite)
##
## Attaching package: 'jsonlite'
## The following object is masked from 'package:geojsonio':
##
## validate
library(carData)
library(car)
library(stringr)
library(magrittr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
##
## recode
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(cluster)
library(plyr)
## ------------------------------------------------------------------------------
## You have loaded plyr after dplyr - this is likely to cause problems.
## If you need functions from both plyr and dplyr, please load plyr first, then dplyr:
## library(plyr); library(dplyr)
## ------------------------------------------------------------------------------
##
## Attaching package: 'plyr'
## The following objects are masked from 'package:dplyr':
##
## arrange, count, desc, failwith, id, mutate, rename, summarise,
## summarize
library(psych)
##
## Attaching package: 'psych'
## The following object is masked from 'package:car':
##
## logit
library(knitr)
library(kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
library(factoextra) #visualización de clusters
## Loading required package: ggplot2
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggrepel) #para que las etiquetas de los graficos no se superpongan
library(htmltab)
library(dplyr)
library(factoextra)
library(stargazer)
##
## Please cite as:
## Hlavac, Marek (2018). stargazer: Well-Formatted Regression and Summary Statistics Tables.
## R package version 5.2.2. https://CRAN.R-project.org/package=stargazer
#Data DEPENDIENTE: MUJERES PARLAMENTARIAS Esta data representa nuestra variable dependiente, en donde observaremos cuantas mujeres participan en política con cargos parlamentarios por país. Hemos tomado un rango de años del 2009 al 2019 para observar más detalladamente las variables independientes¨
library(rio)
parlamentariaslink='https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Mujeres%20pol%C3%ADticas%20en%20el%20parlamento.xls'
parlamentarias=import(parlamentariaslink)
head(parlamentarias)
## Country Name Country Code
## 1 Aruba ABW
## 2 Afganistán AFG
## 3 Angola AGO
## 4 Albania ALB
## 5 Andorra AND
## 6 El mundo árabe ARB
## Indicator Name
## 1 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 2 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 3 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 4 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 5 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 6 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## Indicator Code 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971
## 1 SG.GEN.PARL.ZS NA NA NA NA NA NA NA NA NA NA NA NA
## 2 SG.GEN.PARL.ZS NA NA NA NA NA NA NA NA NA NA NA NA
## 3 SG.GEN.PARL.ZS NA NA NA NA NA NA NA NA NA NA NA NA
## 4 SG.GEN.PARL.ZS NA NA NA NA NA NA NA NA NA NA NA NA
## 5 SG.GEN.PARL.ZS NA NA NA NA NA NA NA NA NA NA NA NA
## 6 SG.GEN.PARL.ZS NA NA NA NA NA NA NA NA NA NA NA NA
## 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986
## 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
## 1 NA NA NA NA NA NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA NA NA NA 9.545455 15.454545
## 4 NA NA NA NA NA NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA NA NA NA 7.142857 7.142857
## 6 NA NA NA NA NA NA NA NA NA NA 3.747161 3.457447
## 1999 2000 2001 2002 2003 2004 2005
## 1 NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA 27.309237
## 3 15.454545 15.454545 15.454545 15.454545 15.454545 15.000000 15.000000
## 4 5.161290 5.161290 5.714286 5.714286 5.714286 6.428571 7.142857
## 5 7.142857 7.142857 14.285714 14.285714 14.285714 14.285714 28.571429
## 6 3.616776 3.770681 4.621265 6.130932 6.048110 6.693043 7.036766
## 2006 2007 2008 2009 2010 2011 2012 2013
## 1 NA NA NA NA NA NA NA NA
## 2 27.309237 27.685950 27.685950 27.309237 27.71084 27.71084 27.71084 27.71084
## 3 15.000000 15.000000 37.272727 38.636364 38.63636 38.18182 34.09091 34.09091
## 4 7.142857 7.142857 7.142857 16.428571 16.42857 15.71429 15.71429 17.85714
## 5 28.571429 28.571429 25.000000 35.714286 35.71429 50.00000 50.00000 50.00000
## 6 9.349593 9.753765 9.801578 9.902309 11.91967 11.32850 14.87204 17.36931
## 2014 2015 2016 2017 2018 2019
## 1 NA NA NA NA NA NA
## 2 27.71084 27.71084 27.71084 27.71084 NA 27.86885
## 3 36.81818 36.81818 36.81818 30.45455 30.45455 30.00000
## 4 20.00000 20.71429 22.85714 27.85714 27.85714 29.50820
## 5 50.00000 39.28571 32.14286 32.14286 32.14286 46.42857
## 6 17.79340 18.77984 19.27561 18.88402 19.06077 17.56654
parlamentarias[,c(4:53)]=NULL
head(parlamentarias)
## Country Name Country Code
## 1 Aruba ABW
## 2 Afganistán AFG
## 3 Angola AGO
## 4 Albania ALB
## 5 Andorra AND
## 6 El mundo árabe ARB
## Indicator Name
## 1 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 2 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 3 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 4 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 5 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 6 Proporción de escaños ocupados por mujeres en los parlamentos nacionales (%)
## 2009 2010 2011 2012 2013 2014 2015 2016
## 1 NA NA NA NA NA NA NA NA
## 2 27.309237 27.71084 27.71084 27.71084 27.71084 27.71084 27.71084 27.71084
## 3 38.636364 38.63636 38.18182 34.09091 34.09091 36.81818 36.81818 36.81818
## 4 16.428571 16.42857 15.71429 15.71429 17.85714 20.00000 20.71429 22.85714
## 5 35.714286 35.71429 50.00000 50.00000 50.00000 50.00000 39.28571 32.14286
## 6 9.902309 11.91967 11.32850 14.87204 17.36931 17.79340 18.77984 19.27561
## 2017 2018 2019
## 1 NA NA NA
## 2 27.71084 NA 27.86885
## 3 30.45455 30.45455 30.00000
## 4 27.85714 27.85714 29.50820
## 5 32.14286 32.14286 46.42857
## 6 18.88402 19.06077 17.56654
parlamentarias[,c(1,3)]=NULL
head(parlamentarias)
## Country Code 2009 2010 2011 2012 2013 2014 2015
## 1 ABW NA NA NA NA NA NA NA
## 2 AFG 27.309237 27.71084 27.71084 27.71084 27.71084 27.71084 27.71084
## 3 AGO 38.636364 38.63636 38.18182 34.09091 34.09091 36.81818 36.81818
## 4 ALB 16.428571 16.42857 15.71429 15.71429 17.85714 20.00000 20.71429
## 5 AND 35.714286 35.71429 50.00000 50.00000 50.00000 50.00000 39.28571
## 6 ARB 9.902309 11.91967 11.32850 14.87204 17.36931 17.79340 18.77984
## 2016 2017 2018 2019
## 1 NA NA NA NA
## 2 27.71084 27.71084 NA 27.86885
## 3 36.81818 30.45455 30.45455 30.00000
## 4 22.85714 27.85714 27.85714 29.50820
## 5 32.14286 32.14286 32.14286 46.42857
## 6 19.27561 18.88402 19.06077 17.56654
parlamentarias[,c(2,6,7,8,11,13,14)]=NULL
library(dplyr)
parlamentarias$'Porcentaje de Parlamentarias 2010-2019'= rowMeans (parlamentarias[ ,2:7])
parlamentarias[,c(2:7)]=NULL
parlamentarias=na.omit(parlamentarias)
names(parlamentarias)=c("Pais", "Porcentaje de Parlamentarias 2010-2019")
Lo guardamos en GitHub
#Variable INDEPENDIENTE: VIOLENCIA CONTRA LA MUJER –> Violencia Doméstica y Violencia Física y Psicológica de la mujer entre 15 y 45 años
Violencia Doméstica
Sexual Abuse
sexual_link='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Sexual%20Abuse.xls'
sexual=import(sexual_link)
sexual$'Mujeres golpeadas por negarse a tener sexo'= rowMeans(sexual[,4:23], na.rm = T)
sexual[,c(3:23)]=NULL
sexual$`Mujeres golpeadas por negarse a tener sexo`=as.numeric(sexual$`Mujeres golpeadas por negarse a tener sexo`)
str(sexual)
## 'data.frame': 264 obs. of 3 variables:
## $ Country Name : chr "Aruba" "Afghanistan" "Angola" "Albania" ...
## $ Country Code : chr "ABW" "AFG" "AGO" "ALB" ...
## $ Mujeres golpeadas por negarse a tener sexo: num NaN 33.4 11.5 6.17 NaN ...
sexual$`Mujeres golpeadas por negarse a tener sexo`= gsub('NaN', NA, sexual$`Mujeres golpeadas por negarse a tener sexo`)
sexual=na.omit(sexual)
sexual[,c(1)]=NULL
Argue abuse
arguelink='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Argue%20Abuse.xls'
argue=import(arguelink)
argue$'Mujeres golpeadas por discutir'= rowMeans(argue[,5:24], na.rm = T)
argue[,c(4:24)]=NULL
argue[,c(1,3,4)]=NULL
argue$`Mujeres golpeadas por discutir`=gsub('NaN', NA, argue$`Mujeres golpeadas por discutir`)
argue=na.omit(argue)
Goes without telling him
goes_link='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Goes%20without%20telling%20him%20abuse.xls'
goes=import(goes_link)
goes$'Mujeres golpeadas por salir sin avisar'= rowMeans(goes[4:24], na.rm = T)
goes[,c(1,3:24)]=NULL
goes$`Mujeres golpeadas por salir sin avisar`=gsub('NaN', NA, goes$`Mujeres golpeadas por salir sin avisar`)
goes=na.omit(goes)
Merge de Violencia Doméstica
sexual$`Country Code`=trimws(sexual$`Country Code`,whitespace = "[\\h\\v]")
argue$`Country Code`=trimws(argue$`Country Code`,whitespace = "[\\h\\v]")
goes$`Country Code`=trimws(goes$`Country Code`,whitespace = "[\\h\\v]")
sexualargue=merge(sexual,argue, all.x = T, all.y = T)
violencia_domestica=merge(sexualargue, goes, all.x = T, all.y = T)
violencia_domestica[,-1]=lapply(violencia_domestica[,-1], as.numeric)
str(violencia_domestica)
## 'data.frame': 83 obs. of 4 variables:
## $ Country Code : chr "AFG" "AGO" "ALB" "ARM" ...
## $ Mujeres golpeadas por negarse a tener sexo: num 33.4 11.5 6.17 3.05 14.2 ...
## $ Mujeres golpeadas por discutir : num 59.2 15.2 7.53 10.22 31.3 ...
## $ Mujeres golpeadas por salir sin avisar : num 66.9 14.5 13.1 9.62 42.5 ...
names(violencia_domestica)=c("Pais", "Mujeres golpeadas por negarse a tener sexo", "Mujeres golpeadas por discutir con su pareja", "Mujeres golpeadas por salir sin avisar a su pareja")
violencia_domestica$'Violencia Domestica'=rowMeans(violencia_domestica[2:4], na.rm = T)
violencia_domestica[,c(2:4)]=NULL
Violencia Psicológica
library(rio)
violencialink='https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Violencia%20psicologica%20y%20fisica%20contra%20la%20mujer.csv'
violencia=import(violencialink)
## Warning in fread(dec = ".", input = structure("/tmp/Rtmp9PRd1a/
## file2f857ed77f2.csv", class = c("rio_csv", : Found and resolved improper quoting
## in first 100 rows. If the fields are not quoted (e.g. field separator does not
## appear within any field), try quote="" to avoid this warning.
library(stringr)
violencia$Pais=str_split(violencia$`Country, ""Age Group"` , ',', simplify=T)[,1]
violencia$Edad= str_split (violencia$`Country, ""Age Group"` , ',', simplify=T)[,2]
violencia[,c(1)]=NULL
names(violencia)
## [1] "\"Year\""
## [2] "\"Proportion of ever-partnered women and girls aged 15-49 years subjected to physical and/or sexual violence by a current or former intimate partner in the previous 12 months\"\""
## [3] "Pais"
## [4] "Edad"
violencia$Year=violencia$"\"Year\""
violencia$'Proporcion de violencia psicologica y fisica contra la mujer'=violencia$"\"Proportion of ever-partnered women and girls aged 15-49 years subjected to physical and/or sexual violence by a current or former intimate partner in the previous 12 months\"\""
violencia[,c(1,2)]=NULL
violencia$Edad=str_extract_all(violencia$Edad,
"\\d+\\-*\\d*")
violencia$Year=str_extract_all(violencia$Year,
"\\d+\\-*\\d*")
library(readr)
violencia$`Proporcion de violencia psicologica y fisica contra la mujer` = parse_number(violencia$`Proporcion de violencia psicologica y fisica contra la mujer`)
str(violencia)
## 'data.frame': 558 obs. of 4 variables:
## $ Pais : chr "AFG" "AFG" "AFG" "AFG" ...
## $ Edad :List of 558
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "18-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "18-49"
## ..$ : chr "15-49"
## ..$ : chr "18-49"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-29"
## ..$ : chr "30-39"
## ..$ : chr "15-49"
## ..$ : chr "40-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## ..$ : chr "25-29"
## ..$ : chr "30-34"
## ..$ : chr "35-39"
## ..$ : chr "40-44"
## ..$ : chr "15-49"
## ..$ : chr "45-49"
## ..$ : chr "15-19"
## ..$ : chr "20-24"
## .. [list output truncated]
## $ Year :List of 558
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2012"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2012"
## ..$ : chr "2016"
## ..$ : chr "2012"
## ..$ : chr "2010"
## ..$ : chr "2010"
## ..$ : chr "2010"
## ..$ : chr "2010"
## ..$ : chr "2010"
## ..$ : chr "2010"
## ..$ : chr "2010"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2016-2017"
## ..$ : chr "2005"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2012"
## ..$ : chr "2012"
## .. [list output truncated]
## $ Proporcion de violencia psicologica y fisica contra la mujer: num 28.7 41.1 48.6 49.3 49.1 45.2 46.1 51.9 24.3 32.9 ...
Nos quedamos con el rango de edad de 15 a 49 años
violencia=violencia[-c(1:6),]
violencia=violencia[-c(2),]
violencia=violencia[-c(2:7,9),]
violencia=violencia[-c(3:8,10,12:17,19,20:25,27),]
violencia=violencia[-c(10:14,16,17:22,24,26:31,33,34:39),]
violencia=violencia[-c(15:18,20:26,28:34,36:42,44:50,52:58),]
violencia=violencia[-c(21,25:30,32,34:39,41,43:48,50:56),]
#fila 159
violencia=violencia[-c(30:34,36,38:43,45:50,52,55:60,62:68,70,72:77,79),]
#fila 208
violencia=violencia[-c(41:46,48:54,56:62,64,66:71,73,76:81,83:89,91:97,99,101:106),]
#fila 275
violencia=violencia[-c(53:59,61,63:68,70,73:78,80:86,88:94,96,98:102,104,106:110,112:118),]
#fila 342
violencia=violencia[-c(66:70,72:78,80:86,88:94,96,98:103,105:111,113:119,121,124:129,131:137,139),]
#fila 418
violencia=violencia[-c(80:85,87,89:93,95,97:102,104:110,112:118,120,126:131,133:139,141:147,149:154),]
#fila 494
violencia=violencia[-c(96:101,103:106,108,110:115,117:123,125,127:132,134,137:141,143:149,151:157,159),]
#toda la data
Borramos la columna y cambiamos de nombre
violencia[,c(2)]=NULL
str(violencia)
## 'data.frame': 107 obs. of 3 variables:
## $ Pais : chr "AFG" "AGO" "ARM" "AUT" ...
## $ Year :List of 107
## ..$ : chr "2015"
## ..$ : chr "2015-2016"
## ..$ : chr "2015-2016"
## ..$ : chr "2012"
## ..$ : chr "2006"
## ..$ : chr "2015"
## ..$ : chr "2012"
## ..$ : chr "2016"
## ..$ : chr "2012"
## ..$ : chr "2010"
## ..$ : chr "2016-2017"
## ..$ : chr "2005"
## ..$ : chr "2014"
## ..$ : chr "2014"
## ..$ : chr "2006"
## ..$ : chr "2015"
## ..$ : chr "2015"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2014"
## ..$ : chr "2012"
## ..$ : chr "2013"
## ..$ : chr "2011"
## ..$ : chr "2014"
## ..$ : chr "2013-2014"
## ..$ : chr "2011"
## ..$ : chr "2012"
## ..$ : chr "2016"
## ..$ : chr "2010-2011"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2013"
## ..$ : chr "2012"
## ..$ : chr "2008"
## ..$ : chr "2012"
## ..$ : chr "2014-2015"
## ..$ : chr "2016-2017"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2015-2016"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2016"
## ..$ : chr "2012"
## ..$ : chr "2014"
## ..$ : chr "2008"
## ..$ : chr "2012"
## ..$ : chr "2014"
## ..$ : chr "2012"
## ..$ : chr "2007"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2015-2016"
## ..$ : chr "2006"
## ..$ : chr "2006"
## ..$ : chr "2012"
## ..$ : chr "2014"
## ..$ : chr "2016"
## ..$ : chr "2014"
## ..$ : chr "2017"
## ..$ : chr "2015"
## ..$ : chr "2015-2016"
## ..$ : chr "2013"
## ..$ : chr "2016"
## ..$ : chr "2012"
## ..$ : chr "2011-2012"
## ..$ : chr "2013"
## ..$ : chr "2013"
## ..$ : chr "2009"
## ..$ : chr "2008"
## ..$ : chr "2016"
## ..$ : chr "2017"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2005"
## ..$ : chr "2012"
## ..$ : chr "2015"
## ..$ : chr "2000"
## ..$ : chr "2009"
## ..$ : chr "2017"
## ..$ : chr "2013"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2008"
## ..$ : chr "2012"
## ..$ : chr "2012"
## ..$ : chr "2017"
## ..$ : chr "2016"
## ..$ : chr "2014"
## ..$ : chr "2009"
## ..$ : chr "2017"
## ..$ : chr "2014"
## ..$ : chr "2007"
## ..$ : chr "2016"
## .. [list output truncated]
## $ Proporcion de violencia psicologica y fisica contra la mujer: num 46.1 25.9 3.5 4 9.8 28.8 8 27.1 9 9.3 ...
#Eliminamos el año
violencia[,c(2)]=NULL
names(violencia)=c("Pais","Violencia contra la mujer 15-49 años")
violencia$Pais=trimws(violencia$Pais,whitespace = "[\\h\\v]")
str(violencia)
## 'data.frame': 107 obs. of 2 variables:
## $ Pais : chr "AFG" "AGO" "ARM" "AUT" ...
## $ Violencia contra la mujer 15-49 años: num 46.1 25.9 3.5 4 9.8 28.8 8 27.1 9 9.3 ...
Merge de data violencia
mergeviolencia=merge(violencia, violencia_domestica, all.x=TRUE, all.y=TRUE)
Lo subimos a GitHub
#VARIABLE INDEPENDIENTE: Calidad de vida de la mujer –> Fuerza Laboral Femenina y Esperanza de vida de las mujeres
Fuerza labora Femenina
library(rio)
fuerzalink= "https://github.com/Natalia-Aquize/Trabajo-de-Estad-stica./raw/master/Data_Extract_From_World_Development_Indicators-2.xlsx"
fuerza=import(fuerzalink)
Limpieza
fuerza$`Series Name`=NULL
fuerza$`Series Code`=NULL
fuerza$`Country Name`=NULL
names(fuerza)= c("Country","Fuerza laboral femenina")
fuerza$`Fuerza laboral femenina`=as.numeric(fuerza$`Fuerza laboral femenina`)
## Warning: NAs introduced by coercion
fuerza$`Fuerza laboral femenina`=round(fuerza$`Fuerza laboral femenina`, 1)
fuerza= na.omit(fuerza)
Esperanza de vida de la mujer
esperanzalink= "https://github.com/Natalia-Aquize/Trabajo-de-Estad-stica./raw/master/Esperanza%20de%20vida.xlsx"
esperanza= import(esperanzalink)
esperanza$`GDP - per capita (PPP)`= NULL
esperanza= na.omit(esperanza)
MERGE
names(esperanza)= c("Pais", "Esperanza de vida de mujeres")
names(fuerza)= c("Pais", "Fuerza laboral femenina")
calidad=merge(fuerza,esperanza,all.x=T,all.y=T)
head(calidad)
## Pais Fuerza laboral femenina Esperanza de vida de mujeres
## 1 ABW NA 80.7
## 2 AFG 19.8 54.4
## 3 AGO 50.1 63.4
## 4 AIA NA 84.5
## 5 ALB 41.4 81.9
## 6 AND NA 85.4
calidad=na.omit(calidad)
#Variable INDEPENDIENTE: Brecha Educacional –> Alfabetización y Educación
library(rio)
linkEdu1 = "https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataEducacionSuperiorFem%20Sucia.xlsx"
DataEduF = import(linkEdu1)
linkEdu2 = "https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataEducacionSuperiorM%20Sucia.xlsx"
DataEduM = import(linkEdu2)
Limpieza Base de Datos Femenina
#Borrando columnas
DataEduF$`Series Name` =NULL
DataEduF$`Series Code` =NULL
DataEduF$`Country Name`=NULL
#Cambiando el nombre de las columnas
names(DataEduF) = c("Pais", "2009F", "2010F", "2011F", "2012F", "2013F", "2014F", "2015F", "2016F", "2017F", "2018F", "2019F" )
#Eliminando filas vacías
DataEduF <- DataEduF[-c(218:222), ]
str(DataEduF)
## 'data.frame': 217 obs. of 12 variables:
## $ Pais : chr "AFG" "ALB" "DEU" "AND" ...
## $ 2009F: chr "1.4121300000000001" "38.669890000000002" ".." ".." ...
## $ 2010F: chr ".." "51.571089999999998" ".." ".." ...
## $ 2011F: chr "1.82724" "58.230139999999999" ".." ".." ...
## $ 2012F: chr ".." "69.719620000000006" ".." ".." ...
## $ 2013F: chr ".." "76.316509999999994" "59.433990000000001" ".." ...
## $ 2014F: chr "3.4870199999999998" "78.319590000000005" "63.942869999999999" ".." ...
## $ 2015F: chr ".." "73.530119999999997" "67.043909999999997" ".." ...
## $ 2016F: chr ".." "70.076769999999996" "69.462860000000006" ".." ...
## $ 2017F: chr ".." "69.810360000000003" "70.706890000000001" ".." ...
## $ 2018F: chr "4.9050799999999999" "67.578609999999998" ".." ".." ...
## $ 2019F: chr ".." ".." ".." ".." ...
#Convirtiendo a numérica
DataEduF[2:12]=lapply(DataEduF[2:12], as.numeric)
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataEduF[2:12], as.numeric): NAs introduced by coercion
#Verificando valores perdidos
DataEduF[!complete.cases(DataEduF),]
## Pais 2009F 2010F 2011F 2012F 2013F 2014F 2015F
## 1 AFG 1.41213 NA 1.82724 NA NA 3.48702 NA
## 2 ALB 38.66989 51.57109 58.23014 69.71962 76.31651 78.31959 73.53012
## 3 DEU NA NA NA NA 59.43399 63.94287 67.04391
## 4 AND NA NA NA NA NA NA NA
## 5 AGO NA NA 3.32261 NA 7.84724 NA 7.40054
## 6 ATG 20.71307 24.15147 20.26235 34.28886 NA NA NA
## 7 SAU 35.50794 39.29681 42.21555 47.03119 51.31625 58.07670 61.44342
## 8 DZA 35.32708 35.42107 37.07264 38.56113 40.87643 41.85668 45.04758
## 9 ARG 84.18764 87.82828 92.92044 94.67601 96.55508 100.30122 104.51591
## 10 ARM 56.61935 58.03413 57.70820 49.85343 48.49313 50.08286 50.51742
## 11 ABW 41.73998 43.93540 46.84075 45.58515 22.57240 23.03694 21.37302
## 12 AUS NA NA NA NA NA NA 140.95175
## 13 AUT NA NA NA NA 86.94741 86.27942 88.00541
## 14 AZE 18.93108 19.15638 19.80818 20.92553 22.62382 24.75323 27.48078
## 15 BHS NA NA NA NA NA NA NA
## 16 BHR NA NA 57.50120 60.93734 57.90605 57.54474 59.30616
## 17 BGD 8.11878 NA 11.19707 11.55667 NA 11.74298 NA
## 18 BRB 104.26209 95.81395 90.57161 NA NA NA NA
## 19 BLR 89.14320 94.59196 101.82048 107.92172 108.11110 105.10836 102.61460
## 20 BEL 72.61032 75.92278 78.31387 80.14380 81.53801 82.77246 84.66545
## 21 BLZ 27.96540 26.86474 27.30625 30.29557 30.03308 29.90883 28.67228
## 22 BEN 5.73935 7.18678 5.48830 7.14151 8.76919 8.50553 7.74509
## 23 BMU 47.19807 41.37597 43.14968 42.11310 41.94037 36.93416 35.26949
## 24 BTN 4.94325 5.51626 7.36334 7.91529 9.43436 NA NA
## 25 BOL NA NA NA NA NA 38.80000 42.10000
## 26 BIH NA NA NA 57.30000 61.50000 NA NA
## 27 BWA NA NA NA NA NA 30.01804 34.61948
## 28 BRA 42.16417 NA 49.34314 51.67467 53.86612 57.58743 58.50373
## 29 BRN 21.67991 20.37801 22.48696 28.98388 32.04040 41.09151 39.92528
## 30 BGR 62.18039 66.09698 66.97068 69.00306 72.10170 75.57675 79.11971
## 31 BFA 2.29505 2.30869 2.73884 3.00833 3.13864 3.30469 3.46127
## 32 BDI NA 2.29263 1.94214 2.47249 2.80636 2.54646 NA
## 33 CPV 17.45392 20.32140 23.87553 23.91381 27.20810 28.54298 27.45799
## 34 KHM 8.44712 10.47134 11.42138 NA NA NA 11.81066
## 35 CMR 7.97536 10.00334 10.22344 11.41226 13.33969 14.25631 15.10736
## 36 CAN 73.92633 71.82283 73.63206 73.58981 74.91763 75.26596 74.48037
## 37 TCD 0.59154 0.62069 0.85090 NA NA 1.12839 1.45916
## 38 CHL 62.75647 70.32853 75.75654 80.23166 84.24253 87.45525 89.94314
## 39 CHN 22.87581 24.95607 26.78327 30.26018 34.55895 45.75697 50.17866
## 40 CYP 48.46208 45.62976 47.29882 49.71835 53.69162 62.59883 69.39547
## 41 COL 38.52225 41.34383 45.15120 48.16623 52.15952 55.21668 57.43417
## 42 COM 4.90223 4.92626 7.03765 8.05181 8.12646 8.04879 NA
## 43 COG 2.16834 NA 6.42889 7.71339 7.99310 NA NA
## 44 COD 3.19054 NA 5.02359 5.87524 4.33428 NA NA
## 45 KOR 86.80551 86.81078 85.59628 83.19102 82.11578 81.89217 81.95525
## 46 PRK 20.57362 NA NA NA NA NA 19.95625
## 47 CRI NA NA 51.08759 53.54599 54.00439 57.89230 60.28377
## 48 CIV 5.72048 5.16145 2.72639 NA 6.23510 6.04756 6.90346
## 49 HRV 54.80814 62.11654 66.98620 70.16679 75.53334 78.29661 76.73714
## 50 CUB 143.19979 118.62490 101.22367 77.80103 62.12298 NA 42.50212
## 51 CUW NA NA NA NA 29.58909 NA NA
## 52 DNK 88.40519 87.44201 90.58639 93.11795 94.50234 95.33990 96.29026
## 53 DJI 2.99078 3.08424 4.56802 NA NA NA NA
## 54 DMA NA NA NA NA NA NA NA
## 55 ECU NA NA NA 45.33185 NA NA 48.39747
## 56 EGY 28.87459 30.01423 25.52576 26.15459 28.37723 29.29898 34.32684
## 57 SLV 26.89196 27.38869 28.30200 29.05800 29.51501 29.13171 29.36202
## 58 ARE NA NA NA NA NA NA NA
## 59 ERI 1.31449 1.78270 NA NA NA 2.54506 2.73688
## 60 SVN 103.93128 107.43621 108.85567 104.51341 101.60661 97.87918 95.95792
## 61 ESP 79.57560 84.16237 88.74741 90.69085 92.07241 93.49333 93.24180
## 62 USA NA 108.25285 109.49806 108.93757 103.11261 102.59939 102.74733
## 63 EST 85.19986 85.85200 86.85179 88.40093 89.13724 88.72938 87.47979
## 64 SWZ NA NA 7.10970 NA 6.56377 NA NA
## 65 ETH 3.28954 4.49457 4.78586 5.21049 NA 5.26314 NA
## 66 RUS 86.81824 NA 87.41099 85.22917 86.30337 85.77799 87.55020
## 67 FJI NA NA NA NA NA NA NA
## 68 PHL 31.54392 32.91117 34.13121 34.46018 37.46534 40.11325 NA
## 69 FIN 101.06711 103.07247 105.00136 101.96106 99.76842 97.26281 95.81939
## 70 FRA 59.16200 61.24571 61.97702 64.59659 66.50814 68.30630 69.71964
## 71 GAB NA NA NA 6.40000 6.70000 NA NA
## 72 GMB NA 1.61020 2.31587 2.24482 NA NA NA
## 74 GHA 6.69563 NA 8.94769 9.21102 10.81400 12.35505 12.85441
## 75 GIB NA NA NA NA NA NA NA
## 76 GRD 75.27603 NA NA NA NA NA 102.53085
## 77 GRC NA 107.34075 112.53123 117.12008 119.13316 124.95822 NA
## 78 GRL NA NA NA NA NA NA NA
## 79 GUM NA NA NA NA NA NA NA
## 80 GTM NA NA NA NA 20.03382 19.17984 23.55790
## 81 GIN 4.65416 5.24045 5.61431 5.52467 6.57626 6.99001 NA
## 82 GNQ NA NA NA NA NA NA NA
## 83 GNB NA NA NA NA NA NA NA
## 84 GUY 14.65204 16.33976 15.91532 15.38762 NA NA NA
## 85 HTI NA NA NA 3.30000 3.50000 NA NA
## 86 HND NA 20.94901 NA 22.29288 22.83794 23.06304 23.62654
## 87 HKG 55.19316 59.46156 63.46442 62.55570 70.67348 73.26067 73.97787
## 88 HUN 75.02001 73.77801 71.79922 70.02634 64.57958 58.88083 54.69771
## 89 IND 13.28658 15.05774 20.09418 NA 23.16391 25.39835 26.81881
## 90 IDN 22.34470 22.47408 24.21068 31.01600 32.72562 32.65576 35.04789
## 91 IRN 39.10785 44.10528 49.88759 56.39154 57.32222 63.75927 NA
## 92 IRQ NA NA 7.94626 8.52452 8.35641 NA NA
## 93 IRL 60.38679 65.41380 70.45540 70.17842 73.44940 75.85867 80.58055
## 94 IMN NA NA NA NA NA NA NA
## 95 MAF NA NA NA NA NA NA NA
## 96 ISL 97.54238 101.54269 102.59843 103.83879 101.78220 104.14990 98.04906
## 97 CYM NA NA NA NA NA NA NA
## 98 CHI NA NA NA NA NA NA NA
## 99 FRO NA NA NA NA NA NA NA
## 100 MHL NA NA NA 23.80952 NA NA NA
## 101 SLB NA NA NA NA NA NA NA
## 102 TCA NA NA NA NA NA NA NA
## 103 VIR NA NA NA NA NA NA NA
## 104 VGB 89.58810 NA NA NA NA NA 54.23038
## 105 ISR 71.46137 74.55251 76.01062 78.23892 77.19343 77.05110 76.33288
## 106 ITA 78.64561 77.70516 77.63033 75.69786 73.01086 72.09432 70.84647
## 107 JAM 33.14470 37.79228 36.98515 39.02760 38.24911 NA 34.69339
## 108 JPN NA NA NA NA 85.52455 86.43157 NA
## 109 JOR 43.92889 39.59065 39.07156 44.84537 NA NA 38.18288
## 110 KAZ NA 51.68813 54.27813 57.78616 56.42265 54.52119 52.09302
## 111 KEN 3.27667 NA NA NA NA NA 7.67757
## 112 KGZ 50.88197 47.75469 45.84192 49.06526 53.58782 52.03380 52.98461
## 113 KIR NA NA NA NA NA NA NA
## 114 XKX NA NA NA NA NA NA NA
## 115 KWT NA NA NA NA NA 68.93841 76.50117
## 116 LSO NA NA NA 13.63424 12.97684 12.87611 12.23677
## 117 LVA 95.32370 88.43245 84.82514 81.64253 83.75312 83.77707 91.13356
## 118 LBN NA NA NA NA NA NA NA
## 119 LBR NA 6.57833 NA 9.15192 NA NA NA
## 120 LBY NA NA NA NA NA NA NA
## 121 LIE 22.52592 27.35761 29.93513 30.07246 NA 24.14105 21.88919
## 122 LTU 107.20506 104.55157 101.42798 95.52589 88.28057 84.18322 82.67658
## 123 LUX NA 19.22441 NA 20.68606 NA NA 20.82938
## 124 MKD 42.65954 40.39520 NA 42.56701 42.24759 42.83583 45.85842
## 125 MDG 3.31752 3.50057 3.91773 3.96282 4.15512 4.61272 4.56489
## 126 MYS 40.58598 42.99131 41.41298 43.28743 45.21575 45.43081 51.66175
## 127 MWI NA 0.53521 0.63539 NA NA NA NA
## 128 MDV NA NA NA NA NA 20.05411 NA
## 129 MLI 3.47904 3.56360 3.25185 3.96207 3.76000 3.50106 3.23422
## 130 MLT 41.02061 42.94957 46.12488 49.10042 50.55391 50.68875 55.02756
## 131 MNP NA NA NA NA NA NA NA
## 132 MAR 12.82843 13.82102 15.71061 18.68467 22.11936 24.89558 27.78318
## 133 MUS 35.01564 36.91036 40.10380 44.43012 44.12455 43.20239 42.51898
## 134 MRT 2.20143 2.49808 2.76017 3.05489 3.29982 NA 3.72727
## 135 MEX 26.28900 27.25701 28.03772 29.16375 29.95729 30.83395 31.56362
## 136 FSM NA NA NA NA NA NA NA
## 137 MCO NA NA NA NA NA NA NA
## 138 MNG 62.58965 65.11734 66.50181 69.12226 72.72528 75.22428 78.85986
## 139 MNE 55.85345 58.33446 NA NA NA NA NA
## 140 MOZ 2.95838 3.66594 3.77800 4.08279 4.44917 5.13915 5.58368
## 141 MMR NA NA 16.19707 14.85785 NA NA NA
## 142 NAM NA NA NA NA NA 24.46697 25.97564
## 143 NRU NA NA NA NA NA NA NA
## 144 NPL 8.57949 11.29164 11.61579 NA 15.38884 NA 14.53834
## 145 NIC NA NA NA 36.52467 NA NA NA
## 146 NER 0.74401 0.79320 0.83970 0.88261 NA NA 2.12514
## 147 NGA NA 8.12430 8.30040 NA NA NA NA
## 148 NOR 91.17895 91.21774 90.82011 90.52381 92.30117 92.21053 92.93425
## 149 NCL NA NA NA NA NA NA NA
## 150 NZL NA NA NA NA 92.91371 92.62178 94.90342
## 151 OMN 27.41112 28.48786 33.11747 NA 40.97861 48.94705 54.19620
## 152 NLD 64.58091 67.26598 80.12400 80.35700 NA NA 86.12705
## 153 PAK 6.22182 NA 7.96285 9.18671 9.63351 9.96779 8.58921
## 154 PLW NA NA NA NA 66.40212 NA NA
## 155 PAN 52.49909 53.70443 51.42041 53.56288 NA 54.83029 57.99223
## 156 PNG NA NA NA NA NA NA NA
## 157 PRY 43.64765 40.88207 NA NA NA NA NA
## 158 PER NA NA NA NA NA NA NA
## 159 PYF NA NA NA NA NA NA NA
## 160 POL 85.73164 90.67485 91.70821 90.97769 88.36505 83.49285 81.07876
## 161 PRT 67.98629 71.16144 74.47559 74.29771 70.88008 70.28986 65.59141
## 162 PRI 102.79306 106.90958 106.28214 108.07624 108.86268 110.12694 114.48715
## 163 QAT 25.71725 26.28676 30.45212 31.26685 34.41750 40.28215 45.03147
## 164 MAC 51.69932 54.09354 58.11605 56.65824 64.68257 72.97984 80.82486
## 165 GBR 66.94900 67.52451 67.49652 67.86715 65.08417 64.50465 64.65976
## 166 SYR 23.16242 23.94380 25.75019 30.59374 32.81329 42.08946 44.76589
## 167 CAF 1.54665 1.30820 NA 1.60102 NA NA NA
## 168 CZE 71.04753 74.88850 77.27000 77.35479 76.76360 76.91578 75.68125
## 169 MDA 44.66556 43.73392 45.41286 45.70634 46.63651 47.27736 47.36551
## 170 LAO 14.45276 14.37842 14.99190 15.87804 17.71403 17.65301 17.66563
## 171 DOM NA NA NA 59.82908 NA 60.91206 66.98925
## 172 SVK 69.17988 69.61710 68.51109 68.36272 66.28194 64.27144 61.80662
## 173 PSE 52.69877 54.86599 57.79266 56.93336 55.21823 54.67535 55.63197
## 174 ROU 79.34246 74.36121 67.22347 55.85264 52.34859 52.68204 52.21331
## 175 RWA 4.57224 5.18612 5.99487 6.06047 6.52209 6.74895 6.72255
## 176 KNA NA NA NA NA NA 86.11252 115.88089
## 177 WSM NA NA NA NA NA NA NA
## 178 ASM NA NA NA NA NA NA NA
## 179 SMR NA 69.69309 68.12500 58.71122 NA NA NA
## 180 VCT NA NA NA NA NA 33.77758 29.77217
## 181 LCA 25.13349 17.82500 20.56317 13.75149 18.09859 22.26636 21.41597
## 182 STP 3.80336 4.27038 NA 7.63000 NA 9.05152 13.65164
## 183 SEN 5.80993 5.60403 7.32529 7.40009 7.60871 7.92605 8.02511
## 184 SRB 56.38332 55.62779 58.84335 61.16691 64.54011 66.01105 66.87789
## 185 SYC NA NA 4.05210 2.15641 4.55587 9.64306 20.02915
## 186 SLE NA NA NA 5.41692 5.67353 NA NA
## 187 SGP NA NA NA NA NA NA NA
## 188 SXM NA NA NA 9.69426 NA 8.32812 8.96226
## 189 SOM NA NA NA NA NA NA NA
## 190 LKA NA 20.87313 19.10599 21.02698 22.91369 21.67235 23.93362
## 191 ZAF NA NA NA 22.40702 23.38007 23.22680 NA
## 192 SDN 16.56876 17.19209 15.87546 16.66896 18.64729 17.43428 17.06071
## 193 SSD NA NA NA NA NA NA NA
## 194 SWE 87.15156 89.57827 88.07282 84.13793 77.36019 75.74329 75.63381
## 195 CHE 50.34146 52.65946 54.25391 55.48953 56.61547 57.71653 58.53498
## 196 SUR NA NA NA NA NA NA NA
## 197 THA 53.96824 56.55100 58.60076 57.67101 57.46897 57.78680 NA
## 198 TZA NA 1.94126 NA 2.80986 2.57994 NA 2.80330
## 199 TJK 15.72754 15.78600 15.23598 15.56074 16.44065 18.63707 21.33957
## 200 TLS 13.55747 14.81589 NA NA NA NA NA
## 201 TGO NA NA NA 4.55551 NA 6.14726 6.56010
## 202 TON NA NA NA NA NA NA NA
## 203 TTO NA NA NA NA NA NA NA
## 204 TUN 42.20645 43.22497 43.82184 44.00836 43.16219 44.12122 44.07345
## 205 TKM NA NA NA NA NA 6.19576 NA
## 206 TUR NA NA NA 59.63784 NA NA NA
## 207 TUV NA NA NA NA NA NA NA
## 208 UKR 92.03856 89.53580 89.28795 87.59632 87.38717 88.81466 NA
## 209 UGA 3.74244 3.48630 3.86962 3.19570 NA 4.09987 NA
## 210 URY NA NA NA NA NA NA NA
## 211 UZB 8.14687 7.58018 6.89394 5.99372 6.01359 6.17377 6.31776
## 212 VUT NA NA NA NA NA NA NA
## 213 VEN NA NA NA NA NA NA NA
## 214 VNM 20.30738 23.01379 25.27843 NA 23.95194 31.56581 29.15524
## 215 YEM NA 6.50644 6.16967 NA NA NA NA
## 216 ZMB NA NA 2.26496 3.50167 NA NA NA
## 217 ZWE NA 5.71466 5.55479 5.72372 6.09897 NA 9.17213
## 2016F 2017F 2018F 2019F
## 1 NA NA 4.90508 NA
## 2 70.07677 69.81036 67.57861 NA
## 3 69.46286 70.70689 NA NA
## 4 NA NA NA NA
## 5 8.45325 NA NA NA
## 6 NA NA NA NA
## 7 67.53541 69.34002 69.87621 NA
## 8 53.59891 57.24471 64.42081 NA
## 9 109.16721 112.79844 NA NA
## 10 57.11542 58.67676 62.64839 NA
## 11 20.69792 NA NA NA
## 12 143.02353 133.33777 NA NA
## 13 90.82589 92.46150 NA NA
## 14 28.13302 29.03385 29.69345 NA
## 15 NA NA NA NA
## 16 62.99215 64.26851 67.84063 NA
## 17 14.68115 14.91033 16.98329 NA
## 18 NA NA NA NA
## 19 99.74855 98.34385 95.09214 NA
## 20 86.02862 90.46261 NA NA
## 21 29.93244 30.48455 NA NA
## 22 7.64171 7.46639 NA NA
## 23 NA 22.46104 22.90533 NA
## 24 NA NA 15.49214 NA
## 25 NA NA NA NA
## 26 NA NA NA NA
## 27 30.35431 29.24466 NA NA
## 28 58.75485 59.44738 NA NA
## 29 40.27507 42.00012 38.71807 NA
## 30 79.28095 78.82418 NA NA
## 31 3.75034 4.09469 4.76497 NA
## 32 3.51356 3.75480 NA NA
## 33 28.93060 29.34471 28.34652 NA
## 34 NA 12.16869 12.93279 NA
## 35 11.68883 11.44435 NA NA
## 36 76.38456 79.29239 NA NA
## 37 NA NA NA NA
## 38 92.58558 94.66281 NA NA
## 39 52.74170 53.97915 55.88122 NA
## 40 73.41246 82.35413 NA NA
## 41 59.74896 60.83253 59.72434 NA
## 42 NA NA NA NA
## 43 NA 10.14620 NA NA
## 44 4.73101 NA NA NA
## 45 82.19882 82.84250 NA NA
## 46 NA NA 18.18409 NA
## 47 59.41439 62.16411 60.68018 NA
## 48 7.24935 7.63550 NA NA
## 49 77.37743 78.83716 NA NA
## 50 40.00702 50.50682 51.00784 NA
## 51 NA NA NA NA
## 52 93.95383 93.57748 NA NA
## 53 NA NA NA NA
## 54 NA NA NA NA
## 55 NA NA NA NA
## 56 34.24900 35.77688 NA NA
## 57 29.47254 30.15279 31.14780 NA
## 58 NA NA NA NA
## 59 2.78561 NA NA NA
## 60 92.14177 93.02170 NA NA
## 61 94.41169 97.02816 NA NA
## 62 102.29380 102.01133 NA NA
## 63 86.44786 84.82447 NA NA
## 64 NA NA NA NA
## 65 NA NA NA NA
## 66 87.72641 89.11636 NA NA
## 67 NA NA NA NA
## 68 NA 40.41902 NA NA
## 69 94.50517 95.74750 NA NA
## 70 71.73220 72.78425 NA NA
## 71 NA NA NA NA
## 72 NA NA NA NA
## 74 12.96393 13.42023 13.56528 NA
## 75 NA NA NA NA
## 76 107.93140 110.33797 116.22426 NA
## 77 132.72473 136.99724 NA NA
## 78 NA NA NA NA
## 79 NA NA NA NA
## 80 NA NA NA NA
## 81 NA NA NA NA
## 82 NA NA NA NA
## 83 NA NA NA NA
## 84 NA NA NA NA
## 85 NA NA NA NA
## 86 24.33926 28.12971 30.28331 NA
## 87 77.50577 78.54645 81.11762 NA
## 88 53.47320 53.91295 NA NA
## 89 27.04352 28.03872 29.06165 NA
## 90 37.69703 38.99032 38.99366 NA
## 91 64.26306 62.85649 NA NA
## 92 NA NA NA NA
## 93 81.56447 81.99678 NA NA
## 94 NA NA NA NA
## 95 NA NA NA NA
## 96 96.79791 94.42382 NA NA
## 97 NA NA NA NA
## 98 NA NA NA NA
## 99 NA NA NA NA
## 100 NA NA NA NA
## 101 NA NA NA NA
## 102 NA NA NA NA
## 103 NA NA NA NA
## 104 50.74627 NA 20.94340 NA
## 105 76.04325 74.47486 NA NA
## 106 70.65632 71.51538 NA NA
## 107 NA NA NA NA
## 108 NA NA NA NA
## 109 36.82399 33.25256 37.37089 NA
## 110 51.64216 56.12924 60.03320 68.44193
## 111 9.40628 9.73054 NA NA
## 112 50.74468 47.51968 46.73536 NA
## 113 NA NA NA NA
## 114 NA NA NA NA
## 115 81.53469 77.46966 76.13706 NA
## 116 NA 13.33513 12.39755 NA
## 117 98.10533 105.05897 NA NA
## 118 NA NA NA NA
## 119 NA NA NA NA
## 120 NA NA NA NA
## 121 24.75158 27.35507 NA NA
## 122 82.54948 84.00104 NA NA
## 123 20.63326 20.14930 NA NA
## 124 NA 48.55228 NA NA
## 125 4.62497 5.09647 5.21415 NA
## 126 50.57597 47.06639 49.85466 NA
## 127 NA NA NA NA
## 128 NA 59.77832 NA NA
## 129 2.53251 2.66183 NA NA
## 130 56.54726 63.17398 NA NA
## 131 NA NA NA NA
## 132 30.72886 33.29096 35.69778 NA
## 133 43.79940 47.45723 NA NA
## 134 3.57665 3.33115 NA NA
## 135 38.56783 40.62317 NA NA
## 136 NA NA NA NA
## 137 NA NA NA NA
## 138 74.38400 75.31888 76.65813 NA
## 139 63.88608 66.11125 64.91357 NA
## 140 6.34235 6.34179 6.53364 NA
## 141 NA NA 21.98387 NA
## 142 27.83812 30.26425 NA NA
## 143 NA NA NA NA
## 144 11.49555 11.64118 12.82445 NA
## 145 NA NA NA NA
## 146 2.50417 2.44505 2.56518 NA
## 147 NA NA NA NA
## 148 96.63700 98.72165 NA NA
## 149 NA NA NA NA
## 150 96.40853 97.17176 NA NA
## 151 59.53948 54.81871 55.55291 NA
## 152 85.34627 90.91987 NA NA
## 153 8.39577 8.67735 8.32044 NA
## 154 NA NA NA NA
## 155 58.59022 NA NA NA
## 156 NA NA NA NA
## 157 NA NA NA NA
## 158 73.55465 72.67321 NA NA
## 159 NA NA NA NA
## 160 80.97906 81.88045 NA NA
## 161 66.67509 67.69994 NA NA
## 162 116.24908 NA NA NA
## 163 48.10350 51.58690 54.86746 NA
## 164 89.56997 96.16884 104.46099 NA
## 165 67.22568 69.37931 NA NA
## 166 42.79074 NA NA NA
## 167 NA NA NA NA
## 168 74.81392 75.27370 NA NA
## 169 47.21759 46.66393 45.71871 NA
## 170 17.17160 16.04950 15.51763 NA
## 171 69.95907 77.01242 NA NA
## 172 57.94619 56.63234 NA NA
## 173 54.18773 54.22384 54.34769 NA
## 174 54.19454 55.43648 NA NA
## 175 6.70845 6.97135 6.01428 NA
## 176 NA NA NA NA
## 177 NA NA NA NA
## 178 NA NA NA NA
## 179 NA NA 35.95238 NA
## 180 NA NA NA NA
## 181 25.06278 26.50514 18.68560 NA
## 182 NA NA NA NA
## 183 8.11605 8.64482 10.30509 NA
## 184 70.86127 76.85531 78.25281 NA
## 185 24.10714 27.91195 23.30402 NA
## 186 NA NA NA NA
## 187 90.57452 91.19697 NA NA
## 188 NA NA NA NA
## 189 NA NA NA NA
## 190 22.90363 22.82258 23.44222 NA
## 191 24.47296 26.37453 NA NA
## 192 NA NA NA NA
## 193 NA NA NA NA
## 194 77.50260 82.07651 NA NA
## 195 58.63094 60.32979 NA NA
## 196 NA NA NA NA
## 197 57.76924 NA NA NA
## 198 NA NA NA NA
## 199 24.36750 26.85371 NA NA
## 200 NA NA NA NA
## 201 7.52287 8.11988 9.79750 NA
## 202 NA NA NA NA
## 203 NA NA NA NA
## 204 41.80367 41.66291 41.23498 NA
## 205 NA NA NA NA
## 206 NA NA NA NA
## 207 NA NA NA NA
## 208 NA NA NA NA
## 209 NA NA NA NA
## 210 96.65391 98.19565 NA NA
## 211 6.61392 6.90254 8.24900 NA
## 212 NA NA NA NA
## 213 NA NA NA NA
## 214 31.71716 NA NA NA
## 215 NA NA NA NA
## 216 NA NA NA NA
## 217 NA NA NA NA
#Verificar qué columna tiene mas NA's
sum(is.na(DataEduF$"2009F"))
## [1] 94
sum(is.na(DataEduF$"2010F"))
## [1] 91
sum(is.na(DataEduF$"2011F"))
## [1] 86
sum(is.na(DataEduF$"2012F"))
## [1] 81
sum(is.na(DataEduF$"2013F"))
## [1] 92
sum(is.na(DataEduF$"2014F"))
## [1] 90
sum(is.na(DataEduF$"2015F"))
## [1] 88
sum(is.na(DataEduF$"2016F"))
## [1] 94
sum(is.na(DataEduF$"2017F"))
## [1] 97
sum(is.na(DataEduF$"2018F"))
## [1] 157
#Promedio Mujeres
DataEduF$'Promedio Educación 2009-2019'=rowMeans(DataEduF[,c(2:12)], na.rm = TRUE)
DataEduF$`Promedio Educación 2009-2019`=gsub("NaN", NA, DataEduF$`Promedio Educación 2009-2019`)
DataEduF[,c(2:12)]=NULL
#Borramos NA
DataEduF=na.omit(DataEduF)
DataEduF$`Promedio Educación 2009-2019`=as.numeric(DataEduF$`Promedio Educación 2009-2019`)
#Redondeamos
DataEduF$`Promedio Educación 2009-2019`=round(DataEduF$`Promedio Educación 2009-2019`,1)
DataEduF$Pais=trimws(DataEduF$Pais,whitespace = "[\\h\\v]")
ALFABETIZACION
#2
library(rio)
linkAlfa = "https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataAlfabetizacionTotal%20Sucia.xlsx"
DataAlfa = import(linkAlfa)
Limpieza
#Borrando columnas
DataAlfa$`Series Name` =NULL
DataAlfa$`Series Code` =NULL
DataAlfa$`Country Name`=NULL
#Cambiando el nombre de las columnas
names(DataAlfa) = c("Pais", "2009F", "2010F", "2011F", "2012F", "2013F", "2014F", "2015F", "2016F", "2017F", "2018F", "2019F" )
#Eliminando filas vacías
DataAlfa <- DataAlfa[-c(218:222), ]
str(DataAlfa)
## 'data.frame': 217 obs. of 12 variables:
## $ Pais : chr "AFG" "ALB" "DEU" "AND" ...
## $ 2009F: chr ".." ".." ".." ".." ...
## $ 2010F: chr ".." ".." ".." ".." ...
## $ 2011F: chr "31.741119999999999" "96.845299999999995" ".." ".." ...
## $ 2012F: chr ".." "97.246970000000005" ".." ".." ...
## $ 2013F: chr ".." ".." ".." ".." ...
## $ 2014F: chr ".." ".." "98.1" ".." ...
## $ 2015F: chr ".." ".." ".." ".." ...
## $ 2016F: chr ".." ".." ".." ".." ...
## $ 2017F: chr ".." ".." ".." ".." ...
## $ 2018F: chr "43.01972" "98.141149999999996" ".." ".." ...
## $ 2019F: chr ".." ".." ".." ".." ...
#Convirtiendo a numérica
DataAlfa[2:12]=lapply(DataAlfa[2:12], as.numeric)
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
## Warning in lapply(DataAlfa[2:12], as.numeric): NAs introduced by coercion
#Verificando valores perdidos
DataAlfa[!complete.cases(DataAlfa),]
## Pais 2009F 2010F 2011F 2012F 2013F 2014F 2015F
## 1 AFG NA NA 31.74112 NA NA NA NA
## 2 ALB NA NA 96.84530 97.24697 NA NA NA
## 3 DEU NA NA NA NA NA 98.10000 NA
## 4 AND NA NA NA NA NA NA NA
## 5 AGO NA NA NA NA NA 66.03011 NA
## 6 ATG NA NA 98.95000 NA NA NA 98.95000
## 7 SAU NA NA NA NA 94.42634 NA NA
## 8 DZA NA NA NA NA NA NA NA
## 9 ARG 98.98342 98.95497 99.10833 99.10523 99.12195 98.99389 99.17996
## 10 ARM NA NA 99.74441 NA NA NA NA
## 11 ABW NA 96.82264 NA NA NA NA NA
## 12 AUS NA NA NA NA 97.80000 NA NA
## 13 AUT NA NA NA NA NA NA 98.90000
## 14 AZE 99.75984 99.77114 99.77863 99.77577 99.78936 99.78899 99.78806
## 15 BHS NA NA NA NA NA NA NA
## 16 BHR NA 90.97740 NA NA NA NA NA
## 17 BGD NA NA 58.76918 57.86075 61.01554 61.09330 65.13733
## 18 BRB NA NA NA NA NA 99.60000 NA
## 19 BLR 99.61706 NA NA NA NA NA NA
## 20 BEL NA NA NA NA 98.20000 NA NA
## 21 BLZ NA NA NA NA NA NA NA
## 22 BEN NA NA NA 32.94882 NA NA NA
## 23 BMU NA NA NA NA NA NA NA
## 24 BTN NA NA NA 57.03360 NA NA NA
## 25 BOL 91.16783 NA 92.22615 94.46057 93.80000 93.30000 92.45508
## 26 BIH NA NA 98.14204 NA 96.99177 NA NA
## 27 BWA NA NA NA NA 86.82318 NA NA
## 28 BRA 90.29821 90.37918 91.41124 91.33785 91.48424 91.72943 92.04790
## 29 BRN NA NA 96.08556 NA NA NA NA
## 30 BGR NA NA 98.35245 NA NA NA NA
## 31 BFA NA NA NA NA NA 34.59940 NA
## 32 BDI NA NA NA NA NA 61.56973 NA
## 33 CPV NA NA NA 85.32779 NA NA 86.79029
## 34 KHM 73.90003 NA NA NA NA 78.05509 80.52649
## 35 CMR NA 71.29051 NA NA NA NA NA
## 36 CAN NA NA NA NA NA NA NA
## 37 TCD NA NA NA NA NA NA 26.00299
## 38 CHL 98.55368 NA 96.70301 NA 96.26706 NA 96.87413
## 39 CHN NA 95.12448 NA NA NA NA NA
## 40 CYP NA NA 98.67843 NA NA NA NA
## 41 COL 93.24469 93.37233 93.58053 NA NA 94.18625 94.24505
## 42 COM NA NA NA 49.19614 NA NA NA
## 43 COG NA NA 79.31117 NA NA NA NA
## 44 COD NA NA NA 75.01719 NA NA NA
## 45 KOR NA NA NA NA 96.80000 NA NA
## 46 PRK NA NA NA NA NA NA NA
## 47 CRI NA NA 97.40658 NA NA NA NA
## 48 CIV NA NA NA 40.98163 NA 43.90842 NA
## 49 HRV NA NA 99.12536 NA NA NA NA
## 50 CUB NA NA NA 99.75253 NA NA NA
## 51 CUW NA NA NA NA NA NA NA
## 52 DNK NA NA NA NA NA NA NA
## 53 DJI NA NA NA NA NA NA NA
## 54 DMA NA NA NA NA NA NA NA
## 55 ECU 92.24976 91.85404 91.58690 92.06473 93.29463 94.22264 94.45566
## 56 EGY NA 72.04785 NA 73.86559 75.06073 NA NA
## 57 SLV 84.10289 84.49272 85.49399 NA 86.76758 NA 87.96985
## 58 ARE NA NA NA NA NA NA 93.22714
## 59 ERI NA NA NA NA NA NA NA
## 60 SVN NA NA NA NA NA 99.70000 NA
## 61 ESP 97.67927 97.74890 97.78375 97.89454 98.07913 98.09372 98.14326
## 62 USA NA NA NA NA NA 95.80000 NA
## 63 EST NA NA 99.88579 NA NA NA NA
## 64 SWZ NA 83.09829 NA NA NA NA NA
## 65 ETH NA NA NA NA NA NA NA
## 66 RUS NA 99.68427 NA NA NA NA NA
## 67 FJI NA NA NA NA NA NA NA
## 68 PHL NA NA NA NA 96.39800 NA 98.18255
## 69 FIN NA NA NA 99.80000 NA NA NA
## 70 FRA NA NA NA 94.10000 NA NA NA
## 71 GAB NA NA NA 82.28380 NA 83.10000 NA
## 72 GMB NA NA NA NA 41.95005 NA 50.77797
## 73 GEO NA NA NA NA NA 99.58619 NA
## 74 GHA NA 71.49707 NA NA NA NA NA
## 75 GIB NA NA NA NA NA NA NA
## 76 GRD NA NA NA NA NA 98.60000 NA
## 77 GRC 93.90511 NA 97.36874 NA NA NA NA
## 78 GRL NA NA NA NA NA NA NA
## 79 GUM NA NA NA NA NA NA NA
## 80 GTM NA NA NA 78.26486 77.03867 81.28590 NA
## 81 GIN NA 25.30774 NA NA NA 32.00384 NA
## 82 GNQ NA 94.37054 NA NA NA NA NA
## 83 GNB NA NA NA NA NA 45.58116 NA
## 84 GUY 84.99401 NA NA NA NA 85.63973 NA
## 85 HTI NA 53.50000 58.20000 NA NA NA NA
## 86 HND NA 84.75536 85.12330 85.35555 85.46442 87.19753 87.90683
## 87 HKG NA NA NA NA NA NA NA
## 88 HUN NA NA NA NA NA 99.10000 NA
## 89 IND NA NA 69.30256 NA NA NA NA
## 90 IDN 92.58170 NA 92.81191 NA NA 95.11622 95.21793
## 91 IRN NA NA NA 83.62599 84.62680 84.70524 NA
## 92 IRQ NA NA NA 77.20000 72.70000 82.20000 NA
## 93 IRL NA NA NA 93.20000 93.50000 NA NA
## 94 IMN NA NA NA NA NA NA NA
## 95 MAF NA NA NA NA NA NA NA
## 96 ISL NA NA NA NA NA NA NA
## 97 CYM NA NA NA NA NA NA NA
## 98 CHI NA NA NA NA NA NA NA
## 99 FRO NA NA NA NA NA NA NA
## 100 MHL NA NA 98.26508 NA NA NA NA
## 101 SLB 76.60000 NA NA NA NA NA NA
## 102 TCA NA NA NA NA NA NA NA
## 103 VIR NA NA NA NA NA NA NA
## 104 VGB NA NA NA NA NA NA NA
## 105 ISR NA NA NA NA NA NA NA
## 106 ITA NA NA 98.84828 NA NA NA NA
## 107 JAM NA NA NA NA NA 88.10000 NA
## 108 JPN NA NA NA NA NA 95.60000 NA
## 109 JOR NA 92.55104 95.90445 97.89032 NA NA NA
## 110 KAZ 99.73241 99.78163 NA NA NA NA NA
## 111 KEN NA NA NA NA NA 78.73304 NA
## 112 KGZ 99.24343 NA NA NA NA NA NA
## 113 KIR NA NA NA NA NA NA NA
## 114 XKX NA NA NA NA NA NA NA
## 115 KWT NA 94.46901 NA 95.51317 95.58582 NA 95.68545
## 116 LSO 75.80020 NA NA NA NA 76.63520 NA
## 117 LVA NA NA 99.89590 NA NA NA NA
## 118 LBN 91.18419 NA NA NA NA NA NA
## 119 LBR NA NA NA NA NA NA NA
## 120 LBY NA NA NA NA NA NA NA
## 121 LIE NA NA NA NA NA NA NA
## 122 LTU NA NA 99.81560 NA NA NA NA
## 123 LUX NA NA NA NA NA NA NA
## 124 MKD NA NA NA NA NA 97.80000 NA
## 125 MDG 64.48091 NA NA 71.57262 NA NA NA
## 126 MYS NA 93.11789 NA NA NA NA NA
## 127 MWI NA 61.30972 NA NA NA 65.14537 62.14354
## 128 MDV NA NA NA NA NA 98.61012 NA
## 129 MLI NA 31.09975 33.56094 NA NA NA 33.06889
## 130 MLT NA NA 93.30736 NA NA NA NA
## 131 MNP NA NA NA NA NA NA NA
## 132 MAR 56.08367 NA 67.08416 69.42539 NA NA NA
## 133 MUS NA NA 89.24984 91.76601 91.49003 92.47476 92.70760
## 134 MRT NA NA NA NA NA NA NA
## 135 MEX 93.44188 93.06894 93.51998 94.22840 93.96285 94.55588 94.47228
## 136 FSM NA NA NA NA NA NA NA
## 137 MCO NA NA NA NA NA NA NA
## 138 MNG NA 98.25700 NA NA NA NA NA
## 139 MNE NA NA 98.44221 NA NA NA NA
## 140 MOZ 50.58381 NA NA NA NA NA 56.03900
## 141 MMR NA NA NA NA NA NA NA
## 142 NAM NA NA 88.27463 NA NA NA NA
## 143 NRU NA NA NA NA NA NA NA
## 144 NPL NA NA 59.62725 NA NA NA NA
## 145 NIC NA NA NA 81.14315 NA NA 82.61455
## 146 NER NA NA NA 30.56039 NA NA NA
## 147 NGA NA NA NA NA NA NA NA
## 148 NOR NA NA NA NA NA NA NA
## 149 NCL NA NA NA NA NA 97.80000 NA
## 150 NZL NA NA NA NA NA NA NA
## 151 OMN NA 86.93900 NA NA NA 91.98120 93.03861
## 152 NLD NA NA NA NA 98.70000 NA NA
## 153 PAK 54.89264 55.37519 54.73802 56.76434 55.59499 56.97715 NA
## 154 PLW NA NA NA NA 99.50313 NA 96.59374
## 155 PAN NA 94.09412 NA NA NA NA NA
## 156 PNG NA 61.60000 NA NA NA NA NA
## 157 PRY 93.75424 93.87092 NA 94.19747 95.05904 95.03481 95.55484
## 158 PER NA NA NA 93.84173 NA 93.70795 94.16234
## 159 PYF NA NA NA NA NA NA NA
## 160 POL NA NA NA NA 94.60000 95.30000 NA
## 161 PRT NA NA 94.47705 NA NA NA NA
## 162 PRI NA 91.96523 NA NA NA NA NA
## 163 QAT 94.72429 NA NA NA 90.63299 91.32722 NA
## 164 MAC NA NA 95.64004 NA NA NA NA
## 165 GBR NA NA NA NA NA NA NA
## 166 SYR NA NA NA NA NA NA NA
## 167 CAF NA 36.75261 NA NA NA NA NA
## 168 CZE NA NA NA NA NA NA NA
## 169 MDA NA NA NA 99.13831 NA 99.35989 NA
## 170 LAO NA NA 58.28794 NA NA NA 84.66104
## 171 DOM NA 89.53873 90.10638 90.15518 90.85815 91.76376 91.99121
## 172 SVK NA NA NA NA NA NA NA
## 173 PSE 94.59917 94.93201 95.26724 95.90622 96.28490 96.42839 96.69073
## 174 ROU NA NA 98.60429 NA NA NA NA
## 175 RWA NA 65.85227 NA 68.33103 NA 70.80413 NA
## 176 KNA NA NA NA NA NA NA NA
## 177 WSM NA NA 98.97326 NA NA NA NA
## 178 ASM NA NA NA NA NA NA NA
## 179 SMR NA NA NA NA NA NA NA
## 180 VCT NA NA NA NA NA NA NA
## 181 LCA NA NA NA NA NA NA NA
## 182 STP NA NA NA 90.14310 NA NA NA
## 183 SEN 49.69513 NA 52.05196 NA 42.81750 NA NA
## 184 SRB NA NA 97.96241 NA NA NA NA
## 185 SYC NA 93.95423 NA NA NA NA NA
## 186 SLE NA NA 31.80000 32.20000 32.42617 NA NA
## 187 SGP NA 95.85733 96.18608 96.36979 96.54808 96.71666 96.82549
## 188 SXM NA NA NA NA NA NA NA
## 189 SOM NA NA NA NA NA NA NA
## 190 LKA NA 91.18136 NA NA NA NA NA
## 191 ZAF 92.89486 92.87732 93.10214 93.72947 NA 94.13990 94.36792
## 192 SDN NA NA NA NA NA NA NA
## 193 SSD NA NA NA NA NA NA NA
## 194 SWE NA NA NA NA NA NA NA
## 195 CHE NA NA NA 98.70000 NA NA NA
## 196 SUR NA 94.67575 NA 92.86866 NA NA NA
## 197 THA NA 96.43091 NA NA 93.70207 NA 92.86831
## 198 TZA NA 67.80070 NA 78.10059 NA NA 77.88723
## 199 TJK NA NA NA NA NA 99.80000 NA
## 200 TLS NA 58.30898 NA NA NA NA NA
## 201 TGO 57.09338 NA 60.40994 NA NA NA 63.74562
## 202 TON NA NA 99.38553 NA NA NA NA
## 203 TTO NA 98.70000 NA NA NA NA NA
## 204 TUN NA 79.13058 79.65391 80.21875 NA 79.03643 NA
## 205 TKM NA NA NA NA NA 99.70000 NA
## 206 TUR 90.81672 92.66060 94.10609 94.91975 95.25666 95.43963 95.60142
## 207 TUV NA NA NA NA NA NA NA
## 208 UKR NA NA NA 99.97435 NA NA NA
## 209 UGA NA 73.21188 NA 70.19822 NA NA NA
## 210 URY 98.26723 98.07271 98.33590 98.39594 98.36387 98.43593 98.52387
## 211 UZB NA NA NA NA 99.99486 99.98055 99.98383
## 212 VUT NA NA NA NA NA 84.70000 NA
## 213 VEN 95.51199 NA 94.77022 NA NA NA 96.60522
## 214 VNM 93.52045 NA NA NA NA NA NA
## 215 YEM NA NA NA NA NA NA NA
## 216 ZMB NA 83.00767 NA NA NA NA NA
## 217 ZWE NA NA 83.58271 NA NA 88.69342 NA
## 2016F 2017F 2018F 2019F
## 1 NA NA 43.01972 NA
## 2 NA NA 98.14115 NA
## 3 NA NA NA NA
## 4 NA NA NA NA
## 5 NA NA NA NA
## 6 NA NA NA NA
## 7 NA 95.32863 NA NA
## 8 NA NA 81.40784 NA
## 9 99.12501 NA 99.00387 NA
## 10 NA 99.73607 NA NA
## 11 NA NA 97.80742 NA
## 12 NA NA NA NA
## 13 NA NA NA NA
## 14 99.79006 99.79123 NA NA
## 15 NA NA NA NA
## 16 97.06668 97.40389 97.46419 NA
## 17 72.75872 72.89297 73.91220 NA
## 18 NA NA NA NA
## 19 NA NA 99.75656 NA
## 20 NA NA NA NA
## 21 NA NA NA NA
## 22 NA NA 42.36240 NA
## 23 NA NA NA NA
## 24 NA 66.56115 NA NA
## 25 92.50000 92.60000 93.10000 NA
## 26 NA NA NA NA
## 27 NA NA NA NA
## 28 92.80844 93.07582 93.22750 NA
## 29 NA NA 97.21411 NA
## 30 NA NA NA NA
## 31 NA NA 41.22445 NA
## 32 NA 68.37533 NA NA
## 33 NA NA NA NA
## 34 NA NA NA NA
## 35 NA NA 77.07104 NA
## 36 NA NA NA NA
## 37 22.31155 NA NA NA
## 38 NA 96.40228 NA NA
## 39 NA NA 96.84089 NA
## 40 NA NA NA NA
## 41 94.65385 NA 95.09251 NA
## 42 NA NA 58.81702 NA
## 43 NA NA 80.29876 NA
## 44 77.04268 NA NA NA
## 45 NA NA NA NA
## 46 NA NA NA NA
## 47 NA NA 97.86379 NA
## 48 NA NA 47.16535 NA
## 49 NA NA NA NA
## 50 NA NA NA NA
## 51 NA NA NA NA
## 52 NA NA NA NA
## 53 NA NA NA NA
## 54 NA NA NA NA
## 55 94.35023 92.82979 NA NA
## 56 NA 71.16825 NA NA
## 57 88.14177 88.48271 89.00860 NA
## 58 NA NA NA NA
## 59 NA NA 76.57052 NA
## 60 NA NA NA NA
## 61 98.25051 NA 98.43650 NA
## 62 NA NA NA NA
## 63 NA NA NA NA
## 64 NA NA 88.41938 NA
## 65 NA 51.77118 NA NA
## 66 NA NA 99.73006 NA
## 67 NA 99.08211 NA NA
## 68 NA NA NA NA
## 69 NA NA NA NA
## 70 NA NA NA NA
## 71 NA NA 84.66716 NA
## 72 NA NA NA NA
## 73 NA 99.36426 NA NA
## 74 NA NA 79.03964 NA
## 75 NA NA NA NA
## 76 NA NA NA NA
## 77 NA NA 97.93595 NA
## 78 NA NA NA NA
## 79 NA NA NA NA
## 80 NA NA NA NA
## 81 NA NA NA NA
## 82 NA NA NA NA
## 83 NA NA NA NA
## 84 NA NA NA NA
## 85 61.69135 NA NA NA
## 86 88.98748 NA 87.20524 NA
## 87 NA NA NA NA
## 88 NA NA NA NA
## 89 NA NA 74.37299 NA
## 90 95.37697 NA 95.65856 NA
## 91 85.54425 NA NA NA
## 92 83.30000 85.60000 NA NA
## 93 NA NA NA NA
## 94 NA NA NA NA
## 95 NA NA NA NA
## 96 NA NA NA NA
## 97 NA NA NA NA
## 98 NA NA NA NA
## 99 NA NA NA NA
## 100 NA NA NA NA
## 101 NA NA NA NA
## 102 NA NA NA NA
## 103 NA NA NA NA
## 104 NA NA NA NA
## 105 NA NA NA NA
## 106 NA NA 99.15576 NA
## 107 NA NA NA NA
## 108 NA NA NA NA
## 109 NA NA 98.22711 NA
## 110 NA NA 99.78163 NA
## 111 NA NA 81.53497 NA
## 112 NA NA 99.58600 NA
## 113 NA NA NA NA
## 114 NA NA NA NA
## 115 NA 96.03595 96.05647 NA
## 116 NA NA NA NA
## 117 NA NA 99.88931 NA
## 118 NA NA 95.06944 NA
## 119 NA 48.30136 NA NA
## 120 NA NA NA NA
## 121 NA NA NA NA
## 122 NA NA NA NA
## 123 NA NA NA NA
## 124 NA NA NA NA
## 125 NA NA 74.80432 NA
## 126 93.73470 95.08265 94.85441 NA
## 127 NA NA NA NA
## 128 97.73495 NA NA NA
## 129 NA NA 35.47377 NA
## 130 NA NA 94.50319 NA
## 131 NA NA NA NA
## 132 NA NA 73.75001 NA
## 133 93.15784 NA 91.32539 NA
## 134 NA 53.49759 NA NA
## 135 94.85962 94.97278 95.37991 NA
## 136 NA NA NA NA
## 137 NA NA NA NA
## 138 NA NA 98.42312 NA
## 139 NA NA 98.84718 NA
## 140 NA 60.65543 NA NA
## 141 75.55120 NA NA NA
## 142 NA NA 91.52727 NA
## 143 NA NA NA NA
## 144 NA NA 67.90843 NA
## 145 NA NA NA NA
## 146 NA NA NA NA
## 147 NA NA 62.01601 NA
## 148 NA NA NA NA
## 149 NA NA NA NA
## 150 NA NA NA NA
## 151 94.89999 95.57600 95.65153 NA
## 152 NA NA NA NA
## 153 NA 59.13205 NA NA
## 154 NA NA NA NA
## 155 NA NA 95.41181 NA
## 156 NA NA NA NA
## 157 94.65024 NA 94.02080 NA
## 158 94.17367 94.14961 94.40827 NA
## 159 NA NA NA NA
## 160 NA NA NA NA
## 161 NA NA 96.13759 NA
## 162 NA 92.39000 NA NA
## 163 93.14530 93.46397 NA NA
## 164 96.53849 NA NA NA
## 165 NA NA NA NA
## 166 NA NA NA NA
## 167 NA NA 37.39582 NA
## 168 NA NA NA NA
## 169 NA NA NA NA
## 170 NA NA NA NA
## 171 93.77846 NA NA NA
## 172 NA NA NA NA
## 173 96.93023 NA 97.21861 NA
## 174 NA NA 98.84450 NA
## 175 NA NA 73.21559 NA
## 176 NA NA NA NA
## 177 NA NA 99.09577 NA
## 178 NA NA NA NA
## 179 NA NA 99.91643 NA
## 180 NA NA NA NA
## 181 NA NA NA NA
## 182 NA NA 92.81664 NA
## 183 NA 51.90042 NA NA
## 184 98.84151 NA NA NA
## 185 NA NA 95.86771 NA
## 186 NA NA 43.20633 NA
## 187 97.04959 97.20225 97.34486 NA
## 188 NA NA NA NA
## 189 NA NA NA NA
## 190 92.38690 91.89575 91.70982 NA
## 191 NA 87.04667 NA NA
## 192 NA NA 60.69718 NA
## 193 NA NA 34.52276 NA
## 194 NA NA NA NA
## 195 NA NA NA NA
## 196 NA NA 94.38327 NA
## 197 NA NA 93.76776 NA
## 198 NA NA NA NA
## 199 NA NA NA NA
## 200 NA NA 68.06683 NA
## 201 NA NA NA NA
## 202 NA NA 99.41437 NA
## 203 NA NA NA NA
## 204 NA NA NA NA
## 205 NA NA NA NA
## 206 96.16733 96.15053 96.20000 NA
## 207 NA NA NA NA
## 208 NA NA NA NA
## 209 NA NA 76.52750 NA
## 210 98.56147 98.61572 98.70386 NA
## 211 99.98657 NA 99.99289 NA
## 212 NA NA 87.50631 NA
## 213 97.12709 NA NA NA
## 214 NA NA 95.00038 NA
## 215 NA NA NA NA
## 216 NA NA 86.74796 NA
## 217 NA NA NA NA
#Verificar qué columna tiene mas NA's
sum(is.na(DataAlfa$"2009F"))
## [1] 183
sum(is.na(DataAlfa$"2010F"))
## [1] 166
sum(is.na(DataAlfa$"2011F"))
## [1] 157
sum(is.na(DataAlfa$"2012F"))
## [1] 166
sum(is.na(DataAlfa$"2013F"))
## [1] 176
sum(is.na(DataAlfa$"2014F"))
## [1] 158
sum(is.na(DataAlfa$"2015F"))
## [1] 174
sum(is.na(DataAlfa$"2016F"))
## [1] 181
sum(is.na(DataAlfa$"2017F"))
## [1] 183
sum(is.na(DataAlfa$"2018F"))
## [1] 137
#Promedio de variables
DataAlfa$'Promedio Alfabetización 2009-2019'=rowMeans(DataAlfa[,c(2:12)], na.rm = TRUE)
DataAlfa$`Promedio Alfabetización 2009-2019`=gsub("NaN", NA, DataAlfa$`Promedio Alfabetización 2009-2019`)
DataAlfa[,c(2:12)]=NULL
#Borramos NA
DataAlfa=na.omit(DataAlfa)
DataAlfa$`Promedio Alfabetización 2009-2019`=as.numeric(DataAlfa$`Promedio Alfabetización 2009-2019`)
#Redondeamos
DataAlfa$`Promedio Alfabetización 2009-2019`=round(DataAlfa$`Promedio Alfabetización 2009-2019`,1)
DataAlfa$Pais=trimws(DataAlfa$Pais,whitespace = "[\\h\\v]")
MERGE
'educacionmujer'=merge(DataAlfa,DataEduF,by.x = 'Pais', by.y = 'Pais')
Lo guardamos en GitHub
#Variable INDEPENDIENTE: AUTONOMÍA DE LA MUJER –> Acceso a anticonceptivos y Acceso de cuentas bancarias
ANTICONCEPTIVOS
Traemos la data del respositorio github
library(rio)
antilink="https://github.com/ALEJANDRODELAGUILA/BRECHA-DIGITAL/raw/main/promedio%20acceso%20anticonceptivos.xlsx"
anti=import(antilink)
banklink="https://github.com/ALEJANDRODELAGUILA/BRECHA-DIGITAL/raw/main/PROMEDIO%20ACCESO.xlsx"
bank=import(banklink)
La data recavada esta casi limpia, solo falta pasarla a numerica y redondear los decimales. Esto se realziara posterior al proceso del merge.
Ahora realizamos el merge:
autonomia=merge(anti,bank)
Procedemos a quitar los valores perdidos:
autonomia=na.omit(autonomia)
autonomia[,c(2:3)]=lapply(autonomia[,c(2:3)],as.numeric)
Lo subimos a GitHub
#MERGE PARA LAS DATAS FINAL
Variable dependiente Parlamentarias
github1='https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Mujeres%20Parlamentarias%20(1).csv'
parlamentarias_merge=import(github1)
parlamentarias_merge$`Porcentaje de Parlamentarias 2010-2019`=round(parlamentarias_merge$`Porcentaje de Parlamentarias 2010-2019`,1)
Variable Brecha
library(rio)
github2='https://raw.githubusercontent.com/ALEJANDRODELAGUILA/TRABAJO-ESTADISTICA/master/DATA%20AUTONOMIA.csv'
brecha_merge=import(github2)
brecha_merge=na.omit(brecha_merge)
names(brecha_merge)=c("Pais", "Promedio acceso a cuenta bancaria y servicio telefonico", "Promedio acceso anticonceptivo")
brecha_merge$`Promedio acceso a cuenta bancaria y servicio telefonico`=round(brecha_merge$`Promedio acceso a cuenta bancaria y servicio telefonico`, 1)
brecha_merge$`Promedio acceso anticonceptivo`=round(brecha_merge$`Promedio acceso anticonceptivo`, 1)
Variable Calidad de Vida
github3='https://github.com/Natalia-Aquize/Trabajo-de-Estad-stica./raw/master/datafinal.csv'
vida_merge=import(github3)
Variable Violencia
github4='https://github.com/Piero-Llave/Estadistica-2-2020-2/raw/master/Violencia%20Final.xlsx'
violencia_merge=import(github4)
violencia_merge$`Violencia fisica y psicologica de la mujer de 15 - 49 años`=gsub("NA", NA, violencia_merge$`Violencia fisica y psicologica de la mujer de 15 - 49 años`)
violencia_merge$`Violencia Domestica`=gsub("NA", NA, violencia_merge$`Violencia Domestica`)
str(violencia_merge)
## 'data.frame': 155 obs. of 3 variables:
## $ Pais : chr "AFG" "AGO" "ALB" "ARG" ...
## $ Violencia fisica y psicologica de la mujer de 15 - 49 años: chr "46.1" "25.9" "18.100000000000001" "52.9" ...
## $ Violencia Domestica : chr "53.1666666666667" "13.733333333333301" "8.93333333333333" "11.6" ...
violencia_merge[,-1]=lapply(violencia_merge[,-1], as.numeric)
str(violencia_merge)
## 'data.frame': 155 obs. of 3 variables:
## $ Pais : chr "AFG" "AGO" "ALB" "ARG" ...
## $ Violencia fisica y psicologica de la mujer de 15 - 49 años: num 46.1 25.9 18.1 52.9 3.5 2.6 4 9.8 27.9 8 ...
## $ Violencia Domestica : num 53.17 13.73 8.93 11.6 7.63 ...
violencia_merge=na.omit(violencia_merge)
violencia_merge$`Violencia Domestica`=round(violencia_merge$`Violencia Domestica`, 1)
Variable educacion
github5='https://github.com/omarbal99/ProyectoVariable-2020-2/raw/master/DataEducacionMujer.csv'
educacion_merge=import(github5)
names(educacion_merge)=c("Pais", "Promedio Alfabetizacion 2009-2019", "Promedio Educacion 2009-2019")
educacion_merge$`Promedio Alfabetizacion 2009-2019`=round(educacion_merge$`Promedio Alfabetizacion 2009-2019`, 1)
Empezamos con Parlamentarias y Calidad de vida
parcal=merge(parlamentarias_merge, vida_merge, by.x = "Pais", by.y = "Pais")
Luego con Brecha
parcalbre=merge(parcal, brecha_merge, by.x = "Pais", by.y = "Pais")
Luego con Violencia
parcalbrevio=merge(parcalbre, violencia_merge, by.x="Pais", by.y = "Pais")
parcalbrevio[,-1]=lapply(parcalbrevio[,-1], as.numeric)
str(parcalbrevio)
## 'data.frame': 93 obs. of 8 variables:
## $ Pais : chr "AFG" "AGO" "ALB" "ARG" ...
## $ Porcentaje de Parlamentarias 2010-2019 : num 27.7 34.7 21.3 37.9 13.4 27 16.4 33.7 8.2 13.4 ...
## $ Fuerza laboral femenina : num 19.8 50.1 41.4 42 46.1 46.2 48.8 52 49.1 44.7 ...
## $ Esperanza de vida de mujeres : num 54.4 63.4 81.9 81.1 79.2 85 76.9 68.8 63.3 64.5 ...
## $ Promedio acceso a cuenta bancaria y servicio telefonico : num 21.8 13.7 46 44.5 24.6 98.9 22.6 27.4 15.4 23.9 ...
## $ Promedio acceso anticonceptivo : num 4.5 27.8 31.5 68.3 56 67.3 54.9 6.4 17.3 19.3 ...
## $ Violencia fisica y psicologica de la mujer de 15 - 49 años: num 46.1 25.9 18.1 52.9 3.5 2.6 9.8 27.9 47 9.3 ...
## $ Violencia Domestica : num 53.2 13.7 8.9 11.6 7.6 3.2 29.3 39.5 22.3 40.8 ...
Finalmente con Educacion
merge_data_final=merge(parcalbrevio,educacion_merge, by.x = "Pais", by.y = "Pais")
str(merge_data_final)
## 'data.frame': 92 obs. of 10 variables:
## $ Pais : chr "AFG" "AGO" "ALB" "ARG" ...
## $ Porcentaje de Parlamentarias 2010-2019 : num 27.7 34.7 21.3 37.9 13.4 27 16.4 33.7 8.2 13.4 ...
## $ Fuerza laboral femenina : num 19.8 50.1 41.4 42 46.1 46.2 48.8 52 49.1 44.7 ...
## $ Esperanza de vida de mujeres : num 54.4 63.4 81.9 81.1 79.2 85 76.9 68.8 63.3 64.5 ...
## $ Promedio acceso a cuenta bancaria y servicio telefonico : num 21.8 13.7 46 44.5 24.6 98.9 22.6 27.4 15.4 23.9 ...
## $ Promedio acceso anticonceptivo : num 4.5 27.8 31.5 68.3 56 67.3 54.9 6.4 17.3 19.3 ...
## $ Violencia fisica y psicologica de la mujer de 15 - 49 años: num 46.1 25.9 18.1 52.9 3.5 2.6 9.8 27.9 47 9.3 ...
## $ Violencia Domestica : num 53.2 13.7 8.9 11.6 7.6 3.2 29.3 39.5 22.3 40.8 ...
## $ Promedio Alfabetizacion 2009-2019 : num 37.4 66 97.4 99.1 99.7 97.8 99.8 65 37.7 37.9 ...
## $ Promedio Educacion 2009-2019 : num 2.9 6.8 65.4 98.1 55 ...
Una vez obtenido la data final, lo pasaremos a subir a Github para poder tener un acceso más simple para la data
#OBSERVAMOS LA DATA FINAL
library(rio)
github_final="https://github.com/Piero-Llave/TrabajoEstadistica2/raw/master/Data%20Final%20Mergeada%20(1).csv"
DATAFINAL=import(github_final)
#Debido a la longitud de los nombres de las variables pasaremos a abreviarlas
names(DATAFINAL)=c("Pais","Parlamentarias","FLF","VIDA","BANK","ANTI","VIOFI","VIODO","ALFA","EDU")
head(DATAFINAL)
## Pais Parlamentarias FLF VIDA BANK ANTI VIOFI VIODO ALFA EDU
## 1 AFG 27.7 19.8 54.4 21.8 4.5 46.1 53.2 37.4 2.9
## 2 AGO 34.7 50.1 63.4 13.7 27.8 25.9 13.7 66.0 6.8
## 3 ALB 21.3 41.4 81.9 46.0 31.5 18.1 8.9 97.4 65.4
## 4 ARG 37.9 42.0 81.1 44.5 68.3 52.9 11.6 99.1 98.1
## 5 ARM 13.4 46.1 79.2 24.6 56.0 3.5 7.6 99.7 55.0
## 6 AUS 27.0 46.2 85.0 98.9 67.3 2.6 3.2 97.8 139.1
#ANÁLISIS UNIVARIADO
Debemos empezar con el análisis univariado
#De esta manera, podemos observar los datos más importantes de nuestras variables
summary(DATAFINAL, na.rm=TRUE)
## Pais Parlamentarias FLF VIDA
## Length:92 Min. : 3.30 Min. :13.50 Min. :53.00
## Class :character 1st Qu.:12.55 1st Qu.:40.27 1st Qu.:68.75
## Mode :character Median :19.00 Median :44.85 Median :76.35
## Mean :20.18 Mean :41.65 Mean :74.23
## 3rd Qu.:26.48 3rd Qu.:47.85 3rd Qu.:80.05
## Max. :42.60 Max. :55.90 Max. :89.50
## BANK ANTI VIOFI VIODO
## Min. : 4.90 Min. : 4.50 Min. : 2.000 Min. : 0.700
## 1st Qu.:23.57 1st Qu.:35.00 1st Qu.: 8.375 1st Qu.: 6.825
## Median :38.15 Median :55.45 Median :14.050 Median :15.950
## Mean :46.35 Mean :51.58 Mean :19.435 Mean :20.546
## 3rd Qu.:70.05 3rd Qu.:68.08 3rd Qu.:26.400 3rd Qu.:30.850
## Max. :99.80 Max. :85.50 Max. :83.100 Max. :79.600
## ALFA EDU
## Min. : 24.20 Min. : 0.60
## 1st Qu.: 71.72 1st Qu.: 7.65
## Median : 92.90 Median : 36.55
## Mean : 83.02 Mean : 39.88
## 3rd Qu.: 98.40 3rd Qu.: 65.50
## Max. :100.00 Max. :139.10
Desviación estandar para todas las variables
#desviacion estandar:
sd(DATAFINAL$Parlamentarias,na.rm = TRUE)
## [1] 9.977362
sd(DATAFINAL$FLF,na.rm = TRUE)
## [1] 9.333144
sd(DATAFINAL$VIDA,na.rm = TRUE)
## [1] 8.052171
sd(DATAFINAL$BANK,na.rm = TRUE)
## [1] 26.98959
sd(DATAFINAL$VIOFI,na.rm = TRUE)
## [1] 15.51055
sd(DATAFINAL$VIODO,na.rm = TRUE)
## [1] 17.20985
sd(DATAFINAL$ALFA,na.rm = TRUE)
## [1] 19.42325
sd(DATAFINAL$EDU,na.rm = TRUE)
## [1] 33.27135
Varianza de todas las variables
#varianza:
var(DATAFINAL$Parlamentarias,na.rm = TRUE)
## [1] 99.54774
var(DATAFINAL$FLF,na.rm = TRUE)
## [1] 87.10758
var(DATAFINAL$VIDA,na.rm = TRUE)
## [1] 64.83746
var(DATAFINAL$BANK,na.rm = TRUE)
## [1] 728.4381
var(DATAFINAL$VIOFI,na.rm = TRUE)
## [1] 240.5772
var(DATAFINAL$VIODO,na.rm = TRUE)
## [1] 296.1788
var(DATAFINAL$ALFA,na.rm = TRUE)
## [1] 377.2625
var(DATAFINAL$EDU,na.rm = TRUE)
## [1] 1106.983
#ANÁLISIS BIVARIADO
Prueba de normalidad
#Empezamos con la prueba de normalidad
library(ggplot2) #para hacer graficos
library(Hmisc) #para correlacion
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
##
## Attaching package: 'Hmisc'
## The following object is masked from 'package:psych':
##
## describe
## The following objects are masked from 'package:plyr':
##
## is.discrete, summarize
## The following objects are masked from 'package:dplyr':
##
## src, summarize
## The following objects are masked from 'package:base':
##
## format.pval, units
library(nortest) #para normalidad Kolmogorov-Smirnov (Más de 50 casos)
lillie.test(DATAFINAL$Parlamentarias)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$Parlamentarias
## D = 0.093272, p-value = 0.0467
lillie.test(DATAFINAL$FLF)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$FLF
## D = 0.20041, p-value = 8.797e-10
lillie.test(DATAFINAL$VIDA)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$VIDA
## D = 0.12183, p-value = 0.00181
lillie.test(DATAFINAL$BANK)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$BANK
## D = 0.13845, p-value = 0.0001659
lillie.test(DATAFINAL$ANTI)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$ANTI
## D = 0.11071, p-value = 0.007305
lillie.test(DATAFINAL$VIOFI)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$VIOFI
## D = 0.15253, p-value = 1.643e-05
lillie.test(DATAFINAL$VIODO)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$VIODO
## D = 0.15492, p-value = 1.08e-05
lillie.test(DATAFINAL$ALFA)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$ALFA
## D = 0.2284, p-value = 6.822e-13
lillie.test(DATAFINAL$EDU)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: DATAFINAL$EDU
## D = 0.15003, p-value = 2.525e-05
Observamos que todas las variables son, por lo que se realizará la prueba de correlación de Pearson
#Correlación de Pearson -> Parlamentarias - Fuerza Laboral Femenina
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$FLF, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$FLF
## t = 2.589, df = 90, p-value = 0.01123
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.06178809 0.44414164
## sample estimates:
## cor
## 0.2632737
#Correlación de Pearson -> Parlamentarias - Esperanza de Vida
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$VIDA, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$VIDA
## t = 1.281, df = 90, p-value = 0.2035
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.07300516 0.32959716
## sample estimates:
## cor
## 0.1338131
#Correlación de Pearson -> Parlamentarias - Acceso a Cuentas Bancarias
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$BANK, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$BANK
## t = 1.3445, df = 90, p-value = 0.1822
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.06640141 0.33549928
## sample estimates:
## cor
## 0.1403244
#Correlación de Pearson -> Parlamentarias - Acceso Anticonceptivos
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$ANTI, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$ANTI
## t = 3.1448, df = 90, p-value = 0.002253
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1173982 0.4880166
## sample estimates:
## cor
## 0.3146498
#Correlación de Pearson -> Parlamentarias - Violencia Física
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$VIOFI, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$VIOFI
## t = -0.66265, df = 90, p-value = 0.5093
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.2706342 0.1370948
## sample estimates:
## cor
## -0.06967917
#Correlación de Pearson -> Parlamentarias - Violencia Doméstica
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$VIODO, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$VIODO
## t = -1.3911, df = 90, p-value = 0.1676
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.33980024 0.06156689
## sample estimates:
## cor
## -0.14508
#Correlación de Pearson -> Parlamentarias - Alfabetización
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$ALFA, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$ALFA
## t = 1.4422, df = 90, p-value = 0.1527
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.0562557 0.3445060
## sample estimates:
## cor
## 0.1502934
#Correlación de Pearson -> Parlamentarias - Educación
cor.test(DATAFINAL$Parlamentarias, DATAFINAL$EDU, method = c("pearson"))
##
## Pearson's product-moment correlation
##
## data: DATAFINAL$Parlamentarias and DATAFINAL$EDU
## t = 1.8179, df = 90, p-value = 0.07241
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.01728521 0.37842884
## sample estimates:
## cor
## 0.1881985
Gráfico de dispersión de puntos
#Gráfico de dispersión de puntos: Parlamentarias - Fuerza Laboral Femenina
plot(DATAFINAL$FLF, DATAFINAL$Parlamentarias, xlab="Fuerza Laboral Femenina", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Esperanza de Vida de la Mujer
plot(DATAFINAL$VIDA, DATAFINAL$Parlamentarias, xlab="Esperanza de Vida de la Mujer", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Acceso a Cuentas Bancarias
plot(DATAFINAL$BANK, DATAFINAL$Parlamentarias, xlab="Acceso a Cuentas Bancarias", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Acceso a Anticonceptivos
plot(DATAFINAL$ANTI, DATAFINAL$Parlamentarias, xlab="Acceso a Anticonceptivos", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Violencia Doméstica
plot(DATAFINAL$VIODO, DATAFINAL$Parlamentarias, xlab="Violencia Domestica", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Violencia Física
plot(DATAFINAL$VIOFI, DATAFINAL$Parlamentarias, xlab="Violencia Física y Psicológica de la mujer", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Alfabetización
plot(DATAFINAL$ALFA, DATAFINAL$Parlamentarias, xlab="Alfabetización", ylab="Porcentaje de Parlamentarias")
#Gráfico de dispersión de puntos: Parlamentarias - Educación
plot(DATAFINAL$EDU, DATAFINAL$Parlamentarias, xlab="Educación", ylab="Porcentaje de Parlamentarias")
#CLUSTERIZACIÓN Debemos observar primero cuál es la mejor forma de clusterizar: -Para ello, veremos el estadístico GAP y las siluetas.
inputDATAFINAL=DATAFINAL[,c(2:10)] #Realizamos un subset para trabajar tranquilamente con la DATAFINAL
g.dist =daisy(inputDATAFINAL, metric="gower")
#Número de clusters recomendados para partición
fviz_nbclust(inputDATAFINAL, pam,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F)
Clusters recomendados para partición = 4
#Clusters recomendados para Jerarquico
fviz_nbclust(inputDATAFINAL, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F)
Clusters recomendados para jerárquico= 4
res.pam = pam(g.dist,4,cluster.only = F)
res.agnes = hcut(g.dist, k = 4,hc_func='agnes',hc_method = "ward.D")
res.diana = hcut(g.dist, k = 4,hc_func='diana')
#Gráfico para Partición (Siluetas)
fviz_silhouette(res.pam)
## cluster size ave.sil.width
## 1 1 15 0.29
## 2 2 25 0.05
## 3 3 26 0.17
## 4 4 26 0.27
#Gráfico para Aglomerativo
fviz_silhouette(res.agnes)
## cluster size ave.sil.width
## 1 1 30 0.28
## 2 2 28 0.12
## 3 3 23 0.38
## 4 4 11 0.14
#Gráfico para Divisivo
fviz_silhouette(res.diana)
## cluster size ave.sil.width
## 1 1 7 0.13
## 2 2 33 0.29
## 3 3 46 0.37
## 4 4 6 0.18
Observamos entonces que por el width, debemos escoger la clusterización jerárquica divisiva, además de que tiene menos cantidad de siluetas negativas
#Agregamos la clusterización al subset
inputDATAFINAL$clustdiana=res.diana$cluster
inputDATAFINAL$Pais=DATAFINAL$Pais #Para observar por países
De esta manera, podemos observar que los clusters están ordenados de esta manerea: 3, 4 , 2 y 1 –> Siendo 3 los países donde se encuentran la mayor cantidad de parlamentarias mujeres y 1 los países con menor cantidad de parlamentarias.
#ANÁLISIS FACTORIAL EXPLORATORIO
#Pasaremos a realizar el Análisis Factorial Exploratorio dado que es una data lista para usar
#Empezando primero hallando la matriz de correlación
dontselect=c("Pais", "Parlamentarias")
select=setdiff(names(DATAFINAL),dontselect)
theData=DATAFINAL[,select] #Sin los países ni la variable dependiente
# esta es:
library(polycor)
##
## Attaching package: 'polycor'
## The following object is masked from 'package:psych':
##
## polyserial
corMatrix=polycor::hetcor(theData)$correlations
#Pasamos a observar las correlaciones significativas con el gráfico
library(ggcorrplot)
ggcorrplot(corMatrix,
p.mat = cor_pmat(corMatrix),
insig = "blank")
Para una operacionalización mejor, convertiremos esas variables inversamente proporcionales a directamente proporcionales. Para ello, debemos realizar lo siguiente:
#Cambiamos el sentido a la data
theData$VIOFI=theData$VIOFI - 100
theData$VIOFI=theData$VIOFI * -1
theData$VIODO=theData$VIODO - 100
theData$VIODO=theData$VIODO * -1
#Volvemos a operacionalizar
library(polycor)
corMatrix=polycor::hetcor(theData)$correlations
ggcorrplot(corMatrix,
p.mat = cor_pmat(corMatrix),
insig = "blank")
Observamos a primera vista que existen datos que se correlacionan. Paso 2: Diagnóstico de nuestra matríz de correlaciones
#Primero, verificar si datos permiten factorizar:
library(psych)
psych::KMO(corMatrix)
## Kaiser-Meyer-Olkin factor adequacy
## Call: psych::KMO(r = corMatrix)
## Overall MSA = 0.85
## MSA for each item =
## FLF VIDA BANK ANTI VIOFI VIODO ALFA EDU
## 0.48 0.83 0.87 0.92 0.77 0.84 0.85 0.88
Resultado de KMO: Observamos que el KMO es de 0.85, por lo que podemos indicar que los datos sí se pueden factorizar
#Realizamos el test de Bartlett para verificar si es una matriz de identidad
cortest.bartlett(corMatrix,n=nrow(theData))$p.value>0.05
## [1] FALSE
#Además, realizamos el test de Singular Square Matrix para verificar si es una matriz singular
library(matrixcalc)
is.singular.matrix(corMatrix)
## [1] FALSE
Aquí podemos comprobar que no existen problemas para operacionalizar la data, así que no hay nada por reportar y seguimos con el EFA
Paso 3: Identificamos el número recomendado de factores y solicitamos el EFA
#Determinamos en cuantas variables latentes podemos redimensionar nuestra data:
fa.parallel(theData,fm = 'ML', fa = 'fa')
## Parallel analysis suggests that the number of factors = 2 and the number of components = NA
El número sugerido para redimensionar nuestras variables es 2
#Pasamos a solicitar el número de factores
library(GPArotation)
resfa <- fa(theData,nfactors = 2,cor = 'mixed',rotate = "varimax",fm="minres")
print(resfa$loadings,cutoff = 0.5) #Observamos directamente el resultado mejorado
##
## Loadings:
## MR1 MR2
## FLF 0.512
## VIDA 0.914
## BANK 0.655
## ANTI 0.770
## VIOFI 0.689
## VIODO 0.543
## ALFA 0.833
## EDU 0.842
##
## MR1 MR2
## SS loadings 3.577 1.173
## Proportion Var 0.447 0.147
## Cumulative Var 0.447 0.594
En este pequeño gráfico se puede observar que la distribución de las nuevas latentes sería: MR1 : VIDA, BANK, ANTI, ALFA, EDU (5)
MR2: FLF, VIOFI, VIODO (3)
#Veamoslo en un gráfico
fa.diagram(resfa)
Paso 4: Evaluando los resultados obtenidos
#¿La Raíz del error cuadrático medio corregida está cerca a cero?
resfa$crms
## [1] 0.06173478
Vemos que sí, el resultado es 0.06 el cual es un valor cercano a 0. Esto indica un buen ajuste
#¿La Raíz del error cuadrático medio de aproximación es menor a 0.05?
resfa$RMSEA
## RMSEA lower upper confidence
## 0.10354444 0.04284476 0.16321243 0.90000000
El valor obtenido en RMSEA es 1, por lo que debemos reportar este valor. Esto indicaría que no existe un buen ajuste, además de una insuficiencia de validez
#¿El índice de Tucker-Lewis es mayor a 0.9?
resfa$TLI
## [1] 0.9217458
Debido a que el valor es mayor a 0.9 es importante indicar que el modelo tiene un buen ajuste.
#¿Qué variables aportaron mas a los factores?
sort(resfa$communality)
## FLF BANK VIODO VIOFI ANTI ALFA EDU VIDA
## 0.2654277 0.4773675 0.5259596 0.5566852 0.6242040 0.7017952 0.7625156 0.8360326
Debemos mencionar los 3 valores que más aportan a los factores El primero es VIDA con 0.84, le sigue EDU con 0.76 y finalmente ALFA con 0.70
#¿Qué variables contribuyen a mas de un factor?
sort(resfa$complexity)
## VIDA FLF ALFA ANTI EDU BANK VIOFI VIODO
## 1.000017 1.021180 1.024616 1.105275 1.150484 1.220877 1.336727 1.970984
Podemos observar eque no existe ni una variable que contribuya a más de un factor, sin embargo se debe mencionar que VIODO está cercano a formar parte de ambos factores, pero no logra serlo
#REGRESIÓN LINEAL MÚLTIPLE
#Redistribuímos las nuevas latentes describiendo el modelo de regresión lineal --> Con los resultados formamos una nueva Data
DATAFINALFA=cbind(DATAFINAL[2],as.data.frame(resfa$scores))
names(DATAFINALFA)=c("Parlamentarias", "Brecha", "Integridad") #le cambiamos los nombres
De esta manera, MR1 sería, Brecha Sociocultural y MR2 sería Integridad de la Mujer
#Presentamos el modelo de regresión lineal
modelo1=formula(Parlamentarias~Brecha+Integridad)
library(stargazer)
reg1=lm(modelo1,data=DATAFINALFA)
stargazer(reg1,type = "text",intercept.bottom = FALSE)
##
## ===============================================
## Dependent variable:
## ---------------------------
## Parlamentarias
## -----------------------------------------------
## Constant 20.180***
## (1.023)
##
## Brecha 1.903*
## (1.074)
##
## Integridad 1.589
## (1.260)
##
## -----------------------------------------------
## Observations 92
## R2 0.054
## Adjusted R2 0.033
## Residual Std. Error 9.812 (df = 89)
## F Statistic 2.544* (df = 2; 89)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Pruebas Post hoc
#No multicolinealidad
library(car)
vif(reg1)
## Brecha Integridad
## 1.005507 1.005507
#LINEALIDAD
#Gráfico
plot(reg1, 1)
Normalidad de residuos
residuos=reg1$residuals
ks.test(residuos, pnorm, mean(residuos), sd(residuos))
##
## One-sample Kolmogorov-Smirnov test
##
## data: residuos
## D = 0.079894, p-value = 0.5721
## alternative hypothesis: two-sided
Homocedasticidad
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(reg1)
##
## studentized Breusch-Pagan test
##
## data: reg1
## BP = 0.28808, df = 2, p-value = 0.8659
No autocorrelación de residuos
library(lmtest)
dwtest(Parlamentarias~Brecha+Integridad, alternative="greater", data=DATAFINALFA)
## Warning in dwtest(Parlamentarias ~ Brecha + Integridad, alternative =
## "greater", : exact p value cannot be computed (not in [0,1]), approximate p
## value will be used
##
## Durbin-Watson test
##
## data: Parlamentarias ~ Brecha + Integridad
## DW = 2.048, p-value = 0.5832
## alternative hypothesis: true autocorrelation is greater than 0
Valores Influyentes
checkreg1=as.data.frame(influence.measures(reg1)$is.inf)
checkreg1[checkreg1$cook.d | checkreg1$hat,]
## dfb.1_ dfb.Brch dfb.Intg dffit cov.r cook.d hat
## 26 FALSE FALSE FALSE FALSE TRUE FALSE TRUE
## 42 FALSE FALSE FALSE TRUE TRUE FALSE TRUE
## 55 FALSE FALSE FALSE FALSE TRUE FALSE TRUE
#Valores influyentes: Argelia, Iraq y Sri Lanka
plot(reg1, 5)
Pasa 5 de 6 pruebas Post Hoc
Debido a que vemos que existe una significancia en el valor MR1, es necesario observar cuales de las variables que conforman esta latente son significantes, para tener un resultado más preciso
#REGRESIÓN LINEAL 2
modelo2=formula(Parlamentarias~VIDA+BANK+ANTI+ALFA+EDU+FLF+VIOFI+VIODO)
library(stargazer)
reg2=lm(modelo2,data=DATAFINAL)
stargazer(reg2,type = "text",intercept.bottom = FALSE)
##
## ===============================================
## Dependent variable:
## ---------------------------
## Parlamentarias
## -----------------------------------------------
## Constant -0.799
## (16.922)
##
## VIDA 0.028
## (0.240)
##
## BANK -0.051
## (0.053)
##
## ANTI 0.203***
## (0.074)
##
## ALFA -0.071
## (0.090)
##
## EDU 0.037
## (0.056)
##
## FLF 0.321***
## (0.121)
##
## VIOFI 0.080
## (0.081)
##
## VIODO 0.011
## (0.079)
##
## -----------------------------------------------
## Observations 92
## R2 0.187
## Adjusted R2 0.109
## Residual Std. Error 9.418 (df = 83)
## F Statistic 2.391** (df = 8; 83)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Si bien la variable FLF también es significante, debemos entender que la variable MR2 donde está incluída esta variable no lo es, por lo que no se tomará en cuenta.
Mientras, en la latente MR1, se observa que la úniac significante es la variable ANTI. El R2 Ajustado observado es de 0.109, por lo que este modelo explica 10.9%.