Usaremos la base de datos “desigualdad” la cual puntajes de diferentes paises respecto a la desigualdad de género y la participacion de la mujer en las diversas esferas sociales.

library(rio)
## Warning: package 'rio' was built under R version 4.0.5
data = import("desigualdad.xlsx")

Primero estandarizaremos los valores para que todos esten en un rango de 0 a 100. Luego, revisaremos las diversas variables que posee nuestra base para comenzar a trabajar dichos datos.

data$DesigualdadGenero = data$DesigualdadGenero * 100
data$DesempleoMuj = (data$DesempleoMuj - 0.4)* 100/2
names(data)
##  [1] "Pais"              "DesigualdadGenero" "MLAutonomia"      
##  [4] "MLViolencia"       "VozPolitica"       "LibertadMov"      
##  [7] "DesconfianzaSJ"    "SecundariaC"       "DesempleoMuj"     
## [10] "CuentaF"

Correlación

Nuestra variable dependiente será el indice de desigualdad de género. La primera variable independiente que usaremos será el porcentaje de desempleo femenino respecto al de sus pares masculinos.

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.5
base=ggplot(data=data, aes(x=DesempleoMuj, y=DesigualdadGenero)) + geom_point()
base

El primer grafico de dispersión nos permite notar que existe cierta correlación entre nuestra variable dependiente e independiente.

f1=formula(~DesigualdadGenero + DesempleoMuj)
pearsonf1=cor.test(f1,data=data)[c('estimate','p.value')]
pearsonf1
## $estimate
##       cor 
## 0.3539376 
## 
## $p.value
## [1] 6.816281e-05

Podemos notar que nuestro p-valos al ser menor a 0.05 nos confirma que si existe correlación entre nuestras vadiables. Además, a traves del test de correlación podemos notar que esta es de un rango medio-bajo, lo que sigifica que si bien existe la relacion entre los datos, esta correlación no es tan fuerte. El segundo gráfico añadirá además de las dos variables anteriores una tercera variable: la sensación de libertad de movimiento. Para graficar esto se usará un gráfico tridimencional donde el eje z será la nueva variable.

library(scatterplot3d)
scatterplot3d(data[,c('DesempleoMuj','DesigualdadGenero','LibertadMov')])

Ahora, los mismos datos pero mostrados de manera bidimensional, donde el color representa la sensación de libertad de movimiento.

base1=ggplot(data=data, aes(x=DesempleoMuj, y=DesigualdadGenero)) + geom_point(aes(color = LibertadMov))
base1

f2=formula(~DesigualdadGenero+LibertadMov)
pearsonf2=cor.test(f2,data=data)[c('estimate','p.value')]
pearsonf2
## $estimate
##        cor 
## -0.4782063 
## 
## $p.value
## [1] 2.901913e-08

Haciendo la correlación entre nuestra variable dependiente y la nueva variable independiente (libertad de movimiento) podemos notar que por su p-valor si existe correlación y es una relación inversa de fuerza media, o sea, a mayor sensación de libertad, menor desigualdad.

Regresión Lineal

Primero crearemos la primera regresión lineal para nuestro modelo de dos variables

base2=ggplot(data=data, aes(x=DesempleoMuj, y=DesigualdadGenero)) + geom_point() + geom_smooth(method=lm)
base2
## `geom_smooth()` using formula 'y ~ x'

Para el modelo tridimencional este modelo será un plano, pues se ha agregado una dimensión extra.

modelo2=formula(DesempleoMuj ~ DesigualdadGenero + LibertadMov)
reg2=lm(modelo2,data=data)
G = scatterplot3d(data[,c('DesempleoMuj','DesigualdadGenero','LibertadMov')])
G$plane3d(reg2, draw_polygon = TRUE, draw_lines = FALSE)

library(stargazer)
## 
## Please cite as:
##  Hlavac, Marek (2018). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.2. https://CRAN.R-project.org/package=stargazer
stargazer(reg2, type = "text" ,intercept.bottom = FALSE)
## 
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                            DesempleoMuj        
## -----------------------------------------------
## Constant                     34.633**          
##                              (13.548)          
##                                                
## DesigualdadGenero            0.327***          
##                               (0.095)          
##                                                
## LibertadMov                   -0.066           
##                               (0.182)          
##                                                
## -----------------------------------------------
## Observations                    121            
## R2                             0.126           
## Adjusted R2                    0.111           
## Residual Std. Error      18.469 (df = 118)     
## F Statistic           8.524*** (df = 2; 118)   
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01