Usaremos la base de datos “desigualdad” la cual puntajes de diferentes paises respecto a la desigualdad de género y la participacion de la mujer en las diversas esferas sociales.
library(rio)
## Warning: package 'rio' was built under R version 4.0.5
data = import("desigualdad.xlsx")
Primero estandarizaremos los valores para que todos esten en un rango de 0 a 100. Luego, revisaremos las diversas variables que posee nuestra base para comenzar a trabajar dichos datos.
data$DesigualdadGenero = data$DesigualdadGenero * 100
data$DesempleoMuj = (data$DesempleoMuj - 0.4)* 100/2
names(data)
## [1] "Pais" "DesigualdadGenero" "MLAutonomia"
## [4] "MLViolencia" "VozPolitica" "LibertadMov"
## [7] "DesconfianzaSJ" "SecundariaC" "DesempleoMuj"
## [10] "CuentaF"
Nuestra variable dependiente será el indice de desigualdad de género. La primera variable independiente que usaremos será el porcentaje de desempleo femenino respecto al de sus pares masculinos.
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.5
base=ggplot(data=data, aes(x=DesempleoMuj, y=DesigualdadGenero)) + geom_point()
base
El primer grafico de dispersión nos permite notar que existe cierta correlación entre nuestra variable dependiente e independiente.
f1=formula(~DesigualdadGenero + DesempleoMuj)
pearsonf1=cor.test(f1,data=data)[c('estimate','p.value')]
pearsonf1
## $estimate
## cor
## 0.3539376
##
## $p.value
## [1] 6.816281e-05
Podemos notar que nuestro p-valos al ser menor a 0.05 nos confirma que si existe correlación entre nuestras vadiables. Además, a traves del test de correlación podemos notar que esta es de un rango medio-bajo, lo que sigifica que si bien existe la relacion entre los datos, esta correlación no es tan fuerte. El segundo gráfico añadirá además de las dos variables anteriores una tercera variable: la sensación de libertad de movimiento. Para graficar esto se usará un gráfico tridimencional donde el eje z será la nueva variable.
library(scatterplot3d)
scatterplot3d(data[,c('DesempleoMuj','DesigualdadGenero','LibertadMov')])
Ahora, los mismos datos pero mostrados de manera bidimensional, donde el color representa la sensación de libertad de movimiento.
base1=ggplot(data=data, aes(x=DesempleoMuj, y=DesigualdadGenero)) + geom_point(aes(color = LibertadMov))
base1
f2=formula(~DesigualdadGenero+LibertadMov)
pearsonf2=cor.test(f2,data=data)[c('estimate','p.value')]
pearsonf2
## $estimate
## cor
## -0.4782063
##
## $p.value
## [1] 2.901913e-08
Haciendo la correlación entre nuestra variable dependiente y la nueva variable independiente (libertad de movimiento) podemos notar que por su p-valor si existe correlación y es una relación inversa de fuerza media, o sea, a mayor sensación de libertad, menor desigualdad.
Primero crearemos la primera regresión lineal para nuestro modelo de dos variables
base2=ggplot(data=data, aes(x=DesempleoMuj, y=DesigualdadGenero)) + geom_point() + geom_smooth(method=lm)
base2
## `geom_smooth()` using formula 'y ~ x'
Para el modelo tridimencional este modelo será un plano, pues se ha agregado una dimensión extra.
modelo2=formula(DesempleoMuj ~ DesigualdadGenero + LibertadMov)
reg2=lm(modelo2,data=data)
G = scatterplot3d(data[,c('DesempleoMuj','DesigualdadGenero','LibertadMov')])
G$plane3d(reg2, draw_polygon = TRUE, draw_lines = FALSE)
library(stargazer)
##
## Please cite as:
## Hlavac, Marek (2018). stargazer: Well-Formatted Regression and Summary Statistics Tables.
## R package version 5.2.2. https://CRAN.R-project.org/package=stargazer
stargazer(reg2, type = "text" ,intercept.bottom = FALSE)
##
## ===============================================
## Dependent variable:
## ---------------------------
## DesempleoMuj
## -----------------------------------------------
## Constant 34.633**
## (13.548)
##
## DesigualdadGenero 0.327***
## (0.095)
##
## LibertadMov -0.066
## (0.182)
##
## -----------------------------------------------
## Observations 121
## R2 0.126
## Adjusted R2 0.111
## Residual Std. Error 18.469 (df = 118)
## F Statistic 8.524*** (df = 2; 118)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01