Contraste de medias 2021-2

Cargar data


load("genero12.Rdata")

Introducción

Para realizar los contrastes de medias, vamos a utilizar la base que contiene los datos del estudio de Roles de Género del IOP del 2012.

En general, vamos a realizar los ejercicios utilizando la siguiente estructura de desarrollo:

Ejercicio 1

Calcule la diferencia de medias de la edad de convivencia o matrimonio (P23) según sexo.

H0: No existen diferencias entre la edad de primera convivencia o casamiento según sexo

H1: Si existen diferencias la edad de primera convivencia o casamiento según sexo

Se trata de un contraste estadístico bilateral para muestras independientes


t.test(genero$P23~genero$SEXO)
## 
##  Welch Two Sample t-test
## 
## data:  genero$P23 by genero$SEXO
## t = 8.9404, df = 803.98, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group Masculino and group Femenino is not equal to 0
## 95 percent confidence interval:
##  2.527755 3.949971
## sample estimates:
## mean in group Masculino  mean in group Femenino 
##                25.73464                22.49578

En este caso, podemos rechazar H0 con un T=8.94 y p valor menor a 0.05 (p=2.2e-16), es decir que el T se encuentra en zona de rechazo. Entonces, decimos que la media del grupo de hombres (M=25.735) es significativamente distinta que la del grupo de mujeres (M=22.496).

Asimismo, se observa que el intervalo de coinfianza de la diferencia de medias al 95% no incluye al cero (2.528 3.950).


library(Rmisc)

est.des <- summarySE(genero , measurevar="P23", groupvars=c("SEXO"), na.rm=T, conf.interval = 0.95)

est.des
##        SEXO   N      P23       sd        se        ci
## 1 Masculino 407 25.73464 5.727675 0.2839103 0.5581177
## 2  Femenino 474 22.49578 4.899086 0.2250225 0.4421673

En este caso, observamos que los intervalos de confianza al 95% para ambos grupos no se yuxtaponen: Hombres: 25.73 - 0.56 = 25.17; Mujer: 22.50 + 0.44 = 22.94.

Ejercicio 2

Respuesta: nuestra Prueba de Hipótesis solo aplica para variables dicotómicas (por ejemplo, SEXO)

Ejercicio 3

Analice la diferencia de medias para la edad ideal para que una mujer se case según sexo.

En este caso, se propone que los hombres consideran que la edad ideal de casamiento es menor que en el caso de las mujeres.


t.test(genero$P1~genero$SEXO, alternative = "less")
## 
##  Welch Two Sample t-test
## 
## data:  genero$P1 by genero$SEXO
## t = 0.50628, df = 1158.4, p-value = 0.6936
## alternative hypothesis: true difference in means between group Masculino and group Femenino is less than 0
## 95 percent confidence interval:
##      -Inf 1.726364
## sample estimates:
## mean in group Masculino  mean in group Femenino 
##                28.97284                28.56678

Ejercicio 4

Calcule las diferencias en las horas dedicadas a labores domésticas entre las mujeres de las ciudades del interior del país y el interior rural.

En este caso, Ud, debe de plantear las hipótesis. Si es necesario, especifique con el argumento “alternative” la dirección del contraste.


muj.int<-subset(genero, SEXO=="Femenino" &  Ambito!="Lima-Callao")


t.test(muj.int$P19A~muj.int$Ambito)
## 
##  Welch Two Sample t-test
## 
## data:  muj.int$P19A by muj.int$Ambito
## t = -2.1937, df = 189.67, p-value = 0.02947
## alternative hypothesis: true difference in means between group Interior Urbano and group Interior Rural is not equal to 0
## 95 percent confidence interval:
##  -12.8554675  -0.6824179
## sample estimates:
## mean in group Interior Urbano  mean in group Interior Rural 
##                      31.17978                      37.94872

Muestras relacionadas

Las muestras relacionadas asumen una sola muestra y dos mediciones. Esto es, se comparan las puntuaciones de dos variables en el mismo grupo de personas.

Ejercicio 5

¿La edad considerada como ideal para que un hombre se case es mayor que la edad para que una mujer se case?


t.test(genero$P1, genero$P2, paired=T, alternative = "less")
## 
##  Paired t-test
## 
## data:  genero$P1 and genero$P2
## t = -12.597, df = 1202, p-value < 2.2e-16
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -1.904141
## sample estimates:
## mean of the differences 
##               -2.190357

Para precisar cuál es el valor de las medias del cálculo estadístico, vamos a pedir los estadísticos descriptivos:


library(summarytools)

descr(genero$P1)
## Descriptive Statistics  
## genero$P1  
## N: 1203  
## 
##                          P1
## ----------------- ---------
##              Mean     28.77
##           Std.Dev     13.86
##               Min     15.00
##                Q1     25.00
##            Median     25.00
##                Q3     30.00
##               Max     99.00
##               MAD      2.97
##               IQR      5.00
##                CV      0.48
##          Skewness      4.52
##       SE.Skewness      0.07
##          Kurtosis     20.08
##           N.Valid   1203.00
##         Pct.Valid    100.00
descr(genero$P2)
## Descriptive Statistics  
## genero$P2  
## N: 1203  
## 
##                          P2
## ----------------- ---------
##              Mean     30.96
##           Std.Dev     13.34
##               Min     18.00
##                Q1     25.00
##            Median     30.00
##                Q3     30.00
##               Max     99.00
##               MAD      4.45
##               IQR      5.00
##                CV      0.43
##          Skewness      4.48
##       SE.Skewness      0.07
##          Kurtosis     20.10
##           N.Valid   1203.00
##         Pct.Valid    100.00

Ejercicio 6

En el caso de los hombres, ¿la edad considerada como ideal para que un hombre se case es muy diferente que la edad en que empezó a convivir o se casó?


hombres<-subset(genero, SEXO=="Masculino")

t.test(hombres$P2, hombres$P23, paired=T)
## 
##  Paired t-test
## 
## data:  hombres$P2 and hombres$P23
## t = 6.7042, df = 406, p-value = 6.801e-11
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  3.686693 6.745739
## sample estimates:
## mean of the differences 
##                5.216216

Ejercicio 7

En el caso de los hombres que viven Lima-Callao ¿la edad considerada como ideal para que un hombre se case es muy diferente que la edad en que se empezó a convivir o se casó?


hombres.cap <- subset(genero, SEXO=="Masculino" & Ambito=="Lima-Callao")


t.test(hombres.cap$P2, hombres.cap$P23, paired=T,conf.level= 0.95)
## 
##  Paired t-test
## 
## data:  hombres.cap$P2 and hombres.cap$P23
## t = 3.8933, df = 153, p-value = 0.0001473
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  2.258139 6.910692
## sample estimates:
## mean of the differences 
##                4.584416

Contraste de proporciones

Para el contraste de proporciones, podemos utilziar la función “prop.test” del R Project.

En este caso, debemos de colocar las frecuencias frecuencias cruzadas y las marginales como input de la función. Para ello, es necesario generar una tabla cruzada para las dos variables de interés.

Ejercicio

En el caso de los encuestados que viven Lima-Callao y en zonas rurales: ¿existen diferencias en el nivel de justificación en el caso de que un hombre golpee a una mujer si ella le es infiel?


table(genero$P52F,genero$Ambito)
##        
##         Lima-Callao Interior Urbano Interior Rural
##   Sí             53             107             65
##   No            383             374            150
##   NS/NR          12              34             25
prop.test(x=c(53, 65), n=c(53 + 383, 65 + 150), conf.level=0.95)
## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(53, 65) out of c(53 + 383, 65 + 150)
## X-squared = 30.499, df = 1, p-value = 3.341e-08
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.2528639 -0.1086679
## sample estimates:
##    prop 1    prop 2 
## 0.1215596 0.3023256