Cargar data
load("genero12.Rdata")
Introducción
Para realizar los contrastes de medias, vamos a utilizar la base que contiene los datos del estudio de Roles de Género del IOP del 2012.
En general, vamos a realizar los ejercicios utilizando la siguiente estructura de desarrollo:
Paso 1: Planteamiento de hipótesis
Paso 2: Seleccionar distribución de muestreo. En este caso será t.
Paso 3: Determinar nivel de significancia. Vamos a usar 0.05
Paso 4: Calcular el estadístico de la prueba
Paso 5: Tomar una decisión: ¿Rechaza o no rechaza H0?
Ejercicio 1
Calcule la diferencia de medias de la edad de convivencia o matrimonio (P23) según sexo.
H0: No existen diferencias entre la edad de primera convivencia o casamiento según sexo
H1: Si existen diferencias la edad de primera convivencia o casamiento según sexo
Se trata de un contraste estadístico bilateral para muestras independientes
t.test(genero$P23~genero$SEXO)
##
## Welch Two Sample t-test
##
## data: genero$P23 by genero$SEXO
## t = 8.9404, df = 803.98, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group Masculino and group Femenino is not equal to 0
## 95 percent confidence interval:
## 2.527755 3.949971
## sample estimates:
## mean in group Masculino mean in group Femenino
## 25.73464 22.49578
En este caso, podemos rechazar H0 con un T=8.94 y p valor menor a 0.05 (p=2.2e-16), es decir que el T se encuentra en zona de rechazo. Entonces, decimos que la media del grupo de hombres (M=25.735) es significativamente distinta que la del grupo de mujeres (M=22.496).
Asimismo, se observa que el intervalo de coinfianza de la diferencia de medias al 95% no incluye al cero (2.528 3.950).
library(Rmisc)
est.des <- summarySE(genero , measurevar="P23", groupvars=c("SEXO"), na.rm=T, conf.interval = 0.95)
est.des
## SEXO N P23 sd se ci
## 1 Masculino 407 25.73464 5.727675 0.2839103 0.5581177
## 2 Femenino 474 22.49578 4.899086 0.2250225 0.4421673
En este caso, observamos que los intervalos de confianza al 95% para ambos grupos no se yuxtaponen: Hombres: 25.73 - 0.56 = 25.17; Mujer: 22.50 + 0.44 = 22.94.
Ejercicio 2
Respuesta: nuestra Prueba de Hipótesis solo aplica para variables dicotómicas (por ejemplo, SEXO)
Ejercicio 3
Analice la diferencia de medias para la edad ideal para que una mujer se case según sexo.
En este caso, se propone que los hombres consideran que la edad ideal de casamiento es menor que en el caso de las mujeres.
Plantee las hipótesis
Calcule la prueba T
Contraste las hipótesis
t.test(genero$P1~genero$SEXO, alternative = "less")
##
## Welch Two Sample t-test
##
## data: genero$P1 by genero$SEXO
## t = 0.50628, df = 1158.4, p-value = 0.6936
## alternative hypothesis: true difference in means between group Masculino and group Femenino is less than 0
## 95 percent confidence interval:
## -Inf 1.726364
## sample estimates:
## mean in group Masculino mean in group Femenino
## 28.97284 28.56678
Ejercicio 4
Calcule las diferencias en las horas dedicadas a labores domésticas entre las mujeres de las ciudades del interior del país y el interior rural.
En este caso, Ud, debe de plantear las hipótesis. Si es necesario, especifique con el argumento “alternative” la dirección del contraste.
muj.int<-subset(genero, SEXO=="Femenino" & Ambito!="Lima-Callao")
t.test(muj.int$P19A~muj.int$Ambito)
##
## Welch Two Sample t-test
##
## data: muj.int$P19A by muj.int$Ambito
## t = -2.1937, df = 189.67, p-value = 0.02947
## alternative hypothesis: true difference in means between group Interior Urbano and group Interior Rural is not equal to 0
## 95 percent confidence interval:
## -12.8554675 -0.6824179
## sample estimates:
## mean in group Interior Urbano mean in group Interior Rural
## 31.17978 37.94872
Muestras relacionadas
Las muestras relacionadas asumen una sola muestra y dos mediciones. Esto es, se comparan las puntuaciones de dos variables en el mismo grupo de personas.
Ejercicio 5
¿La edad considerada como ideal para que un hombre se case es mayor que la edad para que una mujer se case?
t.test(genero$P1, genero$P2, paired=T, alternative = "less")
##
## Paired t-test
##
## data: genero$P1 and genero$P2
## t = -12.597, df = 1202, p-value < 2.2e-16
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf -1.904141
## sample estimates:
## mean of the differences
## -2.190357
Para precisar cuál es el valor de las medias del cálculo estadístico, vamos a pedir los estadísticos descriptivos:
library(summarytools)
descr(genero$P1)
## Descriptive Statistics
## genero$P1
## N: 1203
##
## P1
## ----------------- ---------
## Mean 28.77
## Std.Dev 13.86
## Min 15.00
## Q1 25.00
## Median 25.00
## Q3 30.00
## Max 99.00
## MAD 2.97
## IQR 5.00
## CV 0.48
## Skewness 4.52
## SE.Skewness 0.07
## Kurtosis 20.08
## N.Valid 1203.00
## Pct.Valid 100.00
descr(genero$P2)
## Descriptive Statistics
## genero$P2
## N: 1203
##
## P2
## ----------------- ---------
## Mean 30.96
## Std.Dev 13.34
## Min 18.00
## Q1 25.00
## Median 30.00
## Q3 30.00
## Max 99.00
## MAD 4.45
## IQR 5.00
## CV 0.43
## Skewness 4.48
## SE.Skewness 0.07
## Kurtosis 20.10
## N.Valid 1203.00
## Pct.Valid 100.00
Ejercicio 6
En el caso de los hombres, ¿la edad considerada como ideal para que un hombre se case es muy diferente que la edad en que empezó a convivir o se casó?
hombres<-subset(genero, SEXO=="Masculino")
t.test(hombres$P2, hombres$P23, paired=T)
##
## Paired t-test
##
## data: hombres$P2 and hombres$P23
## t = 6.7042, df = 406, p-value = 6.801e-11
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.686693 6.745739
## sample estimates:
## mean of the differences
## 5.216216
Ejercicio 7
En el caso de los hombres que viven Lima-Callao ¿la edad considerada como ideal para que un hombre se case es muy diferente que la edad en que se empezó a convivir o se casó?
hombres.cap <- subset(genero, SEXO=="Masculino" & Ambito=="Lima-Callao")
t.test(hombres.cap$P2, hombres.cap$P23, paired=T,conf.level= 0.95)
##
## Paired t-test
##
## data: hombres.cap$P2 and hombres.cap$P23
## t = 3.8933, df = 153, p-value = 0.0001473
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 2.258139 6.910692
## sample estimates:
## mean of the differences
## 4.584416
Contraste de proporciones
Para el contraste de proporciones, podemos utilziar la función “prop.test” del R Project.
En este caso, debemos de colocar las frecuencias frecuencias cruzadas y las marginales como input de la función. Para ello, es necesario generar una tabla cruzada para las dos variables de interés.
Ejercicio
En el caso de los encuestados que viven Lima-Callao y en zonas rurales: ¿existen diferencias en el nivel de justificación en el caso de que un hombre golpee a una mujer si ella le es infiel?
table(genero$P52F,genero$Ambito)
##
## Lima-Callao Interior Urbano Interior Rural
## Sí 53 107 65
## No 383 374 150
## NS/NR 12 34 25
prop.test(x=c(53, 65), n=c(53 + 383, 65 + 150), conf.level=0.95)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(53, 65) out of c(53 + 383, 65 + 150)
## X-squared = 30.499, df = 1, p-value = 3.341e-08
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.2528639 -0.1086679
## sample estimates:
## prop 1 prop 2
## 0.1215596 0.3023256