¿Hay diferencia significativa del promedio entre ambos grupos?
Para contestar esta pregunta necesitamos revisar la prueba estadística que sirve para la comparación de un promedio en dos grupos (Prueba t de Student).
Por ello, a continuación observaremos:
Estadística bivariada
Prueba de hipótesis
Estadística bivariada
La descripción bivariada trata de estudiar la relación entre dos variables de una misma muestra o conjunto de datos. El análisis se realiza con el fin en determinar una relación empírica entre ellas. La elección de tipo de prueba para el análisis bivariado depende del tipo de las variables.
Prueba T: Una variable numérica y una variable categórica (+2 categoría)
Prueba Anova: Una variable numérica y una variable categórica (+2 categorías)
Prueba Chi-cuadrado: Dos variables categóricas.
Prueba de Correlación: Dos variables numéricas.
Prueba de hipótesis
¿Qué es una hipótesis?
Es una afirmación sujeta a verificación.
¿Qué es la prueba de hipótesis?
Es el proceso que se lleva a cabo para determinar la validez de una aseveración hecha sobre la población basándose en evidencia muestral.
La aseveración sobre la población a nivel sus parámetros se refiere a la media, varianza o desviación estándar y proporción.
Para realizar una prueba de hipótesis se requiere plantearse una hipótesis.
Prueba de hipótesis
HIPÓTESIS NULA H0
La afirmación que se contrasta en una prueba estadística se llama hipótesis nula. Las pruebas de significación se diseñan para valorar la fuerza de la evidencia en contra de la hipótesis nula.
En general, la hipótesis nula es una afirmación de “ausencia de efecto” o de “no diferencia”.
La afirmación en relación con la población sobre la cual queremos hallar evidencia a favor es la hipótesis alternativa, designada como Ha.
Prueba de hipótesis
VALOR P
La probabilidad, calculada suponiendo que H0 es cierta, de que el resultado tome un valor al menos tan extremo como el observado se llama valor P de la prueba de significación.
Cuanto menor sea el valor P, más fuerte es la evidencia que proporcionan los datos en contra de H0.
Prueba de hipótesis
Prueba de hipótesis
Prueba de hipótesis
Prueba de hipótesis
Prueba de hipótesis
Curva al 99% del nivel de confianza
Prueba T
Es una de las técnicas más comunes para el análisis en ciencias sociales. Ejemplos: Comparar el nivel de ingresos entre hombres y mujeres. Se corrobora si el medio de la variable numérica es diferente en el grupo A, en comparació el grupo B.
La variable numérica se denomina “variable dependiente” y a la variable dicotómica, “variable independiente”.
Prueba T para muestras independientes Una variable numérica según dos grupos . Ejemplo:
Prueba T para muestras relacionadas : Una variable numérica medida en dos tiempos.
Prueba T
Prueba T
Se verifica las varianzas.
La Prueba de Levene es una prueba estadística inferencial utilizada para evaluar la igualdad de las varianzas para una variable calculada para dos o más grupos.
Hipótesis Nula de Prueba de Levene: las varianzas son iguales
Buscamos rechazar la Hipótesis Nula, POR TANTO, las varianza son diferentes.
Prueba T
Ejercicio
Utilizaremos la base de datos sobre las percepciones de corrupción de PROETICA
Welch Two Sample t-test
data: indicador_percepcion_corrupcion by sexo
t = -1.2375, df = 1874.9, p-value = 0.216
alternative hypothesis: true difference in means between group Hombre and group Mujer is not equal to 0
95 percent confidence interval:
-2.4975408 0.5650522
sample estimates:
mean in group Hombre mean in group Mujer
66.63482 67.60106
A un 95% de nivel de confianza, no se rechaza la H0 , por tanto, no existe diferencia de medias significativas de la percepción de corrupción entre los hombres y las mujeres.
Welch Two Sample t-test
data: indicador_percepcion_corrupcion by P03
t = 4.1857, df = 330.89, p-value = 3.648e-05
alternative hypothesis: true difference in means between group Sí, me perjudica and group No me perjudica is not equal to 0
95 percent confidence interval:
2.656096 7.366383
sample estimates:
mean in group Sí, me perjudica mean in group No me perjudica
67.84070 62.82946
A un 95% de nivel de confianza, se rechaza la H0 , por tanto, si existe diferencia de medias significativas de la percepción de corrupción entre quienes se sienten afectados o no por corrupción.
# A tibble: 3 × 4
P03 Media linf lsup
<fct> <dbl> <dbl> <dbl>
1 Sí, me perjudica 67.8 67.0 68.7
2 No me perjudica 62.8 60.6 65.0
3 <NA> 63.8 53.6 74.1
library(ggplot2)ggplot(ic_grupo, aes(x= P03, y =Media)) + geom_errorbar(aes(ymin=linf, ymax=lsup), width = 0.2)+ geom_text(aes(label=paste(round(Media, 1))), size=4)+ xlab("Creencia que la corrupción lo afecta en su vida cotidiana") + ylab("Indicador de Tolerancia a la Corrupción")+ ylim(50, 90)