TEST EXACTO DE FISHER
La prueba de Fisher es el test exacto utilizado cuando se quiere estudiar si existe asociación entre dos variables cualitativas, es decir, si las proporciones de una variable son diferentes dependiendo del valor que adquiera la otra variable. En la gran mayoría de casos, el test de Fisher se aplica para comparar dos variables categóricas con dos niveles cada una (tabla 2x2). Es posible utilizarlo con tablas 2xK niveles pero los requerimientos de cálculo son altos.
## Cell Contents
## |-------------------------|
## | Count |
## |-------------------------|
##
## ==============================
## Trabajo la semana pasada
## Sexo Si No Total
## ------------------------------
## Hombre 1772 1334 3106
## ------------------------------
## Mujer 1468 1990 3458
## ------------------------------
## Total 3240 3324 6564
## ==============================
EJEMPLO
Se quiere estudiar si el sexo de una determinada poblacion en nuestro estudio y el hecho de que hayan o no trabajado la semana anterior están relacionados. Para ello se realiza un test sobre grupo de individuos seleccionados al azar ¿Existe un diferencia significativa en la incidencia de haber trabajado la semana pasada entre hombres y mujeres?
CONDICIONES DEL TEST
Independencia: las observaciones de la muestra deben ser independientes unas de otras.
Las frecuencias marginales de columnas y filas tienen que ser fijas. Si esta condición no se cumple, el test de Fisher deja de ser exacto.
## a b
## 1 Mujer Si
## 2 Mujer No
## 3 Hombre Si
## 4 Mujer Si
## 5 Mujer Si
## 6 Hombre Si
## [1] 363 2
## N: 6564
## n: 363
###tamaño de muestra <10% de la poblacion
n < 0.1*N
## [1] TRUE
Tabla de contingencia:
## Cell Contents
## |-------------------------|
## | Count |
## |-------------------------|
##
## ============================
## Trabajo la semana pasada
## Sexo Si No Total
## ----------------------------
## Hombre 75 91 166
## ----------------------------
## Mujer 96 101 197
## ----------------------------
## Total 171 192 363
## ============================
HIPÓTESIS
\(H_0:\) Las variables son independientes por lo que una variable no varía entre los distintos niveles de la otra variable.
\(H_a:\) Las variables son dependientes, una variable varía entre los distintos niveles de la otra variable.
#test de fisher
fisher.test(tabla,alternative = "two.sided")
##
## Fisher's Exact Test for Count Data
##
## data: tabla
## p-value = 0.5275
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 0.5609167 1.3398459
## sample estimates:
## odds ratio
## 0.8674448
Fuerza de asociación (tamaño del efecto)
Dado que el test de Fisher contrasta si las variables están relacionadas, al tamaño del efecto se le conoce como fuerza de asociación. Existen múltiples medidas de asociación, entre las que destacan phi o Cramer’s V. Los límites empleados para su clasificación son:
pequeño: 0.1
mediano: 0.3
grande: 0.5
#fuerza de asociacion
assocstats(tabla)
## X^2 df P(> X^2)
## Likelihood Ratio 0.45593 1 0.49953
## Pearson 0.45572 1 0.49963
##
## Phi-Coefficient : 0.035
## Contingency Coeff.: 0.035
## Cramer's V : 0.035
Interpretacion:
Como se puede observar hay evidencias significativas para no rechazar la H0 y considerar que las dos variables no están relacionadas, por tanto las variables son independientes. El tamaño de la fuerza de asociación (tamaño de efecto) cuantificado por phi o Cramer’s V es pequeño.