Analisis Bivariante

TEST EXACTO DE FISHER

La prueba de Fisher es el test exacto utilizado cuando se quiere estudiar si existe asociación entre dos variables cualitativas, es decir, si las proporciones de una variable son diferentes dependiendo del valor que adquiera la otra variable. En la gran mayoría de casos, el test de Fisher se aplica para comparar dos variables categóricas con dos niveles cada una (tabla 2x2). Es posible utilizarlo con tablas 2xK niveles pero los requerimientos de cálculo son altos.

##    Cell Contents 
## |-------------------------|
## |                   Count | 
## |-------------------------|
## 
## ==============================
##            Trabajo la semana pasada
## Sexo         Si     No   Total
## ------------------------------
##  Hombre    1772   1334    3106
## ------------------------------
##  Mujer     1468   1990    3458
## ------------------------------
## Total      3240   3324    6564
## ==============================

EJEMPLO

Se quiere estudiar si el sexo de una determinada poblacion en nuestro estudio y el hecho de que hayan o no trabajado la semana anterior están relacionados. Para ello se realiza un test sobre grupo de individuos seleccionados al azar ¿Existe un diferencia significativa en la incidencia de haber trabajado la semana pasada entre hombres y mujeres?

CONDICIONES DEL TEST

Independencia: las observaciones de la muestra deben ser independientes unas de otras.

Las frecuencias marginales de columnas y filas tienen que ser fijas. Si esta condición no se cumple, el test de Fisher deja de ser exacto.

Muestreo aleatorio.

##         a   b
## 1   Mujer  Si
## 2   Mujer  No
## 3  Hombre  Si
## 4   Mujer  Si
## 5   Mujer  Si
## 6  Hombre  Si

## [1] 363   2

Tamaño de la muestra < 10% de la poblacion.

## N:  6564 
## n:  363

###tamaño de muestra <10% de la poblacion
n < 0.1*N

## [1] TRUE

Tabla de contingencia:

##    Cell Contents 
## |-------------------------|
## |                   Count | 
## |-------------------------|
## 
## ============================
##            Trabajo la semana pasada
## Sexo        Si    No   Total
## ----------------------------
##  Hombre     75    91     166
## ----------------------------
##  Mujer      96   101     197
## ----------------------------
## Total      171   192     363
## ============================

HIPÓTESIS

\(H_0:\) Las variables son independientes por lo que una variable no varía entre los distintos niveles de la otra variable.

\(H_a:\) Las variables son dependientes, una variable varía entre los distintos niveles de la otra variable.

#test de fisher
fisher.test(tabla,alternative = "two.sided")

## 
##  Fisher's Exact Test for Count Data
## 
## data:  tabla
## p-value = 0.5275
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.5609167 1.3398459
## sample estimates:
## odds ratio 
##  0.8674448

Fuerza de asociación (tamaño del efecto)

Dado que el test de Fisher contrasta si las variables están relacionadas, al tamaño del efecto se le conoce como fuerza de asociación. Existen múltiples medidas de asociación, entre las que destacan phi o Cramer’s V. Los límites empleados para su clasificación son:

pequeño: 0.1
mediano: 0.3
grande: 0.5

#fuerza de asociacion
assocstats(tabla)

##                      X^2 df P(> X^2)
## Likelihood Ratio 0.45593  1  0.49953
## Pearson          0.45572  1  0.49963
## 
## Phi-Coefficient   : 0.035 
## Contingency Coeff.: 0.035 
## Cramer's V        : 0.035

Interpretacion:

Como se puede observar hay evidencias significativas para no rechazar la H0 y considerar que las dos variables no están relacionadas, por tanto las variables son independientes. El tamaño de la fuerza de asociación (tamaño de efecto) cuantificado por phi o Cramer’s V es pequeño.

Analisis Bivariante

Cristhian Sumba

02/09/2021