Se quiere conocer si hay diferencias en el marcaje que utiliza el sexo masculino respecto al sexo femenino. La matriz con las frecuencias absolutas resultado de la combinación de la dos variables sería:
load("c:/Users/jlosa/Dropbox/Artículos/cosas/Dataset.RData")
x <- xtabs( ~ genero + marcaje, data = Dataset)
x
## marcaje
## genero individual zonal combinado
## masculino 44 44 360
## femenino 87 40 321
Las proporciones respecto al total de la tabla, el 4,9% del sexo masculino han utilizado un marcaje individual, un 4,9% zonal y un 40,17% combinado,mientras que en el sexo femenino ha sido un 9,7% individual, 4,4% zonal y un 35,8% combinado.
prop.table(table(Dataset$genero, Dataset$marcaje))
##
## individual zonal combinado
## masculino 0.04910714 0.04910714 0.40178571
## femenino 0.09709821 0.04464286 0.35825893
Proporciones sobre la variable genero. En los equipos masculinos el 9,8% ha realizado un marcaje individual, un 4,91% zonal y un 80,35% combinado. En el caso de equipos femeninos, un 19,41% ha sido individual, un 8,92% zonal y un 71,65% combinado.
prop.table(table(Dataset$genero, Dataset$marcaje),1)
##
## individual zonal combinado
## masculino 0.09821429 0.09821429 0.80357143
## femenino 0.19419643 0.08928571 0.71651786
Respecto a la variale marcaje, de todo el marcaje individual el genero masculino ha realizado un 33,58% y el femenino un 66,41%. En el caso del marcaje zonal, el genero masculino lo realizó en un 52,38%. mientras que el femenino en un 47,61%. Finalmente, el marcaje combinado se distribuye en un 52,86% para el sexo masculino y un 47,13% para el femenino.
prop.table(table(Dataset$genero, Dataset$marcaje),2)
##
## individual zonal combinado
## masculino 0.3358779 0.5238095 0.5286344
## femenino 0.6641221 0.4761905 0.4713656
El diagrama de asociación, muestra una falta de marcaje individual en el genero masculino sobre lo que se esperaría si las dos variables no tuvieran relación. Es decir el marcaje individual está asociado negativamente con el genero masculino y positivamente con el genero femenino. Respecto al marcaje zonal existe un exceso en los equipos masculinos y un defecto en los femeninos. Por lo tanto, el marcaje zonal está asociado positivamente con el genero masculino, y negativamente con el genero femenino. Finalmente, el marcaje combinado está asociado positivamente con los equipos masculinos y negativamente con los equipos femeninos.
assocplot(table(Dataset$genero,Dataset$marcaje), main = "Relación entre genero y marcaje")
Se realiza un contraste de independencia. Se obtiene un p-valor de 0.0002563 (menor a 0.05), por lo tanto, se rechaza la hipótesis nula de que no hay diferencias en el número de atacantes utilizados en función del genero.
chisq.test(table(Dataset$genero,Dataset$marcaje))
##
## Pearson's Chi-squared test
##
## data: table(Dataset$genero, Dataset$marcaje)
## X-squared = 16.538, df = 2, p-value = 0.0002563
library( "vcd" )
## Loading required package: grid
assocstats(x)
## X^2 df P(> X^2)
## Likelihood Ratio 16.805 2 0.00022433
## Pearson 16.538 2 0.00025628
##
## Phi-Coefficient : NA
## Contingency Coeff.: 0.135
## Cramer's V : 0.136
Se han obtenido resultados significativos e interesa conocer en qué niveles de las variables se han encontrado las relaciones.
Pruebas post hoc
Primera opción: ver los valores residuales de Pearson. Los valores residuales son las diferencias entre los valores observados y esperados, y si estos se dividen por la raíz de los esperados se obtienen los residuales de Pearson. Estos valores se estandarizan y se pueden comparar con la normal (por ejemplo, si supera 1.96 es significativo a un nivel de 0.05)
residuales
## marcaje
## genero individual zonal combinado
## masculino -2.6565489 0.3086067 1.0567592
## femenino 2.6565489 -0.3086067 -1.0567592
residuales ajustados
## marcaje
## genero individual zonal combinado
## masculino -4.0658944 0.4584546 3.0508849
## femenino 4.0658944 -0.4584546 -3.0508849
Esta opción permite ver de manera visual (y no muy exacta) qué valores tienen más peso en el estadístico.
Segunda opcion: partir la tabla en varias tablas 2x2 y para cada una calcular una prueba \(\chi^2\) de Pearson corrigiendo la significación.
Para corregir la significación se puede utilizar Bonferroni dividiendo el nivel de significación \(\alpha\) entre el número de comparaciones k que se realizan. Se utiliza un valor de k menos restrictivo (Agresti, 2002; Anderson, 2014; University, 2014), es decir, un valor que no reduzca tanto el nivel de significación (DeVries, 2007).
\[k = \frac{{r*c}}{4}\]
El valor de alfa es \(\frac{\alpha }{k}\)
## [1] 0.01666667
con el género y las categoría individual-zonal del tipo de marcaje
## marcaje
## genero individual zonal
## masculino 44 44
## femenino 87 40
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: marcaje12
## X-squared = 6.7195, df = 1, p-value = 0.009537
con el género y las categorías individual-combinado del del tipo de marcaje
## marcaje
## genero individual combinado
## masculino 44 360
## femenino 87 321
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: marcaje13
## X-squared = 15.567, df = 1, p-value = 7.964e-05
con el género y las categorías zonal-combinado del del tipo de marcaje
## marcaje
## genero zonal combinado
## masculino 44 360
## femenino 40 321
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: marcaje23
## X-squared = 1.1899e-30, df = 1, p-value = 1