Se quiere conocer si hay diferencias en el marcaje que utiliza el sexo masculino respecto al sexo femenino. La matriz con las frecuencias absolutas resultado de la combinación de la dos variables sería:

load("c:/Users/jlosa/Dropbox/Artículos/cosas/Dataset.RData")
x <- xtabs( ~ genero + marcaje, data = Dataset)
x
##            marcaje
## genero      individual zonal combinado
##   masculino         44    44       360
##   femenino          87    40       321

Las proporciones respecto al total de la tabla, el 4,9% del sexo masculino han utilizado un marcaje individual, un 4,9% zonal y un 40,17% combinado,mientras que en el sexo femenino ha sido un 9,7% individual, 4,4% zonal y un 35,8% combinado.

prop.table(table(Dataset$genero, Dataset$marcaje))
##            
##             individual      zonal  combinado
##   masculino 0.04910714 0.04910714 0.40178571
##   femenino  0.09709821 0.04464286 0.35825893

Proporciones sobre la variable genero. En los equipos masculinos el 9,8% ha realizado un marcaje individual, un 4,91% zonal y un 80,35% combinado. En el caso de equipos femeninos, un 19,41% ha sido individual, un 8,92% zonal y un 71,65% combinado.

prop.table(table(Dataset$genero, Dataset$marcaje),1)
##            
##             individual      zonal  combinado
##   masculino 0.09821429 0.09821429 0.80357143
##   femenino  0.19419643 0.08928571 0.71651786

Respecto a la variale marcaje, de todo el marcaje individual el genero masculino ha realizado un 33,58% y el femenino un 66,41%. En el caso del marcaje zonal, el genero masculino lo realizó en un 52,38%. mientras que el femenino en un 47,61%. Finalmente, el marcaje combinado se distribuye en un 52,86% para el sexo masculino y un 47,13% para el femenino.

prop.table(table(Dataset$genero, Dataset$marcaje),2)
##            
##             individual     zonal combinado
##   masculino  0.3358779 0.5238095 0.5286344
##   femenino   0.6641221 0.4761905 0.4713656

El diagrama de asociación, muestra una falta de marcaje individual en el genero masculino sobre lo que se esperaría si las dos variables no tuvieran relación. Es decir el marcaje individual está asociado negativamente con el genero masculino y positivamente con el genero femenino. Respecto al marcaje zonal existe un exceso en los equipos masculinos y un defecto en los femeninos. Por lo tanto, el marcaje zonal está asociado positivamente con el genero masculino, y negativamente con el genero femenino. Finalmente, el marcaje combinado está asociado positivamente con los equipos masculinos y negativamente con los equipos femeninos.

assocplot(table(Dataset$genero,Dataset$marcaje), main = "Relación entre genero y marcaje")

Se realiza un contraste de independencia. Se obtiene un p-valor de 0.0002563 (menor a 0.05), por lo tanto, se rechaza la hipótesis nula de que no hay diferencias en el número de atacantes utilizados en función del genero.

chisq.test(table(Dataset$genero,Dataset$marcaje))
## 
##  Pearson's Chi-squared test
## 
## data:  table(Dataset$genero, Dataset$marcaje)
## X-squared = 16.538, df = 2, p-value = 0.0002563
library( "vcd" )
## Loading required package: grid
assocstats(x)
##                     X^2 df   P(> X^2)
## Likelihood Ratio 16.805  2 0.00022433
## Pearson          16.538  2 0.00025628
## 
## Phi-Coefficient   : NA 
## Contingency Coeff.: 0.135 
## Cramer's V        : 0.136

Se han obtenido resultados significativos e interesa conocer en qué niveles de las variables se han encontrado las relaciones.

Pruebas post hoc

Primera opción: ver los valores residuales de Pearson. Los valores residuales son las diferencias entre los valores observados y esperados, y si estos se dividen por la raíz de los esperados se obtienen los residuales de Pearson. Estos valores se estandarizan y se pueden comparar con la normal (por ejemplo, si supera 1.96 es significativo a un nivel de 0.05)

residuales

##            marcaje
## genero      individual      zonal  combinado
##   masculino -2.6565489  0.3086067  1.0567592
##   femenino   2.6565489 -0.3086067 -1.0567592

residuales ajustados

##            marcaje
## genero      individual      zonal  combinado
##   masculino -4.0658944  0.4584546  3.0508849
##   femenino   4.0658944 -0.4584546 -3.0508849

Esta opción permite ver de manera visual (y no muy exacta) qué valores tienen más peso en el estadístico.

Segunda opcion: partir la tabla en varias tablas 2x2 y para cada una calcular una prueba \(\chi^2\) de Pearson corrigiendo la significación.

Para corregir la significación se puede utilizar Bonferroni dividiendo el nivel de significación \(\alpha\) entre el número de comparaciones k que se realizan. Se utiliza un valor de k menos restrictivo (Agresti, 2002; Anderson, 2014; University, 2014), es decir, un valor que no reduzca tanto el nivel de significación (DeVries, 2007).

\[k = \frac{{r*c}}{4}\]

El valor de alfa es \(\frac{\alpha }{k}\)

## [1] 0.01666667

con el género y las categoría individual-zonal del tipo de marcaje

##            marcaje
## genero      individual zonal
##   masculino         44    44
##   femenino          87    40
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  marcaje12
## X-squared = 6.7195, df = 1, p-value = 0.009537

con el género y las categorías individual-combinado del del tipo de marcaje

##            marcaje
## genero      individual combinado
##   masculino         44       360
##   femenino          87       321
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  marcaje13
## X-squared = 15.567, df = 1, p-value = 7.964e-05

con el género y las categorías zonal-combinado del del tipo de marcaje

##            marcaje
## genero      zonal combinado
##   masculino    44       360
##   femenino     40       321
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  marcaje23
## X-squared = 1.1899e-30, df = 1, p-value = 1