Diferencias del número de atacantes en el fútbol, en función del genero

Se inicia con una prueba global para conocer si hay relación entre las dos variables, género y nº de atacantes.

## 
##  Pearson's Chi-squared test
## 
## data:  x
## X-squared = 51.474, df = 2, p-value = 6.645e-12

En este caso, como el p-valor es menor a 0.05, por lo tanto exite una relación significativa. Se realiza un contraste para conocer la fuerza de asociación (tamaño del efecto) calculando los coeficientes phi, de contingencia y V de Cramer.

## Loading required package: grid
##                     X^2 df   P(> X^2)
## Likelihood Ratio 52.232  2 4.5499e-12
## Pearson          51.474  2 6.6452e-12
## 
## Phi-Coefficient   : NA 
## Contingency Coeff.: 0.233 
## Cramer's V        : 0.24

Se han obtenido resultados significativos e interesa conocer en qué niveles de la variable se han encontrado las relaciones.

Pruebas post hoc

Primera opción: ver los valores residuales de Pearson. Los valores residuales son las diferencias entre los valores observados y esperados, y si estos se dividen por la raíz de los esperados se obtienen los residuales de Pearson. Estos valores se estandarizan y se pueden comparar con la normal (por ejemplo, si supera 1.96 es significativo a un nivel de 0.05)

residuales

##            ataque
## genero             2-3        4-5   6 o más
##   masculino  0.1414214  2.9617444 -4.1164527
##   femenino  -0.1414214 -2.9617444  4.1164527

residuales ajustados

##            ataque
## genero            2-3       4-5  6 o más
##   masculino  0.202850  6.943969 -7.143872
##   femenino  -0.202850 -6.943969  7.143872

Esta opción permite ver de manera visual (y no muy exacta) qué valores tienen más peso en el estadístico.

Segunda opcion: partir la tabla en varias tablas 2x2 y para cada una calcular una prueba \(\chi^2\) de Pearson corrigiendo la significación.

Para corregir la significación se puede utilizar Bonferroni dividiendo el nivel de significación \(\alpha\) entre el número de comparaciones k que se realizan. Se utiliza un valor de k menos restrictivo (Agresti, 2002; Anderson, 2014; University, 2014), es decir, un valor que no reduzca tanto el nivel de significación (DeVries, 2007).

\[k = \frac{{r*c}}{4}\]

El valor de alfa es \(\frac{\alpha }{k}\)

## [1] 0.01666667

con el género y las categoría 1-2 del número de jugadores en ataque

##            ataque
## genero      2-3 4-5
##   masculino  13 335
##   femenino   12 235
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  ataque12
## X-squared = 0.21644, df = 1, p-value = 0.6418

con el género y las categorías 1-3 del número de jugadores en ataque

##            ataque
## genero      2-3 6 o más
##   masculino  13      100
##   femenino   12      201
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  ataque13
## X-squared = 2.8124, df = 1, p-value = 0.09354

con el género y las categorías 2-3 del número de jugadores en ataque

##            ataque
## genero      4-5 6 o más
##   masculino 335      100
##   femenino  235      201
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  ataque23
## X-squared = 50.416, df = 1, p-value = 1.244e-12