Analisis Para Futbol
Descriptivo
Tenemos los siguientes datos:
Para todas las variables se realizo prueba chi cuadrado para ver si habia diferencias significativas en sus frecuencias, todos los valores p hallados son menores que 0.05, lo que indica que no existen diferencias en ninguna variable.
Adquirida hace más de 5 años | Congénita | No tiene ninguna discapacidad visual | Perdida progresiva de la visión | NA | |
---|---|---|---|---|---|
Entre.19.y.23.años | 1 | 1 | 0 | 1 | 0 |
Entre.24.y.30.años | 0 | 0 | 1 | 0 | 0 |
Entre.30.y.36.años | 0 | 0 | 1 | 0 | 0 |
Mayor.de.37.años | 1 | 4 | 0 | 0 | 0 |
NA. | 0 | 0 | 0 | 0 | 1 |
Analisis de correspondencias multiples
Para ver como se relacionaron las variables sociodemograficas con las del orden psicologico, aplicamos la tecnica de analisis de correspondencia multiple, las variables a usar son:
[1] "Discapacidad congenita adquirida"
[2] "Tiempo de practica F5"
[3] "Horas de entrenamiento a la semana"
[4] "Entrenamientos adicionales"
[5] "Experiencia previa en otros deportes"
[6] "Localidad que reside"
[7] "Estrato socioeconomico"
[8] "Nivel educativo completo"
[9] "Estado civil actual"
[10] "Salario mensual"
[11] "Tiempo de transporte al entrenamiento"
[12] "Plan nutricional"
[13] "Cuantas horas duerme al dia"
[14] "Cuantas veces come al día"
[15] "BAREMOS_ESTRES"
[16] "BAREMOS EVALUACION DEL RENDIMIENTO"
[17] "BAREMOS MOTIVACION"
[18] "BAREMOS LA EVALUACIÓN HABILIDAD MENTAL"
[19] "BAREMOS COHESION DE EQUIPO"
[20] "Discapacidad congenita adquirida"
Convenciones
Veamos las dimensiones y cuanto aportan a la explicacion de la varianza
Vemos ahora el analisis por cada aspecto psicologico evaluado
Ficha técnica: Mediante el análisis de correspondencia múltiple se analizan los resultados del nivel de distintas variables sociodemográficas, mediciones de cuestionarios psicológicos, junto con el grupo y la posición de juego. Las variables se seleccionaron según el criterio de los investigadores.
Technical Sheet: Through multiple correspondence analysis, the study examines the results of sociodemographic variables, psychological questionnaire measurements, group, and playing position. Variables were chosen according to the researchers’ criteria.
Analisis comparativo descriptivo
Ficha técnica: Los resultados del nivel de distintos tests de los jugadores de fútbol, según su grupo, se reportan como media y desviación estándar (DE). La normalidad y homocedasticidad de los datos se verificaron mediante la prueba de Shapiro-Wilk, obteniendo como resultado que no todos los casos presentaban una distribución normal. Para aquellos datos con normalidad, se aplicó la prueba t de Student, y los tamaños del efecto se calcularon mediante el coeficiente de Cohen’s d. La interpretación de este coeficiente es la siguiente: valores menores a 0.2 indican un efecto despreciable; 0.5, un efecto pequeño; 0.8, un efecto mediano; y valores mayores a 0.8, un efecto grande. Para los datos sin normalidad, las diferencias entre las distintas pruebas se analizaron mediante la prueba no paramétrica de Wilcoxon. Los tamaños del efecto se obtuvieron mediante el coeficiente de correlación Rank-Biserial ((r_b)). La interpretación de (r_b) es la siguiente: un valor cercano a 0 indica que no hay diferencias significativas entre los grupos; un (r_b) positivo indica que el grupo 1 tiende a tener rangos más altos en comparación con el grupo 2; y un (r_b) negativo indica que el grupo 1 tiende a tener rangos más bajos en comparación con el grupo 2.
Technical Sheet: The results of the level of different tests for soccer players, grouped by their team, are reported as mean and standard deviation (SD). Normality and homoscedasticity of the data were verified using the Shapiro-Wilk test, which revealed that not all cases followed a normal distribution. For data with normality, Student’s t-test was applied, and effect sizes were calculated using Cohen’s d. The interpretation of this coefficient is as follows:
< 0.2: negligible effect.
0.5: small effect.
0.8: medium effect.
> 0.8: large effect.
For data without normality, differences between tests were analyzed using the non-parametric Wilcoxon test. Effect sizes were obtained using the rank-biserial correlation coefficient (r_b), interpreted as follows:
r_b close to 0: no significant differences between groups.
Positive r_b: Group 1 tends to have higher ranks compared to Group 2.
Negative r_b: Group 1 tends to have lower ranks compared to Group 2.
Analisis de correlacion
Vemos ahora la correlacion entre las distintas variables cuantitativas
Los circulos nos dan el tamaño de la correlacion, entre mas angostos, es mas alta, si se tienen tonos rojos, se tiene correlacion positiva, para tonos azules, es negativa, tenemos a continuacion un grafico detallado:
Tomamos entonces la variables con alta correlacion y medimos, elegimos las variables que rpesentan alta correlacion mayor a 0.9
[1] "Body age" "Masa magra"
[3] "Masa grasa" "Masa corporal"
[5] "Masa Visceral" "Flight time (ms)"
[7] "Velocity (m/s)" "Jump height (cm)"
[9] "Power (W)" "Force (N)"
[11] "Jump height left (cm)" "Velocity left (m/s)"
[13] "Flight time left (ms)" "Jump height right (cm)"
[15] "Velocity right (m/s)" "Flight time right (ms)"
[17] "Mean velocity (km/h)" "Time (s)"
[19] "Velocidad Promedio (m/s)" "Tiempo total (s)"
Tomamos estas variables y volvemos a medir la correlacion entre ellas
Otra opcion de visualizacion es
Analisis PCA
Para las variables que presentan baja correlacion presentamos entonces el analisis PCA, diferenciado por dos grandes grupos en el priemro se encuentran defensores y arqueros, en el segundo atacantes y mediocampistas
resumen
Ficha técnica: Para identificar el perfil de cada test en los grupos, se utilizó el análisis de componentes principales (PCA). Las variables fueron escaladas y centradas (puntuación Z). Para definir el parámetro estadístico del PCA, se empleó el determinante de la matriz de correlación de Kendall. En ambos casos, se obtuvo un valor cercano a 0, lo que indica alta multicolinealidad y sugiere que las variables tienen relaciones lineales significativas entre sí, con la mayor parte de la variabilidad de los datos concentrada en las primeras tres dimensiones. Se consideraron valores propios mayores a 1 para la extracción de componentes principales. Se aplicó un método de rotación ortogonal Varimax para identificar la alta correlación de los componentes y garantizar que cada componente principal aportara información diferente. Se estableció un umbral de 0.5 en cada carga de PC para la interpretación. Se anexaron los valores asignados a cada observación de todos los deportistas y sus variables.
Technical Note: To identify the profile of each test across the groups, Principal Component Analysis (PCA) was utilized. The variables were scaled and centered (Z-score). The statistical parameter for the PCA was determined using the determinant of the Kendall correlation matrix. In both cases, a value close to 0 was obtained, indicating high multicollinearity and suggesting significant linear relationships among the variables, with most of the data variability concentrated in the first three dimensions. Eigenvalues greater than 1 were considered for the extraction of principal components. An orthogonal Varimax rotation method was applied to identify high correlations among the components and ensure that each principal component provided distinct information. A threshold of 0.5 was set for each PC loading for interpretation purposes. The values assigned to each observation for all athletes and their variables were included as an appendix.
Analisis cuali-cuanti
Finalmente usamos el APC(Analisis de componentes principales) para ver la relacion entre variables de test y los grupos de jugadores.
Ficha técnica:Para evaluar las variables cualitativas vs los grupos, se empleó el análisis de componentes principales (PCA). Las variables fueron estandarizadas mediante escalado y centrado (puntuación Z), se depuraron variables por medio de varianzas cercanas a cero y correlación entre las mismas.
Technical Sheet: To evaluate qualitative variables across groups, Principal Component Analysis (PCA) was used. Variables were standardized through scaling and centering (Z-score), and variables with near-zero variance or high correlation were filtered out.