Por: Juan Martin Soto, Nicolas Ruiz y Juan Jose Giraldo.

IntroducciĂ³n

La UEFA Champions League es uno de los torneos de fĂºtbol mĂ¡s importantes del mundo, donde participan los clubes mĂ¡s destacados de Europa. En esta investigaciĂ³n se analizarĂ¡n las estadĂ­sticas de los jugadores que participaron en la temporada 2021-22, enfocĂ¡ndose principalmente en los goles anotados. El objetivo es identificar patrones, tendencias y caracterĂ­sticas de los jugadores en relaciĂ³n con su desempeño goleador, utilizando tĂ©cnicas de estadĂ­stica descriptiva. Este anĂ¡lisis permitirĂ¡ comprender mejor cĂ³mo se distribuyen los goles segĂºn la posiciĂ³n, el tipo de remate y la ubicaciĂ³n en el campo, aportando informaciĂ³n relevante para estudios deportivos y estrategias de rendimiento.

1. Indicar el conjunto de datos a trabajar, el tamaño de muestra y el nĂºmero de variables:

Conjunto de datos: El conjunto de datos corresponde a estadĂ­sticas de goles de jugadores de la UEFA Champions League de la temporada 2021-2022. Este dataset contiene informaciĂ³n detallada sobre el desempeño goleador de los futbolistas, incluyendo la cantidad total de goles anotados, los tipos de remates (pierna derecha, izquierda, cabeza, otros), la ubicaciĂ³n de los goles (dentro o fuera del Ă¡rea), y goles de penalti. Los datos permiten analizar quiĂ©nes fueron los mĂ¡ximos goleadores, los estilos de remate mĂ¡s frecuentes y la eficiencia goleadora de cada jugador en los partidos disputados.

Tamaño de muestra: 183 jugadores de distintos clubes europeos que participaron en la fase de grupos y etapas eliminatorias de la Champions League 2021-22.

NĂºmero de variables: 13 variables, enfocadas en informaciĂ³n de identificaciĂ³n del jugador (nombre, club, posiciĂ³n) y estadĂ­sticas detalladas de goles por tipo, ubicaciĂ³n y condiciĂ³n de penalti, asĂ­ como el nĂºmero de partidos jugados.

2. Describir cada variable, si es cuantitativa o cualitativa, sus escalas de mediciĂ³n y unidades de mediciĂ³n.

La siguiente tabla recoge las principales variables consideradas de jugadores de la Champions League 2021-22 en relaciĂ³n con sus goles. Entre ellas se encuentran datos de identificaciĂ³n como el Serial y el Player_name, informaciĂ³n contextual como el Club y la Position, asĂ­ como variables de rendimiento futbolĂ­stico relacionadas con la anotaciĂ³n de goles: Goals, Right_foot, Left_foot, Headers, Others, Inside_area, Outside_areas y Penalties. Finalmente, se incluye la variable Match_played, que indica el nĂºmero de partidos disputados por cada jugador. AdemĂ¡s de su definiciĂ³n, se presenta el tipo de variable, la escala de mediciĂ³n y la unidad correspondiente, lo cual facilita un anĂ¡lisis estadĂ­stico mĂ¡s preciso y organizado.

DescripciĂ³n de las variables del dataset de jugadores (Champions League 2021-22)
Variable DescripciĂ³n Tipo_de_variable Escala_de_mediciĂ³n Unidad_de_mediciĂ³n
Serial NĂºmero de identificaciĂ³n del jugador en el dataset Cualitativa Ordinal Nominal N/A
Player_name Nombre del jugador Cualitativa nominal Nominal Texto
Club Club al que pertenece el jugador Cualitativa nominal Nominal Texto
Position PosiciĂ³n en la que juega el futbolista (Forward, Midfielder, Defender) Cualitativa nominal Nominal Texto
Goals Total de goles anotados por el jugador en la Champions League 2021-22 Cuantitativa discreta RazĂ³n Goles
Right_foot Goles anotados con pierna derecha Cuantitativa discreta RazĂ³n Goles
Left_foot Goles anotados con pierna izquierda Cuantitativa discreta RazĂ³n Goles
Headers Goles anotados de cabeza Cuantitativa discreta RazĂ³n Goles
Others Goles anotados por otros mĂ©todos (ej. rebotes, tiros libres, fuera del Ă¡rea) Cuantitativa discreta RazĂ³n Goles
Inside_area Goles anotados dentro del Ă¡rea penal Cuantitativa discreta RazĂ³n Goles
Outside_areas Goles anotados fuera del Ă¡rea penal Cuantitativa discreta RazĂ³n Goles
Penalties Goles anotados de penalti Cuantitativa discreta RazĂ³n Goles
Match_played NĂºmero de partidos jugados por el jugador Cuantitativa discreta RazĂ³n Partidos

3. Analizar si el conjunto de datos presenta inconsistencias, errores de digitaciĂ³n, informaciĂ³n faltante, entre otros. Realizar entonces la limpieza y preprocesamiento de los datos.

Tras una revisiĂ³n detallada del conjunto de datos de los 183 jugadores goleadores que participaron en la Champions League 2021-22, se verificĂ³ que no existen errores de digitaciĂ³n, duplicados, valores faltantes o inconsistencias en las variables. Todos los nombres de jugadores, clubes, posiciones y estadĂ­sticas de goles se encuentran correctamente registrados, por lo que el conjunto de datos estĂ¡ listo para su anĂ¡lisis sin necesidad de limpieza adicional.

4. Realizar las estadĂ­sticas descriptivas de forma univariada, con los indicadores de tendencia central, dispersiĂ³n y posiciĂ³n.

##      serial           player_name          club           position 
##  Min.   : 1.00   Adamu      :  1   Chelsea   : 13   Defender  :32  
##  1st Qu.:43.00   Adeyemi    :  1   Villarreal: 12   Forward   :73  
##  Median :73.00   Aké        :  1   Liverpool : 11   Midfielder:78  
##  Mean   :55.02   Alaba      :  1   Man. City : 11                  
##  3rd Qu.:73.00   AlcĂ¡cer    :  1   Atalanta  : 10                  
##  Max.   :73.00   Alex Sandro:  1   Ajax      :  7                  
##                  (Other)    :177   (Other)   :119                  
##      goals          right_foot        left_foot        headers      
##  Min.   : 1.000   Min.   : 0.0000   Min.   :0.000   Min.   :0.0000  
##  1st Qu.: 1.000   1st Qu.: 0.0000   1st Qu.:0.000   1st Qu.:0.0000  
##  Median : 1.000   Median : 1.0000   Median :0.000   Median :0.0000  
##  Mean   : 2.022   Mean   : 0.9727   Mean   :0.694   Mean   :0.3279  
##  3rd Qu.: 2.000   3rd Qu.: 1.0000   3rd Qu.:1.000   3rd Qu.:1.0000  
##  Max.   :15.000   Max.   :11.0000   Max.   :8.000   Max.   :3.0000  
##                                                                     
##      others         inside_area     outside_areas      penalties     
##  Min.   :0.00000   Min.   : 0.000   Min.   :0.0000   Min.   :0.0000  
##  1st Qu.:0.00000   1st Qu.: 1.000   1st Qu.:0.0000   1st Qu.:0.0000  
##  Median :0.00000   Median : 1.000   Median :0.0000   Median :0.0000  
##  Mean   :0.02186   Mean   : 1.814   Mean   :0.2077   Mean   :0.1967  
##  3rd Qu.:0.00000   3rd Qu.: 2.000   3rd Qu.:0.0000   3rd Qu.:0.0000  
##  Max.   :1.00000   Max.   :13.000   Max.   :3.0000   Max.   :3.0000  
##                                                                      
##   match_played   
##  Min.   : 1.000  
##  1st Qu.: 5.000  
##  Median : 6.000  
##  Mean   : 6.842  
##  3rd Qu.: 8.000  
##  Max.   :13.000  
## 

5. Realizar algunos grĂ¡ficos para tener una visiĂ³n general de los datos.

El anĂ¡lisis de las grĂ¡ficas permite observar que la distribuciĂ³n de los goles en la UEFA Champions League 2021-2022 estuvo concentrada en un grupo reducido de jugadores. La mayorĂ­a de los futbolistas apenas lograron entre uno y dos tantos, mientras que solo unos pocos alcanzaron cifras significativamente mĂ¡s altas, llegando hasta un mĂ¡ximo de quince goles. Esto refleja una distribuciĂ³n asimĂ©trica positiva, donde el aporte goleador se encuentra fuertemente centralizado en determinados jugadores, que resultan determinantes para el desempeño de sus equipos.

En cuanto al tipo de remate, los resultados muestran una clara predominancia de la pierna derecha como recurso principal para anotar, seguida en menor medida por la pierna izquierda. Los goles de cabeza y aquellos anotados mediante otros mĂ©todos (como rebotes o tiros libres) fueron considerablemente menos frecuentes. Este patrĂ³n evidencia la importancia de los perfiles diestros en el fĂºtbol europeo y la necesidad de los equipos de contar con jugadores versĂ¡tiles que puedan definir de diferentes maneras.

Respecto a la ubicaciĂ³n de los goles, las grĂ¡ficas confirman que la mayorĂ­a se produjo dentro del Ă¡rea, lo cual demuestra que la cercanĂ­a al arco es un factor clave en la eficacia goleadora. Los tantos desde fuera del Ă¡rea y de penalti representaron una proporciĂ³n mucho menor, lo que sugiere que el juego ofensivo de la Champions League se caracteriza por la generaciĂ³n de oportunidades claras en espacios reducidos. Este hallazgo coincide con la tendencia moderna de un fĂºtbol mĂ¡s tĂ¡ctico, donde las defensas reducen los espacios y obligan a definir en situaciones rĂ¡pidas.

Finalmente, el anĂ¡lisis de los partidos jugados indica que, en promedio, los futbolistas disputaron entre seis y siete encuentros durante el torneo, cifra asociada a la fase de grupos. Sin embargo, no se encontrĂ³ una relaciĂ³n directa entre el nĂºmero de partidos jugados y la cantidad de goles anotados, ya que algunos jugadores con menos participaciĂ³n lograron ser altamente efectivos. Esto permite concluir que la eficiencia goleadora, mĂ¡s que la cantidad de minutos disputados, es lo que marca la diferencia en el rendimiento ofensivo de los jugadores.

IntroducciĂ³n

Como continuaciĂ³n del anĂ¡lisis iniciado en la primera entrega sobre los goles en la UEFA Champions League 2021-2022, esta segunda fase del trabajo tiene como objetivo profundizar en el estudio estadĂ­stico del conjunto de datos previamente depurado y descrito. En esta etapa, se busca pasar del anĂ¡lisis descriptivo a un enfoque relacional y predictivo, aplicando tĂ©cnicas estadĂ­sticas mĂ¡s avanzadas que permitan comprender las asociaciones entre variables e identificar posibles patrones de comportamiento en el desempeño goleador de los futbolistas.

1. AnĂ¡lisis con dos variables:

Seleccione 2 variables cuantitativas del conjunto de datos y estudie la correlaciĂ³n de pearson entre las 2 variables. Si tiene mĂ¡s variables cuantitativas realice la matriz de correlaciĂ³n. Interprete los resultados y acompañe de grĂ¡ficos de dispersiĂ³n. TambiĂ©n si usted lo considera plantee un modelo lineal simple e interprete el intercepto y la pendiente.

CorrelaciĂ³n de Pearson

InterpretaciĂ³n

La matriz de correlaciĂ³n muestra la relaciĂ³n lineal entre las variables cuantitativas relacionadas con los goles anotados por los jugadores en la UEFA Champions League 2021-2022. Los valores cercanos a 1 indican una correlaciĂ³n positiva fuerte, mientras que los valores cercanos a 0 reflejan una correlaciĂ³n dĂ©bil o inexistente.

El anĂ¡lisis permite destacar los siguientes hallazgos principales:

  1. Alta correlaciĂ³n entre los goles totales y los goles dentro del Ă¡rea (r = 0.97): Esto sugiere que la gran mayorĂ­a de los goles se anotan desde dentro del Ă¡rea penal, siendo esta la zona mĂ¡s determinante para la eficacia ofensiva.

## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.5034  0.1334  0.1334  0.2061  1.0051 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.06077    0.05197  -1.169    0.244    
## x            0.92736    0.01828  50.743   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4944 on 181 degrees of freedom
## Multiple R-squared:  0.9343, Adjusted R-squared:  0.934 
## F-statistic:  2575 on 1 and 181 DF,  p-value: < 2.2e-16

Intercepto (-0.06077): El intercepto representa el valor esperado de los goles dentro del Ă¡rea cuando el nĂºmero total de goles (x) es igual a cero. En este caso, el valor es -0.06077, lo cual no tiene un significado prĂ¡ctico en el contexto futbolĂ­stico, ya que no se pueden tener goles negativos. Sin embargo, indica que la recta pasa muy cerca del origen, lo que sugiere una relaciĂ³n directa y proporcional entre ambas variables.

Pendiente (0.92736): La pendiente indica el cambio promedio en los goles dentro del Ă¡rea por cada gol adicional total. En este caso, el valor 0.92736 significa que, por cada gol total que un jugador marca, aproximadamente el 92.7% proviene de dentro del Ă¡rea. Esto demuestra una fuerte dependencia positiva entre las dos variables: a mayor nĂºmero de goles, mayor nĂºmero de goles dentro del Ă¡rea.

  1. CorrelaciĂ³n fuerte entre los goles totales y los goles con pierna derecha (r = 0.74): Indica que los jugadores que anotan mĂ¡s goles tienden a hacerlo principalmente con la pierna derecha, lo que confirma el predominio de jugadores diestros en la competiciĂ³n.

  1. Correlaciones moderadas entre los goles totales y los goles con pierna izquierda (r = 0.55) y de penalti (r = 0.57): Aunque menores que las anteriores, estas correlaciones demuestran que ambas variables tambiĂ©n contribuyen de manera significativa al total de goles, pero en menor proporciĂ³n.

  2. Baja correlaciĂ³n entre los goles totales y los goles de cabeza (r = 0.47): Esto refleja que los goles de cabeza representan una fracciĂ³n menor del total, aunque mantienen cierta relevancia tĂ¡ctica en jugadas de balĂ³n aĂ©reo.

  3. Las correlaciones mĂ¡s bajas se observan con los goles fuera del Ă¡rea (r = 0.28) y con el nĂºmero de partidos jugados (r = 0.38): Esto implica que el nĂºmero de encuentros disputados no garantiza necesariamente un mayor nĂºmero de goles, y que los goles desde fuera del Ă¡rea son menos frecuentes en comparaciĂ³n con los realizados dentro del Ă¡rea.

En conjunto, los resultados evidencian que el rendimiento goleador en la Champions League 2021-22 depende principalmente de la capacidad de definir dentro del Ă¡rea y del uso efectivo de la pierna dominante, mientras que las demĂ¡s formas de anotaciĂ³n tienen un impacto complementario pero no determinante.

Seleccione 1 variable cuantitativa y 1 variable cualitativa y realice diagrama de cajas por grupos (x=Variable cualitativa, y= cuantitativa).

El diagrama de cajas muestra la distribuciĂ³n de los goles de cabeza segĂºn la posiciĂ³n de los jugadores (Defender, Forward y Midfielder). Se observa que tanto los defensas (Defender) como los delanteros (Forward) presentan una mediana similar de 1 gol de cabeza, mientras que los mediocampistas (Midfielder) tienden a anotar pocos o ningĂºn gol de cabeza, con valores concentrados en cero.

Esto refleja la lĂ³gica del juego:

Los defensas suelen anotar de cabeza en jugadas de pelota quieta (corners o tiros libres).

Los delanteros tambiĂ©n destacan en este tipo de acciones por su presencia en el Ă¡rea rival.

Los mediocampistas, por su posiciĂ³n mĂ¡s retrasada o funciones de creaciĂ³n, tienen menos oportunidades de anotar por esta vĂ­a.

Los valores atĂ­picos visibles (jugadores con 3 goles de cabeza) corresponden a casos excepcionales que confirman que, aunque la mayorĂ­a de futbolistas marcan pocos goles de cabeza, algunos especialistas destacan en este aspecto.

En conclusiĂ³n, los resultados muestran que el gol de cabeza es un recurso mĂ¡s frecuente entre defensas y delanteros, mientras que los mediocampistas tienen una contribuciĂ³n limitada en este tipo de anotaciĂ³n.

Seleccione 2 variables cualitativas y realice una tabla cruzada, acompañe de diagrama de barras apiladas.

## [1] "Tabla cruzada entre posicion y clubes"
##                   
##                    Defender Forward Midfielder
##   Ajax                    1       5          1
##   Atalanta                2       2          6
##   Atlético                1       4          1
##   Barcelona               1       1          0
##   Bayern                  0       4          3
##   Benfica                 2       4          0
##   BeÅŸiktaÅŸ                1       1          1
##   Chelsea                 5       2          6
##   Club Brugge             0       0          2
##   Dortmund                0       2          2
##   Dynamo Kyiv             0       0          1
##   Inter                   2       3          2
##   Juventus                1       5          1
##   Leipzig                 1       2          2
##   Liverpool               1       4          6
##   LOSC                    0       2          2
##   Malmö                   0       0          1
##   Man. City               3       2          6
##   Man. United             2       4          1
##   Milan                   1       3          1
##   Paris                   0       2          3
##   Porto                   0       1          1
##   Real Madrid             1       4          1
##   Salzburg                1       2          3
##   Sevilla                 0       1          3
##   Shakhtar Donetsk        0       0          1
##   Sheriff                 0       2          3
##   Sporting CP             2       3          2
##   Villarreal              2       4          6
##   Wolfsburg               0       1          2
##   Young Boys              1       2          3
##   Zenit                   1       1          5

La tabla cruzada entre las variables posiciĂ³n y club permite observar la distribuciĂ³n de los jugadores goleadores segĂºn su posiciĂ³n dentro de cada equipo. Se evidencia que la mayorĂ­a de los clubes presentan una mayor cantidad de mediocampistas y delanteros en comparaciĂ³n con defensas, lo que sugiere que los jugadores mĂ¡s ofensivos son quienes tienen mayor probabilidad de anotar goles.

Por ejemplo:

Equipos como Chelsea, Villarreal y Liverpool destacan por contar con un nĂºmero equilibrado de jugadores goleadores en todas las posiciones.

Otros clubes, como Juventus y Real Madrid, muestran una presencia mĂ¡s marcada de delanteros goleadores, coherente con su estilo ofensivo.

En cambio, equipos como Ajax o Atalanta reflejan una mayor participaciĂ³n goleadora de mediocampistas, lo que indica una estrategia mĂ¡s distribuida en ataque.

En general, la tabla y el diagrama de barras apiladas permiten identificar patrones de contribuciĂ³n ofensiva por posiciĂ³n, revelando que los goles en la Champions League 2021-22 provienen principalmente de delanteros y mediocampistas, mientras que los defensas tienen una incidencia menor, aunque relevante en acciones especĂ­ficas.