Integrantes:

*Manuela Reyes

*Juan Sebastian Belalcazar Ramirez

Introducción:

El presente trabajo de estadística se enfoca en la evaluación de las características de los jugadores de fútbol, en particular, se analiza la influencia de la edad, pierna preferida y potencia de tiro en el desempeño de los jugadores. El objetivo principal es determinar cuál es la mejor combinación de estas variables para identificar al mejor tipo de jugador.

Para ello, se recopilaron datos de un grupo de jugadores de diferentes edades, con distintas piernas preferidas y niveles de potencia de tiro. A través de un análisis estadístico riguroso, se examinan las relaciones entre estas variables y se determina cuál es la combinación de edad, pierna preferida y potencia de tiro que se correlaciona más fuertemente con un mejor desempeño en el campo.

Este estudio es importante porque puede proporcionar información valiosa para los entrenadores, quienes pueden utilizar los resultados para identificar y desarrollar el talento de los jugadores, y así mejorar el rendimiento de su equipo. Además, los resultados del estudio pueden ser de interés para los aficionados al fútbol y para aquellos que estén interesados en el análisis de datos deportivos.

Objetivo General:

Evaluar las características de los jugadores de fútbol, a partir de la edad, pierna preferida y potencia de tiro, para determinar cuál es la mejor combinación de estas variables que identifica al mejor tipo de jugador.

Objetivos Especificos:

*Recopilar datos de un grupo de jugadores de diferentes edades, con distintas piernas preferidas y niveles de potencia de tiro.

*Realizar un análisis estadístico de las variables edad, pierna preferida y potencia de tiro.

*Identificar cuál es la combinación de edad, pierna preferida y potencia de tiro que se correlaciona más fuertemente con un mejor desempeño en el campo.

*Proporcionar información útil para los entrenadores para la identificación y desarrollo del talento de los jugadores.


Analisis estadistico:

Adentro del los datos obtenidos se encuentran 4207 jugadres que tienen como preferida su pierna izquierda y 13984 su pierna derecha, teniendo en cuenta que la base de datos cuenta con 18208 datos los porcentajes correspondientes a estas dos variables serian las siguientes:

Izquierda: 23.105%

Derecha: 76.801 %

Estos nos deja en evidencia que hay una tendencia marcada hacia el lado de los jugaodres que prefieren su pierna Derecha

En la variable de edad obtenemos que la media es de 25 años. estos nos dice que en sumayoria los jugadores son de una edad media baja, pero no avanzada,considerando que la edad minima encuestada es 15 y la maxima 43, cosa a tener en consideracion y observación, ya qie, la potencia tambien puede ser influida por la edad de los jugadores.

Para la potencia de tiro obtenemos una media de 71 entre los jugadores, siendo la maxima potencia de tiro 95 y la minima 48, estos nos indica que una buena potencia de tiro tirando a regular. que tambien la puede influir los factores de la edad de los jugadores.

Analisis Grafico:

Grafica Edad vs Pierna Preferida

En el siguiente grafico de puede evidencias la edad de los distintos jugadosres junto con la pierna a usar de su eleccion, se ve hay datos atipicos, siendo mas en los jugadores que elijen usar la pierna derecha, aproximandamente el 50% de los futbolistas de pierna izquierda son menores a 25 años, siendo el mismo caso para los que elijen la pierna derecha, siendo estas dos opciones bastante iguales en terminos de edad y pierna elegida, menos los datos atipicos que presentan cada uno de estos.Se concluye que son mayores los jugadores de pierna derecha si tenemose en cuenta los datos atipicos.


Grafica Potencia de Tiro vs Pierna Preferida

En el anterior grafico se evidencias muchos mas datos atipicos, pero se mantiene constante la pierna derecha en la que mas jugadores tiene con dichos valores, tambien se puede decir que en ambos casos mas del 50% de los juagores independiente de su pierna tienen mas de 70 en potencia de tiro, pero siendo la pierna derecha la que mas posee, de aqui se puede concluir que la pierna derecha posee los jugadores que mayor y menor potencia tienen (Incluyendo los datos atipicos).


Grafica Potencia de Tiro vs Edad

Del anterior grafico de dispersion de puede evidenciar que los datos son muy variables, pero si se resalta que en algunos casos a mayor edad menor potencia de tiro y a menor edad mayor de la misma, aunque sigue considerandose una afirmacion poco viables dada la dispersion de los datos y su elevada variabilidad e inconsistencia, como el los jugadores de aproximadamente 33 años, que pueden presentar la minima potencia, pero tambien la maxima, intermedia y asi sucesivamente.


Estadistica Inferencial

Intervalos de confinza para la media

x1 = Data$"Age" 

#IC para la media
t.test(x1,coef.level = 0.95)$conf.int
## [1] 25.05437 25.19004
## attr(,"conf.level")
## [1] 0.95
Nos arroja que el intervalo de canfianza entre los valores 25.05437 y 25.19004, con un nivel de confianza del 95%, osea que hay muchas posibilidades que que el valor medio real de las edades de los jugadores este entre estos dos valores,osea que el 95% de las veces estará y el 5% restante no estará ahi acotado.Pero se analiza que nos da un intervalo muy cerrado, teniendo en cuenta que la edad esta dada por valores enteros positivos nos deja ver que la edad media de los jugadores en teoría si seria 25.
x2 = Data$Potencia_Tiro 

#IC para la media
t.test(x2,coef.level = 0.95)$conf.int
## [1] 71.21816 71.39644
## attr(,"conf.level")
## [1] 0.95
Aqui nos sucede algo muy parecido al enterior intervalo de confianza, ya que, la potencia de tiro tambien esta dada por valores enteros positivos, y el interevalo que nos arroja es 71.21816 y 71.39644, por lo que igualmente el 95% de las veces la potencia de tiro de los jugadores estará en ese intervalo y el 5% de las veces no, pero se puede deducir teoricamente que la potencia en 71 por lo anterior mencionado.

Intervalos de confinza para la proporción

#IC para la proporción
m = length((Data$Pierna_Preferida ~ Data$Age)[Data$Pierna_Preferida == "Left"])
n = nrow(Data)
prop.test(m,n,conf.level = 0.95)$conf.int
## [1] 0.2264412 0.2387680
## attr(,"conf.level")
## [1] 0.95
El intervalo de confianza obtenido es [0.2264412, 0.2387680]. Esto significa que,con un nivel de confianza del 95%, podemos afirmar que la proporción de personas cuya pierna preferida es “Left” en el conjunto de datos se encuentra entre el 22.64% y el 23.88%.Tambien tenemos que el nivel de confianza utilizado en el cálculo del intervalo es del 95%, esto implica que si se repitiera el muestreo y se calculara un nuevo intervalo de confianza en múltiples ocasiones, se espera que el 95% de esos intervalos contengan el verdadero valor de la proporción de personas con pierna preferida “Left” en el conjunto de datos.en base a los resultados obtenidos, podemos concluir que, con un nivel de de personas con pierna preferida “Left” en el conjunto de datos se estima estar entre el 22.64% y el 23.88%. confianza del 95%, la proporción

Pruebas de Hipotesis

Hipotesis nula(H0): La media de edad de los jugadores de futbol es igual a 23 años
Hipotesis alternativa(H1): La media de edad de los jugadores de futbol es mayor a 23 años
x = Data$Age
t.test(x, mu = 23, alternative = "greater")
## 
##  One Sample t-test
## 
## data:  x
## t = 61.319, df = 18206, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 23
## 95 percent confidence interval:
##  25.06528      Inf
## sample estimates:
## mean of x 
##  25.12221
Se realizo la prueba con un nivel de significancia de 0.05, se obtuvo en p-value de 2.2e-16, lo que indica que la probabilidad de obtener una media de muestra al menos tan extrema como la observada, asumiendo que que la hipotesis nula es verdadera, es esencialmente nula.

En base a estos resultados, podemos concluir que hay evidencia para rechazar la hipótesis nula de que la media de la edad de los jugadores de fútbol es estadística significativa igual a 23. Los resultados sugieren que la media de la edad es Además, el intervalo de confianza del 95% calculado también respalda esta conclusión, ya que el significativamente mayor que 23. límite inferior del intervalo es mayor que 23.

Hipotesis nula(H0): La media de Potencia de tiro de los jugadores de futbol es igual a 69
Hipotesis alternativa(H1): La media de Potencia de tiro de los jugadores de futbol es mayor a 69
x = Data$Potencia_Tiro
t.test(x, mu = 69, alternative = "greater")
## 
##  One Sample t-test
## 
## data:  x
## t = 50.734, df = 18206, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 69
## 95 percent confidence interval:
##  71.23249      Inf
## sample estimates:
## mean of x 
##   71.3073
Se realiazó la prueba con un nivel de significancia de 0.05, se obtuvo en p-value de 2.2e-16, lo que indica que la probabilidad de obtener una media de muestra al menos tan extrema como la observada, asumiendo que que la hipotesis nula es verdadera, es esencialmente nula.
En base a estos resultados, podemos concluir que hay evidencia estadística significativa para rechazar la hipótesis nula de que la media de la potencia de tiro de los jugadores de fútbol es igual a 69. Los resultados sugieren que la media de la potencia de tiro es significativamente mayor que 69. Además, el intervalo de confianza del 95% calculado también respalda esta conclusión, ya que el límite inferior del intervalo es mayor que 69.

Promedios y desviaciones estandar de forma puntual cuantitativa

## La proporción puntual de la potencia de tiro es 71.3073 y la desviacion estandar es
##      6.136496 .
## La proporción puntual de la Edad  es 25.12221 y la desviacion estandar es
##      4.669943 .

Con base en los datos proporcionados, se puede concluir que la proporción puntual de la potencia de tiro es de 71.3073, lo cual indica el valor medio o promedio de la potencia de tiro en la muestra analizada. La desviación estándar de 6.136496 muestra la dispersión o variabilidad de los datos alrededor de la proporción puntual. Cuanto mayor sea la desviación estándar, mayor será la variabilidad de los datos.

Por otro lado, la proporción puntual de la edad es de 25.12221, lo que indica el valor medio o promedio de la edad en la muestra. La desviación estándar de 4.669943 muestra la dispersión o variabilidad de los datos de edad alrededor de la proporción puntual.

En ambos casos, es importante tener en cuenta que la desviación estándar nos brinda información sobre la dispersión de los datos, pero no nos indica la dirección de dicha dispersión. Es decir, no podemos determinar si los valores están dispersos alrededor de la proporción puntual en una distribución simétrica o si hay asimetría en los datos.

En resumen, los valores proporcionados nos dan una idea de la proporción puntual y la variabilidad de los datos tanto en potencia de tiro como en edad. Estos resultados son útiles para comprender y analizar la distribución de los datos en el contexto específico del estudio.


Conclusión

En conclusión, el análisis estadístico reveló que en la base de datos de FIFA, los jugadores con mayor potencia de tiro tienden a ser jóvenes y tener habilidad dominante en la pierna derecha. Esto sugiere que existe una correlación significativa entre la edad y la pierna dominante en relación con la potencia de tiro de los jugadores.

Esta conclusión indica que los jugadores más jóvenes tienen una mayor capacidad para desarrollar y potenciar su tiro en comparación con los jugadores más viejos. Además, la preferencia por la pierna derecha como dominante puede ser un factor determinante en la habilidad de un jugador para generar una mayor potencia al disparar.

Estos hallazgos pueden ser valiosos para los entrenadores y reclutadores de equipos de fútbol, ya que pueden enfocar su atención en jugadores jóvenes con habilidad dominante en la pierna derecha, con el objetivo de mejorar el rendimiento del equipo en términos de potencia de tiro.

Sin embargo, es importante tener en cuenta que este análisis se basa únicamente en la base de datos de FIFA y puede no ser representativo de la población general de jugadores de fútbol en todo el mundo. Además, existen otros factores individuales y contextual es que pueden influir en la potencia de tiro de un jugador, como la técnica, la fuerza física y la experiencia en el juego.

Basado en el análisis estadístico de los datos, se puede concluir que existe una tendencia clara en la base de datos que indica que la pierna derecha de los jugadores presenta una mayor potencia en comparación con la pierna izquierda. Esta conclusión se basa en el hecho de que mas del 70% de los datos corresponden a la potencia de tiro de la pierna derecha, mientras que solo entre 22.64% y el 23.88% corresponde a la pierna izquierda (dado el itervalo de confianaza para la proporción).

El desequilibrio en la distribución de los datos sugiere que la pierna derecha es más dominante en términos de potencia de tiro en los jugadores analizados. Sin embargo, es importante tener en cuenta que este análisis se basa en la proporción de datos disponibles y no en la totalidad de la población de jugadores. Por lo tanto, los resultados se limitan a la muestra específica utilizada en el estudio.

Para obtener conclusiones más sólidas y generalizables, sería recomendable realizar un estudio más amplio con una muestra representativa de jugadores. Además, se podrían considerar otros factores, como la técnica de tiro, el entrenamiento específico de cada pierna y las características individuales de los jugadores, para obtener una comprensión más completa de la potencia de tiro en cada pierna.