Name Jersey.Number Club Position
Length:571 Min. : 1.00 Length:571 Length:571
Class :character 1st Qu.: 8.00 Class :character Class :character
Mode :character Median :18.00 Mode :character Mode :character
Mean :19.53
3rd Qu.:27.00
Max. :82.00
NA's :8
Nationality Age Appearances Wins
Length:571 Min. :17.00 Min. : 0.00 Min. : 0.00
Class :character 1st Qu.:22.00 1st Qu.: 3.00 1st Qu.: 1.00
Mode :character Median :26.00 Median : 36.00 Median : 12.00
Mean :25.79 Mean : 68.82 Mean : 28.96
3rd Qu.:29.00 3rd Qu.:108.00 3rd Qu.: 41.00
Max. :38.00 Max. :539.00 Max. :272.00
NA's :1
Losses Goals Goals.per.match Headed.goals
Min. : 0.0 Min. : 0.000 Min. : 0.000 Min. : 0.000
1st Qu.: 1.0 1st Qu.: 0.000 1st Qu.: 0.050 1st Qu.: 0.000
Median : 14.0 Median : 1.000 Median : 0.140 Median : 0.000
Mean : 23.9 Mean : 7.327 Mean : 2.648 Mean : 1.414
3rd Qu.: 36.0 3rd Qu.: 6.000 3rd Qu.: 0.390 3rd Qu.: 1.000
Max. :158.0 Max. :180.000 Max. :57.000 Max. :31.000
NA's :262 NA's :69
Goals.with.right.foot Goals.with.left.foot Penalties.scored Freekicks.scored
Min. : 0.000 Min. : 0.000 Min. : 0.0000 Min. :0.0000
1st Qu.: 0.000 1st Qu.: 0.000 1st Qu.: 0.0000 1st Qu.:0.0000
Median : 1.000 Median : 0.000 Median : 0.0000 Median :0.0000
Mean : 4.468 Mean : 2.388 Mean : 0.9741 Mean :0.2913
3rd Qu.: 3.000 3rd Qu.: 2.000 3rd Qu.: 0.0000 3rd Qu.:0.0000
Max. :127.000 Max. :63.000 Max. :27.0000 Max. :8.0000
NA's :69 NA's :69 NA's :262 NA's :262
Shots Shots.on.target Shooting.accuracy.. Hit.woodwork
Min. : 0.0 Min. : 0.00 Length:571 Min. : 0.000
1st Qu.: 6.0 1st Qu.: 1.00 Class :character 1st Qu.: 0.000
Median : 41.0 Median : 12.00 Mode :character Median : 0.000
Mean :102.5 Mean : 36.92 Mean : 2.062
3rd Qu.:144.0 3rd Qu.: 47.00 3rd Qu.: 2.000
Max. :996.0 Max. :411.00 Max. :34.000
NA's :262 NA's :262 NA's :69
Big.chances.missed Clean.sheets Goals.conceded Tackles
Min. : 0.000 Min. : 0.00 Min. : 0.00 Min. : 0.0
1st Qu.: 0.000 1st Qu.: 0.00 1st Qu.: 0.25 1st Qu.: 5.0
Median : 2.000 Median : 6.00 Median : 40.00 Median : 45.0
Mean : 9.029 Mean : 16.69 Mean : 75.69 Mean :101.1
3rd Qu.: 11.000 3rd Qu.: 26.00 3rd Qu.:117.00 3rd Qu.:139.8
Max. :126.000 Max. :127.00 Max. :452.00 Max. :860.0
NA's :262 NA's :309 NA's :309 NA's :69
Tackle.success.. Last.man.tackles Blocked.shots Interceptions
Length:571 Min. : 0.000 Min. : 0.00 Min. : 0.00
Class :character 1st Qu.: 0.000 1st Qu.: 0.00 1st Qu.: 2.00
Mode :character Median : 0.000 Median : 7.00 Median : 26.00
Mean : 1.259 Mean : 20.55 Mean : 72.76
3rd Qu.: 1.000 3rd Qu.: 27.00 3rd Qu.: 99.25
Max. :24.000 Max. :230.00 Max. :618.00
NA's :378 NA's :69 NA's :69
Clearances Headed.Clearance Clearances.off.line Recoveries
Min. : 0.0 Min. : 0.00 Min. : 0.000 Min. : 0.00
1st Qu.: 3.0 1st Qu.: 1.00 1st Qu.: 0.000 1st Qu.: 10.25
Median : 31.0 Median : 13.00 Median : 0.000 Median : 174.00
Mean : 141.6 Mean : 69.91 Mean : 1.036 Mean : 326.91
3rd Qu.: 147.0 3rd Qu.: 68.00 3rd Qu.: 1.000 3rd Qu.: 512.25
Max. :2974.0 Max. :1155.00 Max. :10.000 Max. :2330.00
NA's :69 NA's :69 NA's :378 NA's :181
Duels.won Duels.lost Successful.50.50s Aerial.battles.won
Min. : 0.0 Min. : 0.0 Min. : 0.00 Min. : 0.00
1st Qu.: 12.0 1st Qu.: 12.0 1st Qu.: 2.00 1st Qu.: 3.00
Median : 154.5 Median : 145.5 Median : 21.00 Median : 28.50
Mean : 313.8 Mean : 275.9 Mean : 49.25 Mean : 99.76
3rd Qu.: 489.0 3rd Qu.: 408.8 3rd Qu.: 58.75 3rd Qu.: 130.00
Max. :1946.0 Max. :2223.0 Max. :415.00 Max. :1157.00
NA's :181 NA's :181 NA's :181 NA's :181
Aerial.battles.lost Own.goals Errors.leading.to.goal Assists
Min. : 0.00 Min. :0.0000 Min. : 0.0 Min. : 0.000
1st Qu.: 3.00 1st Qu.:0.0000 1st Qu.: 0.0 1st Qu.: 0.000
Median : 41.50 Median :0.0000 Median : 0.0 Median : 1.000
Mean : 84.85 Mean :0.4084 Mean : 1.1 Mean : 5.285
3rd Qu.:119.50 3rd Qu.:0.0000 3rd Qu.: 1.0 3rd Qu.: 6.000
Max. :562.00 Max. :6.0000 Max. :20.0 Max. :84.000
NA's :181 NA's :309 NA's :112
Passes Passes.per.match Big.chances.created Crosses
Min. : 0 Min. : 0.00 Min. : 0.000 Min. : 0.0
1st Qu.: 92 1st Qu.:11.26 1st Qu.: 0.000 1st Qu.: 2.0
Median : 1000 Median :25.01 Median : 3.000 Median : 20.5
Mean : 2310 Mean :25.90 Mean : 8.171 Mean : 121.9
3rd Qu.: 3285 3rd Qu.:37.97 3rd Qu.: 9.000 3rd Qu.: 107.8
Max. :17932 Max. :98.50 Max. :97.000 Max. :2247.0
NA's :69 NA's :69
Cross.accuracy.. Through.balls Accurate.long.balls Saves
Length:571 Min. : 0.000 Min. : 0.0 Min. : 0.0
Class :character 1st Qu.: 0.000 1st Qu.: 3.0 1st Qu.: 0.0
Mode :character Median : 2.000 Median : 59.0 Median : 20.0
Mean : 8.577 Mean : 184.9 Mean :150.5
3rd Qu.: 7.750 3rd Qu.: 228.5 3rd Qu.:195.0
Max. :156.000 Max. :1943.0 Max. :941.0
NA's :181 NA's :112 NA's :502
Penalties.saved Punches High.Claims Catches
Min. :0.000 Min. : 0.00 Min. : 0.00 Min. : 0.00
1st Qu.:0.000 1st Qu.: 0.00 1st Qu.: 0.00 1st Qu.: 0.00
Median :0.000 Median : 2.00 Median : 6.00 Median : 3.00
Mean :1.087 Mean : 24.65 Mean : 45.87 Mean : 20.78
3rd Qu.:2.000 3rd Qu.: 31.00 3rd Qu.: 45.00 3rd Qu.: 17.00
Max. :7.000 Max. :269.00 Max. :391.00 Max. :249.00
NA's :502 NA's :502 NA's :502 NA's :502
Sweeper.clearances Throw.outs Goal.Kicks Yellow.cards
Min. : 0.00 Min. : 0 Min. : 0.0 Min. : 0.000
1st Qu.: 0.00 1st Qu.: 0 1st Qu.: 0.0 1st Qu.: 0.000
Median : 4.00 Median : 39 Median : 53.0 Median : 3.000
Mean : 25.57 Mean : 210 Mean : 414.1 Mean : 7.918
3rd Qu.: 28.00 3rd Qu.: 300 3rd Qu.: 527.0 3rd Qu.:11.000
Max. :257.00 Max. :1516 Max. :2806.0 Max. :81.000
NA's :502 NA's :502 NA's :502
Red.cards Fouls Offsides
Min. :0.0000 Min. : 0.00 Min. : 0.00
1st Qu.:0.0000 1st Qu.: 1.00 1st Qu.: 0.00
Median :0.0000 Median : 22.00 Median : 2.00
Mean :0.3012 Mean : 53.03 Mean : 11.06
3rd Qu.:0.0000 3rd Qu.: 74.00 3rd Qu.: 8.75
Max. :5.0000 Max. :438.00 Max. :203.00
NA's :69
[1] "en estre trabajo final estaremos usando una base de datos de jugadores de la Premier League. Esta contiene información sobre posición, nacionalidad, edad, goles, porterías imbatidas, pases, goles concedidos, apariciones, club, número de camiseta, entre otros. El conjunto de datos incluye 571 jugadores y 59 variables."
[1] "En esta parte se exploraremos un análisis estadístico de distintos aspectos relacionados con los jugadores y equipos de la Premier League. A través de visualizaciones gráficas elaboradas en R, se examinan variables como nacionalidad, número de jugadores por club, cantidad de apariciones, pases realizados, goles concedidos, arcos en cero y distribución de números de camiseta. Este enfoque permite identificar patrones y tendencias dentro de la liga, facilitando una comprensión más profunda sobre la composición y desempeño de los jugadores. Las gráficas presentadas no solo ilustran la diversidad y dinámica competitiva del torneo, sino que también reflejan cómo los datos pueden revelar comportamientos colectivos y diferencias individuales relevantes en el fútbol profesional."
[1] "🔹 nacionalidad vs frecuencia "
[1] "Esta gráfica muestra la distribución de nacionalidades de los jugadores de la Premier League. Como se puede observar, Inglaterra es el país con mayor representación, con más de 200 jugadores, lo cual es lógico al ser la liga local. Le siguen Francia, España y Brasil, con una participación significativamente menor. La gráfica también evidencia la diversidad internacional de la liga, incluyendo jugadores de países de todos los continentes, aunque en menor proporción. Esta diversidad refleja el carácter global de la Premier League y su capacidad para atraer talento de todo el mundo."
[1] "🔹 Jugadores vs club"
[1] "Esta gráfica muestra la cantidad de jugadores registrados por cada club de la Premier League. Se observa que equipos como Liverpool, Brighton y Tottenham tienen plantillas más amplias, con más de 30 jugadores. En contraste, clubes como Wolverhampton y Southampton tienen plantillas ligeramente más reducidas. Esta diferencia puede deberse a factores como estrategias deportivas, presupuesto, o participación en competiciones internacionales que exigen una mayor rotación de jugadores. En general, la mayoría de los equipos mantienen una plantilla equilibrada, con pequeñas variaciones."
[1] "🔹 Jugadores vs pases"
[1] "Aquí se analiza la cantidad de goles recibidos por los equipos/jugadores. Al igual que en los arcos en cero, la mayoría de los jugadores están asociados con cifras bajas, y solo algunos acumulan un alto número de goles concedidos, probablemente defensores o arqueros con más minutos jugados."
[1] "🔹 Jugadores vs Apariciones en Partido"
[1] "La gráfica indica cuántos partidos ha jugado cada jugador. La mayoría ha tenido pocas apariciones, lo cual puede incluir suplentes, jugadores juveniles o recién fichados. Solo unos pocos jugadores tienen un número muy alto de partidos, lo que los señala como titulares habituales."
[1] "🔹 Jugadores vs Número de Camiseta"
[1] "En esta gráfica se representan los números de camiseta utilizados por los jugadores, diferenciando entre números pares e impares. Se nota una mayor concentración en los números del 1 al 30, que suelen ser los más usados. No hay una diferencia significativa entre números pares e impares, aunque sí es notorio que los números más altos son poco comunes."
[1] "se tuvo que hacer un summary de los datos ya que la ram del programa no pudo leerlos todos por completo, mas sin embargo en la matriz se analizaron las variables Goals, Passes, Age y Appearances.Se observa una correlación positiva moderada entre Goals y Passes, lo cual sugiere que los jugadores que marcan más goles también suelen tener una mayor participación en el juego ofensivo a través de los pases.La variable Age muestra una correlación débil con Goals y Passes, lo que indica que la edad no es un factor determinante en el rendimiento ofensivo dentro de este conjunto de datos.Appearances (apariciones) tiene una correlación positiva tanto con Goals como con Passes, lo cual es lógico: los jugadores que participan en más partidos tienen más oportunidades de anotar y asistir.las correlaciones obtenidas no son extremadamente altas, lo que indica que no hay dependencia fuerte entre las variables, pero sí hay tendencias importantes que permiten plantear modelos predictivos simples."
[1] 0.3966698
[1] "El gráfico de dispersión muestra una relación positiva entre los goles y los pases de los jugadores, lo que indica que, en general, quienes tienen mayor participación ofensiva también tienden a anotar más. La línea de regresión refuerza esta tendencia, mostrando que hay una conexión lineal entre ambas variables, aunque no perfecta, lo cual es lógico dado que influyen otros factores en el rendimiento individual.\n"
Call:
lm(formula = Passes ~ Goals, data = datos_filtrados)
Residuals:
Min 1Q Median 3Q Max
-8917.5 -1768.5 -1249.0 671.3 13949.3
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1768.995 131.184 13.48 <2e-16 ***
Goals 73.792 7.159 10.31 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2873 on 569 degrees of freedom
Multiple R-squared: 0.1573, Adjusted R-squared: 0.1559
F-statistic: 106.2 on 1 and 569 DF, p-value: < 2.2e-16
[1] "La correlación de Pearson entre Goals y Passes fue `r round(correlacion, 2)`, indicando una relación positiva. El modelo lineal indica que por cada gol adicional, se generan `r round(coef(modelo)[2], 2)` pases en promedio. El intercepto estimado es `r round(coef(modelo)[1], 2)`."
Bosnia And Herzegovina Brazil Cote D'Ivoire Egypt England France
Defender 1 2 0 0 2 1
Forward 0 2 1 0 2 1
Goalkeeper 0 0 0 0 1 0
Midfielder 0 0 0 1 4 1
Gabon Germany Greece Iceland Scotland Spain Switzerland Uruguay
Defender 0 1 1 0 1 1 0 0
Forward 1 0 0 0 0 0 0 0
Goalkeeper 0 1 0 1 0 0 0 0
Midfielder 0 1 0 0 0 1 1 1
[1] "En el diagrama de barras, muestra la distribución de nacionalidades por posición en el equipo Arsenal, podemos ver en el diagrama que los defensores tienen una gran diversidad de nacionalidad, destacando Inglaterra, Alemania y Brasil; En los delanteros predominan los jugadores de Brasil, Inglaterra y Costa de marfil; En los porteros casi todos son solo de tres nacionalidades siendo Alemania e Inglaterra las más representativas y en los mediocampistas se nota la fuerte presencia de jugadores de Inglaterra, Suiza y España."
[1] "colcusiones"
[1] "Este trabajo nos permitió conocer a fondo cómo se comportan los jugadores de la Premier League a partir de datos como goles, pases, edad, posición y nacionalidad. Al limpiar la base y visualizarla con gráficos, pudimos identificar diferencias interesantes entre países y roles dentro del campo. Al analizar la relación entre variables como goles y pases, notamos que sí existe una conexión, y el modelo lineal lo confirmó. Además, probamos una técnica de pronóstico con suavización exponencial para ver cómo podrían cambiar los goles en el futuro. En general, este análisis nos dio herramientas para entender mejor el rendimiento de los jugadores y cómo los datos pueden ayudarnos a tomar decisiones más acertadas en el deporte."
---
title: "Premier League Dashboard"
output:
flexdashboard::flex_dashboard:
orientation: columns
vertical_layout: fill
theme: flatly
source_code: embed
---
```{r cargar-datos, include=FALSE}
library(flexdashboard)
library(ggplot2)
library(readr)
library(dplyr)
library(knitr)
library(GGally)
library(forecast)
premier.league.2 <- read.csv("premier league 2.csv", header = TRUE, sep = ";")
datos <- read.csv("graficos pearson.csv", sep = ";", header = TRUE)
tabla2 <- read.csv("posit grafica 2.csv", header = TRUE, sep = ";")
datos_filtrados <- datos %>% filter(!is.na(Goals), !is.na(Passes))
### Página: Inicio {#resumen}
```
# pestaña summary
columns
--------------------------------------------
```{r}
summary(premier.league.2)
```
columns
--------------------------------------------
```{r}
"en estre trabajo final estaremos usando una base de datos de jugadores de la Premier League. Esta contiene información sobre posición, nacionalidad, edad, goles, porterías imbatidas, pases, goles concedidos, apariciones, club, número de camiseta, entre otros. El conjunto de datos incluye 571 jugadores y 59 variables."
```
# introduccion
columns
-------------------------------------------
<span style="font-size:18px">
```{r}
"En esta parte se exploraremos un análisis estadístico de distintos aspectos relacionados con los jugadores y equipos de la Premier League. A través de visualizaciones gráficas elaboradas en R, se examinan variables como nacionalidad, número de jugadores por club, cantidad de apariciones, pases realizados, goles concedidos, arcos en cero y distribución de números de camiseta. Este enfoque permite identificar patrones y tendencias dentro de la liga, facilitando una comprensión más profunda sobre la composición y desempeño de los jugadores. Las gráficas presentadas no solo ilustran la diversidad y dinámica competitiva del torneo, sino que también reflejan cómo los datos pueden revelar comportamientos colectivos y diferencias individuales relevantes en el fútbol profesional."
```
```{r, echo=FALSE, results='asis'}
cat('<center><img src="i.png" width="500" height="500"></center>')
```
# graficos
columns
-------------------------------------------
```{r}
ggplot(premier.league.2, aes(x = reorder(Nationality, -table(Nationality)[Nationality]))) +
geom_bar(fill = "blue") +
labs(title = "Distribución de Nacionalidades", x = "Nacionalidad", y = "Frecuencia") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8))
```
```{r}
"🔹 nacionalidad vs frecuencia "
"Esta gráfica muestra la distribución de nacionalidades de los jugadores de la Premier League. Como se puede observar, Inglaterra es el país con mayor representación, con más de 200 jugadores, lo cual es lógico al ser la liga local. Le siguen Francia, España y Brasil, con una participación significativamente menor. La gráfica también evidencia la diversidad internacional de la liga, incluyendo jugadores de países de todos los continentes, aunque en menor proporción. Esta diversidad refleja el carácter global de la Premier League y su capacidad para atraer talento de todo el mundo."
```
columns
-------------------------------------------
```{r}
ggplot(premier.league.2, aes(x = reorder(Club, -table(Club)[Club]))) +
geom_bar(fill = "aquamarine") +
labs(title = "Número de Jugadores por Club", x = "Club", y = "Cantidad") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8))
```
```{r}
"🔹 Jugadores vs club"
"Esta gráfica muestra la cantidad de jugadores registrados por cada club de la Premier League. Se observa que equipos como Liverpool, Brighton y Tottenham tienen plantillas más amplias, con más de 30 jugadores. En contraste, clubes como Wolverhampton y Southampton tienen plantillas ligeramente más reducidas. Esta diferencia puede deberse a factores como estrategias deportivas, presupuesto, o participación en competiciones internacionales que exigen una mayor rotación de jugadores. En general, la mayoría de los equipos mantienen una plantilla equilibrada, con pequeñas variaciones."
```
columns
-------------------------------------------
```{r}
ggplot(premier.league.2, aes(x = Passes)) +
geom_histogram(fill = "red", bins = 20) +
labs(title = "Distribución de Pases", x = "Pases", y = "Frecuencia") +
theme_minimal()
```
```{r}
"🔹 Jugadores vs pases"
"Aquí se analiza la cantidad de goles recibidos por los equipos/jugadores. Al igual que en los arcos en cero, la mayoría de los jugadores están asociados con cifras bajas, y solo algunos acumulan un alto número de goles concedidos, probablemente defensores o arqueros con más minutos jugados."
```
columns
-------------------------------------------
```{r}
ggplot(premier.league.2, aes(x = Appearances)) +
geom_histogram(fill = "orange", bins = 10) +
labs(title = "Distribución de Apariciones", x = "Apariciones", y = "Frecuencia") +
theme_minimal()
```
```{r}
"🔹 Jugadores vs Apariciones en Partido"
"La gráfica indica cuántos partidos ha jugado cada jugador. La mayoría ha tenido pocas apariciones, lo cual puede incluir suplentes, jugadores juveniles o recién fichados. Solo unos pocos jugadores tienen un número muy alto de partidos, lo que los señala como titulares habituales."
```
columns
-------------------------------------------
```{r}
ggplot(premier.league.2, aes(x = factor(Jersey.Number), fill = factor(Jersey.Number %% 2))) +
geom_bar() +
scale_fill_manual(values = c("blue", "red"), labels = c("Par", "Impar")) +
labs(title = "Distribución de Números de Camiseta", x = "Número de Camiseta", y = "Cantidad de Jugadores", fill = "Tipo de Número") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8))
```
```{r}
"🔹 Jugadores vs Número de Camiseta"
"En esta gráfica se representan los números de camiseta utilizados por los jugadores, diferenciando entre números pares e impares. Se nota una mayor concentración en los números del 1 al 30, que suelen ser los más usados. No hay una diferencia significativa entre números pares e impares, aunque sí es notorio que los números más altos son poco comunes."
```
# matriz de correlacion reducida
### MATRIZ DE CORRELACION
```{r}
datos <- read.csv("graficos pearson.csv", sep = ";", header = TRUE)
datos_filtrados <- datos %>%
filter(!is.na(Goals), !is.na(Passes))
datos_reducidos <- datos_filtrados %>%
select(Goals, Passes, Age, Appearances)
ggpairs(datos_reducidos, title = "Matriz de correlación reducida")
```
columns
-----------------
### RESUMEN GRAFICO
```{r}
"se tuvo que hacer un summary de los datos ya que la ram del programa no pudo leerlos todos por completo, mas sin embargo en la matriz se analizaron las variables Goals, Passes, Age y Appearances.Se observa una correlación positiva moderada entre Goals y Passes, lo cual sugiere que los jugadores que marcan más goles también suelen tener una mayor participación en el juego ofensivo a través de los pases.La variable Age muestra una correlación débil con Goals y Passes, lo que indica que la edad no es un factor determinante en el rendimiento ofensivo dentro de este conjunto de datos.Appearances (apariciones) tiene una correlación positiva tanto con Goals como con Passes, lo cual es lógico: los jugadores que participan en más partidos tienen más oportunidades de anotar y asistir.las correlaciones obtenidas no son extremadamente altas, lo que indica que no hay dependencia fuerte entre las variables, pero sí hay tendencias importantes que permiten plantear modelos predictivos simples."
```
```{r, echo=FALSE, results='asis'}
cat('<center><img src="r1359826_1296x729_16-9.jpg" width="600"></center>')
```
# Correlación entre variables cuantitativas
columns
-----------------
```{r correlacion}
datos <- read.csv("graficos pearson.csv", sep = ";", header = TRUE)
datos_filtrados <- datos %>% filter(!is.na(Goals), !is.na(Passes))
correlacion <- cor(datos_filtrados$Goals, datos_filtrados$Passes, method = "pearson")
correlacion
```
```{r dispersion}
ggplot(datos_filtrados, aes(x = Goals, y = Passes)) +
geom_point(color = "steelblue", size = 3) +
geom_smooth(method = "lm", se = FALSE, color = "red") +
labs(title = "Dispersión entre Goals y Passes", x = "Goals", y = "Passes") +
theme_minimal()
```
```{r}
"El gráfico de dispersión muestra una relación positiva entre los goles y los pases de los jugadores, lo que indica que, en general, quienes tienen mayor participación ofensiva también tienden a anotar más. La línea de regresión refuerza esta tendencia, mostrando que hay una conexión lineal entre ambas variables, aunque no perfecta, lo cual es lógico dado que influyen otros factores en el rendimiento individual.
"
```
columns
-----------------
```{r}
modelo <- lm(Passes ~ Goals, data = datos_filtrados)
summary(modelo)
```
```{r}
"La correlación de Pearson entre Goals y Passes fue `r round(correlacion, 2)`, indicando una relación positiva. El modelo lineal indica que por cada gol adicional, se generan `r round(coef(modelo)[2], 2)` pases en promedio. El intercepto estimado es `r round(coef(modelo)[1], 2)`."
```
# diagrama de barras
columns
-------------------------
```{r}
Arsenal_data <- subset(premier.league.2, Club == "Arsenal")
tabla_cruzada_arsenal <- table(Arsenal_data$Position, Arsenal_data$Nationality)
print(tabla_cruzada_arsenal)
```
columns
----------------------------
```{r cruzada-arsenal}
ggplot(Arsenal_data, aes(x = Position, fill = Nationality)) +
geom_bar(position = "fill") +
labs(title = "Distribución de Nacionalidades por Posición (Arsenal)",
x = "Posición", y = "Proporción", fill = "Nacionalidad") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
```
```{r}
"En el diagrama de barras, muestra la distribución de nacionalidades por posición en el equipo Arsenal, podemos ver en el diagrama que los defensores tienen una gran diversidad de nacionalidad, destacando Inglaterra, Alemania y Brasil; En los delanteros predominan los jugadores de Brasil, Inglaterra y Costa de marfil; En los porteros casi todos son solo de tres nacionalidades siendo Alemania e Inglaterra las más representativas y en los mediocampistas se nota la fuerte presencia de jugadores de Inglaterra, Suiza y España."
```
# Conclusion
```{r}
"colcusiones"
"Este trabajo nos permitió conocer a fondo cómo se comportan los jugadores de la Premier League a partir de datos como goles, pases, edad, posición y nacionalidad. Al limpiar la base y visualizarla con gráficos, pudimos identificar diferencias interesantes entre países y roles dentro del campo. Al analizar la relación entre variables como goles y pases, notamos que sí existe una conexión, y el modelo lineal lo confirmó. Además, probamos una técnica de pronóstico con suavización exponencial para ver cómo podrían cambiar los goles en el futuro. En general, este análisis nos dio herramientas para entender mejor el rendimiento de los jugadores y cómo los datos pueden ayudarnos a tomar decisiones más acertadas en el deporte."
```