pestaña summary

columns

     Name           Jersey.Number       Club             Position        
 Length:571         Min.   : 1.00   Length:571         Length:571        
 Class :character   1st Qu.: 8.00   Class :character   Class :character  
 Mode  :character   Median :18.00   Mode  :character   Mode  :character  
                    Mean   :19.53                                        
                    3rd Qu.:27.00                                        
                    Max.   :82.00                                        
                    NA's   :8                                            
 Nationality             Age         Appearances          Wins       
 Length:571         Min.   :17.00   Min.   :  0.00   Min.   :  0.00  
 Class :character   1st Qu.:22.00   1st Qu.:  3.00   1st Qu.:  1.00  
 Mode  :character   Median :26.00   Median : 36.00   Median : 12.00  
                    Mean   :25.79   Mean   : 68.82   Mean   : 28.96  
                    3rd Qu.:29.00   3rd Qu.:108.00   3rd Qu.: 41.00  
                    Max.   :38.00   Max.   :539.00   Max.   :272.00  
                    NA's   :1                                        
     Losses          Goals         Goals.per.match   Headed.goals   
 Min.   :  0.0   Min.   :  0.000   Min.   : 0.000   Min.   : 0.000  
 1st Qu.:  1.0   1st Qu.:  0.000   1st Qu.: 0.050   1st Qu.: 0.000  
 Median : 14.0   Median :  1.000   Median : 0.140   Median : 0.000  
 Mean   : 23.9   Mean   :  7.327   Mean   : 2.648   Mean   : 1.414  
 3rd Qu.: 36.0   3rd Qu.:  6.000   3rd Qu.: 0.390   3rd Qu.: 1.000  
 Max.   :158.0   Max.   :180.000   Max.   :57.000   Max.   :31.000  
                                   NA's   :262      NA's   :69      
 Goals.with.right.foot Goals.with.left.foot Penalties.scored  Freekicks.scored
 Min.   :  0.000       Min.   : 0.000       Min.   : 0.0000   Min.   :0.0000  
 1st Qu.:  0.000       1st Qu.: 0.000       1st Qu.: 0.0000   1st Qu.:0.0000  
 Median :  1.000       Median : 0.000       Median : 0.0000   Median :0.0000  
 Mean   :  4.468       Mean   : 2.388       Mean   : 0.9741   Mean   :0.2913  
 3rd Qu.:  3.000       3rd Qu.: 2.000       3rd Qu.: 0.0000   3rd Qu.:0.0000  
 Max.   :127.000       Max.   :63.000       Max.   :27.0000   Max.   :8.0000  
 NA's   :69            NA's   :69           NA's   :262       NA's   :262     
     Shots       Shots.on.target  Shooting.accuracy..  Hit.woodwork   
 Min.   :  0.0   Min.   :  0.00   Length:571          Min.   : 0.000  
 1st Qu.:  6.0   1st Qu.:  1.00   Class :character    1st Qu.: 0.000  
 Median : 41.0   Median : 12.00   Mode  :character    Median : 0.000  
 Mean   :102.5   Mean   : 36.92                       Mean   : 2.062  
 3rd Qu.:144.0   3rd Qu.: 47.00                       3rd Qu.: 2.000  
 Max.   :996.0   Max.   :411.00                       Max.   :34.000  
 NA's   :262     NA's   :262                          NA's   :69      
 Big.chances.missed  Clean.sheets    Goals.conceded      Tackles     
 Min.   :  0.000    Min.   :  0.00   Min.   :  0.00   Min.   :  0.0  
 1st Qu.:  0.000    1st Qu.:  0.00   1st Qu.:  0.25   1st Qu.:  5.0  
 Median :  2.000    Median :  6.00   Median : 40.00   Median : 45.0  
 Mean   :  9.029    Mean   : 16.69   Mean   : 75.69   Mean   :101.1  
 3rd Qu.: 11.000    3rd Qu.: 26.00   3rd Qu.:117.00   3rd Qu.:139.8  
 Max.   :126.000    Max.   :127.00   Max.   :452.00   Max.   :860.0  
 NA's   :262        NA's   :309      NA's   :309      NA's   :69     
 Tackle.success..   Last.man.tackles Blocked.shots    Interceptions   
 Length:571         Min.   : 0.000   Min.   :  0.00   Min.   :  0.00  
 Class :character   1st Qu.: 0.000   1st Qu.:  0.00   1st Qu.:  2.00  
 Mode  :character   Median : 0.000   Median :  7.00   Median : 26.00  
                    Mean   : 1.259   Mean   : 20.55   Mean   : 72.76  
                    3rd Qu.: 1.000   3rd Qu.: 27.00   3rd Qu.: 99.25  
                    Max.   :24.000   Max.   :230.00   Max.   :618.00  
                    NA's   :378      NA's   :69       NA's   :69      
   Clearances     Headed.Clearance  Clearances.off.line   Recoveries     
 Min.   :   0.0   Min.   :   0.00   Min.   : 0.000      Min.   :   0.00  
 1st Qu.:   3.0   1st Qu.:   1.00   1st Qu.: 0.000      1st Qu.:  10.25  
 Median :  31.0   Median :  13.00   Median : 0.000      Median : 174.00  
 Mean   : 141.6   Mean   :  69.91   Mean   : 1.036      Mean   : 326.91  
 3rd Qu.: 147.0   3rd Qu.:  68.00   3rd Qu.: 1.000      3rd Qu.: 512.25  
 Max.   :2974.0   Max.   :1155.00   Max.   :10.000      Max.   :2330.00  
 NA's   :69       NA's   :69        NA's   :378         NA's   :181      
   Duels.won        Duels.lost     Successful.50.50s Aerial.battles.won
 Min.   :   0.0   Min.   :   0.0   Min.   :  0.00    Min.   :   0.00   
 1st Qu.:  12.0   1st Qu.:  12.0   1st Qu.:  2.00    1st Qu.:   3.00   
 Median : 154.5   Median : 145.5   Median : 21.00    Median :  28.50   
 Mean   : 313.8   Mean   : 275.9   Mean   : 49.25    Mean   :  99.76   
 3rd Qu.: 489.0   3rd Qu.: 408.8   3rd Qu.: 58.75    3rd Qu.: 130.00   
 Max.   :1946.0   Max.   :2223.0   Max.   :415.00    Max.   :1157.00   
 NA's   :181      NA's   :181      NA's   :181       NA's   :181       
 Aerial.battles.lost   Own.goals      Errors.leading.to.goal    Assists      
 Min.   :  0.00      Min.   :0.0000   Min.   : 0.0           Min.   : 0.000  
 1st Qu.:  3.00      1st Qu.:0.0000   1st Qu.: 0.0           1st Qu.: 0.000  
 Median : 41.50      Median :0.0000   Median : 0.0           Median : 1.000  
 Mean   : 84.85      Mean   :0.4084   Mean   : 1.1           Mean   : 5.285  
 3rd Qu.:119.50      3rd Qu.:0.0000   3rd Qu.: 1.0           3rd Qu.: 6.000  
 Max.   :562.00      Max.   :6.0000   Max.   :20.0           Max.   :84.000  
 NA's   :181         NA's   :309      NA's   :112                            
     Passes      Passes.per.match Big.chances.created    Crosses      
 Min.   :    0   Min.   : 0.00    Min.   : 0.000      Min.   :   0.0  
 1st Qu.:   92   1st Qu.:11.26    1st Qu.: 0.000      1st Qu.:   2.0  
 Median : 1000   Median :25.01    Median : 3.000      Median :  20.5  
 Mean   : 2310   Mean   :25.90    Mean   : 8.171      Mean   : 121.9  
 3rd Qu.: 3285   3rd Qu.:37.97    3rd Qu.: 9.000      3rd Qu.: 107.8  
 Max.   :17932   Max.   :98.50    Max.   :97.000      Max.   :2247.0  
                                  NA's   :69          NA's   :69      
 Cross.accuracy..   Through.balls     Accurate.long.balls     Saves      
 Length:571         Min.   :  0.000   Min.   :   0.0      Min.   :  0.0  
 Class :character   1st Qu.:  0.000   1st Qu.:   3.0      1st Qu.:  0.0  
 Mode  :character   Median :  2.000   Median :  59.0      Median : 20.0  
                    Mean   :  8.577   Mean   : 184.9      Mean   :150.5  
                    3rd Qu.:  7.750   3rd Qu.: 228.5      3rd Qu.:195.0  
                    Max.   :156.000   Max.   :1943.0      Max.   :941.0  
                    NA's   :181       NA's   :112         NA's   :502    
 Penalties.saved    Punches        High.Claims        Catches      
 Min.   :0.000   Min.   :  0.00   Min.   :  0.00   Min.   :  0.00  
 1st Qu.:0.000   1st Qu.:  0.00   1st Qu.:  0.00   1st Qu.:  0.00  
 Median :0.000   Median :  2.00   Median :  6.00   Median :  3.00  
 Mean   :1.087   Mean   : 24.65   Mean   : 45.87   Mean   : 20.78  
 3rd Qu.:2.000   3rd Qu.: 31.00   3rd Qu.: 45.00   3rd Qu.: 17.00  
 Max.   :7.000   Max.   :269.00   Max.   :391.00   Max.   :249.00  
 NA's   :502     NA's   :502      NA's   :502      NA's   :502     
 Sweeper.clearances   Throw.outs     Goal.Kicks      Yellow.cards   
 Min.   :  0.00     Min.   :   0   Min.   :   0.0   Min.   : 0.000  
 1st Qu.:  0.00     1st Qu.:   0   1st Qu.:   0.0   1st Qu.: 0.000  
 Median :  4.00     Median :  39   Median :  53.0   Median : 3.000  
 Mean   : 25.57     Mean   : 210   Mean   : 414.1   Mean   : 7.918  
 3rd Qu.: 28.00     3rd Qu.: 300   3rd Qu.: 527.0   3rd Qu.:11.000  
 Max.   :257.00     Max.   :1516   Max.   :2806.0   Max.   :81.000  
 NA's   :502        NA's   :502    NA's   :502                      
   Red.cards          Fouls           Offsides     
 Min.   :0.0000   Min.   :  0.00   Min.   :  0.00  
 1st Qu.:0.0000   1st Qu.:  1.00   1st Qu.:  0.00  
 Median :0.0000   Median : 22.00   Median :  2.00  
 Mean   :0.3012   Mean   : 53.03   Mean   : 11.06  
 3rd Qu.:0.0000   3rd Qu.: 74.00   3rd Qu.:  8.75  
 Max.   :5.0000   Max.   :438.00   Max.   :203.00  
                                   NA's   :69      

columns

[1] "en estre trabajo final estaremos usando una base de datos de jugadores de la Premier League. Esta contiene información sobre posición, nacionalidad, edad, goles, porterías imbatidas, pases, goles concedidos, apariciones, club, número de camiseta, entre otros. El conjunto de datos incluye 571 jugadores y 59 variables."
[1] "Autor: Luisa Gomez"

introduccion

columns

[1] "En esta parte se exploraremos un análisis estadístico de distintos aspectos relacionados con los jugadores y equipos de la Premier League. A través de visualizaciones gráficas elaboradas en R, se examinan variables como nacionalidad, número de jugadores por club, cantidad de apariciones, pases realizados, goles concedidos, arcos en cero y distribución de números de camiseta. Este enfoque permite identificar patrones y tendencias dentro de la liga, facilitando una comprensión más profunda sobre la composición y desempeño de los jugadores. Las gráficas presentadas no solo ilustran la diversidad y dinámica competitiva del torneo, sino que también reflejan cómo los datos pueden revelar comportamientos colectivos y diferencias individuales relevantes en el fútbol profesional."

graficos

columns

[1] "🔹 nacionalidad vs frecuencia "
[1] "Esta gráfica muestra la distribución de nacionalidades de los jugadores de la Premier League. Como se puede observar, Inglaterra es el país con mayor representación, con más de 200 jugadores, lo cual es lógico al ser la liga local. Le siguen Francia, España y Brasil, con una participación significativamente menor. La gráfica también evidencia la diversidad internacional de la liga, incluyendo jugadores de países de todos los continentes, aunque en menor proporción. Esta diversidad refleja el carácter global de la Premier League y su capacidad para atraer talento de todo el mundo."

columns

[1] "🔹 Jugadores vs club"
[1] "Esta gráfica muestra la cantidad de jugadores registrados por cada club de la Premier League. Se observa que equipos como Liverpool, Brighton y Tottenham tienen plantillas más amplias, con más de 30 jugadores. En contraste, clubes como Wolverhampton y Southampton tienen plantillas ligeramente más reducidas. Esta diferencia puede deberse a factores como estrategias deportivas, presupuesto, o participación en competiciones internacionales que exigen una mayor rotación de jugadores. En general, la mayoría de los equipos mantienen una plantilla equilibrada, con pequeñas variaciones."

columns

[1] "🔹 Jugadores vs pases"
[1] "Aquí se analiza la cantidad de goles recibidos por los equipos/jugadores. Al igual que en los arcos en cero, la mayoría de los jugadores están asociados con cifras bajas, y solo algunos acumulan un alto número de goles concedidos, probablemente defensores o arqueros con más minutos jugados."

columns

[1] "🔹 Jugadores vs Apariciones en Partido"
[1] "La gráfica indica cuántos partidos ha jugado cada jugador. La mayoría ha tenido pocas apariciones, lo cual puede incluir suplentes, jugadores juveniles o recién fichados. Solo unos pocos jugadores tienen un número muy alto de partidos, lo que los señala como titulares habituales."

columns

[1] "🔹 Jugadores vs Número de Camiseta"
[1] "En esta gráfica se representan los números de camiseta utilizados por los jugadores, diferenciando entre números pares e impares. Se nota una mayor concentración en los números del 1 al 30, que suelen ser los más usados. No hay una diferencia significativa entre números pares e impares, aunque sí es notorio que los números más altos son poco comunes."

matriz de correlacion reducida

MATRIZ DE CORRELACION

columns

RESUMEN GRAFICO

[1] "se tuvo que hacer un summary de los datos ya que la ram del programa no pudo leerlos todos por completo, mas sin embargo en la matriz se analizaron las variables Goals, Passes, Age y Appearances.Se observa una correlación positiva moderada entre Goals y Passes, lo cual sugiere que los jugadores que marcan más goles también suelen tener una mayor participación en el juego ofensivo a través de los pases.La variable Age muestra una correlación débil con Goals y Passes, lo que indica que la edad no es un factor determinante en el rendimiento ofensivo dentro de este conjunto de datos.Appearances (apariciones) tiene una correlación positiva tanto con Goals como con Passes, lo cual es lógico: los jugadores que participan en más partidos tienen más oportunidades de anotar y asistir.las correlaciones obtenidas no son extremadamente altas, lo que indica que no hay dependencia fuerte entre las variables, pero sí hay tendencias importantes que permiten plantear modelos predictivos simples."

Correlación entre variables cuantitativas

columns

[1] 0.3966698

[1] "El gráfico de dispersión muestra una relación positiva entre los goles y los pases de los jugadores, lo que indica que, en general, quienes tienen mayor participación ofensiva también tienden a anotar más. La línea de regresión refuerza esta tendencia, mostrando que hay una conexión lineal entre ambas variables, aunque no perfecta, lo cual es lógico dado que influyen otros factores en el rendimiento individual.\n"

columns


Call:
lm(formula = Passes ~ Goals, data = datos_filtrados)

Residuals:
    Min      1Q  Median      3Q     Max 
-8917.5 -1768.5 -1249.0   671.3 13949.3 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 1768.995    131.184   13.48   <2e-16 ***
Goals         73.792      7.159   10.31   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2873 on 569 degrees of freedom
Multiple R-squared:  0.1573,    Adjusted R-squared:  0.1559 
F-statistic: 106.2 on 1 and 569 DF,  p-value: < 2.2e-16
[1] "La correlación de Pearson entre Goals y Passes fue `r round(correlacion, 2)`, indicando una relación positiva. El modelo lineal indica que por cada gol adicional, se generan `r round(coef(modelo)[2], 2)` pases en promedio. El intercepto estimado es `r round(coef(modelo)[1], 2)`."

diagrama de barras

columns

            
             Bosnia And Herzegovina Brazil Cote D'Ivoire Egypt England France
  Defender                        1      2             0     0       2      1
  Forward                         0      2             1     0       2      1
  Goalkeeper                      0      0             0     0       1      0
  Midfielder                      0      0             0     1       4      1
            
             Gabon Germany Greece Iceland Scotland Spain Switzerland Uruguay
  Defender       0       1      1       0        1     1           0       0
  Forward        1       0      0       0        0     0           0       0
  Goalkeeper     0       1      0       1        0     0           0       0
  Midfielder     0       1      0       0        0     1           1       1

columns

[1] "En el diagrama de barras, muestra la distribución de nacionalidades por posición en el equipo Arsenal, podemos ver en el diagrama que los defensores tienen una gran diversidad de nacionalidad, destacando Inglaterra, Alemania y Brasil; En los delanteros predominan los jugadores de Brasil, Inglaterra y Costa de marfil; En los porteros casi todos son solo de tres nacionalidades siendo Alemania e Inglaterra las más representativas y en los mediocampistas se nota la fuerte presencia de jugadores de Inglaterra, Suiza y España."

grafico bivariados

columns

columns —————————

Conclusion

[1] "colcusiones"
[1] "Este trabajo nos permitió conocer a fondo cómo se comportan los jugadores de la Premier League a partir de datos como goles, pases, edad, posición y nacionalidad. Al limpiar la base y visualizarla con gráficos, pudimos identificar diferencias interesantes entre países y roles dentro del campo. Al analizar la relación entre variables como goles y pases, notamos que sí existe una conexión, y el modelo lineal lo confirmó. Además, probamos una técnica de pronóstico con suavización exponencial para ver cómo podrían cambiar los goles en el futuro. En general, este análisis nos dio herramientas para entender mejor el rendimiento de los jugadores y cómo los datos pueden ayudarnos a tomar decisiones más acertadas en el deporte."

---
title: "Premier League Dashboard"
output: 
  flexdashboard::flex_dashboard:
    orientation: columns
    vertical_layout: fill
    theme: flatly
    source_code: embed
    
---

```{r cargar-datos, include=FALSE}
library(flexdashboard)
library(ggplot2)
library(readr)
library(dplyr)
library(knitr)
library(GGally)
library(forecast)

premier.league.2 <- read.csv("premier league 2.csv", header = TRUE, sep = ";")
datos <- read.csv("graficos pearson.csv", sep = ";", header = TRUE)
tabla2 <- read.csv("posit grafica 2.csv", header = TRUE, sep = ";")
datos_filtrados <- datos %>% filter(!is.na(Goals), !is.na(Passes))

### Página: Inicio {#resumen}
```




# pestaña summary
columns
--------------------------------------------
```{r}
summary(premier.league.2)
```

columns
--------------------------------------------
```{r}
"en estre trabajo final estaremos usando una base de datos de jugadores de la Premier League. Esta contiene información sobre posición, nacionalidad, edad, goles, porterías imbatidas, pases, goles concedidos, apariciones, club, número de camiseta, entre otros. El conjunto de datos incluye 571 jugadores y 59 variables." 
"Autor: Luisa Gomez"
```

# introduccion
columns
-------------------------------------------
<span style="font-size:18px">
```{r}
"En esta parte se exploraremos un análisis estadístico de distintos aspectos relacionados con los jugadores y equipos de la Premier League. A través de visualizaciones gráficas elaboradas en R, se examinan variables como nacionalidad, número de jugadores por club, cantidad de apariciones, pases realizados, goles concedidos, arcos en cero y distribución de números de camiseta. Este enfoque permite identificar patrones y tendencias dentro de la liga, facilitando una comprensión más profunda sobre la composición y desempeño de los jugadores. Las gráficas presentadas no solo ilustran la diversidad y dinámica competitiva del torneo, sino que también reflejan cómo los datos pueden revelar comportamientos colectivos y diferencias individuales relevantes en el fútbol profesional."
```

```{r, echo=FALSE, results='asis'}
cat('<center><img src="i.png" width="500" height="500"></center>')
```

# graficos
columns
-------------------------------------------

```{r}
ggplot(premier.league.2, aes(x = reorder(Nationality, -table(Nationality)[Nationality]))) +
  geom_bar(fill = "blue") +
  labs(title = "Distribución de Nacionalidades", x = "Nacionalidad", y = "Frecuencia") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8))
```

```{r}
library(dplyr)
library(ggplot2)

# Calcular el top 10 de nacionalidades
top_nacionalidades <- premier.league.2 %>%
  count(Nationality, sort = TRUE) %>%
  slice_max(n, n = 10)  # usar slice_max en vez de top_n (está obsoleto)

# Filtrar solo esos jugadores
premier_top10 <- premier.league.2 %>%
  filter(Nationality %in% top_nacionalidades$Nationality)

# Volver a unir para tener los datos de conteo directamente
premier_top10 <- premier_top10 %>%
  count(Nationality) %>%
  arrange(desc(n))

# Gráfico ordenado, barras horizontales, sin azul
ggplot(premier_top10, aes(x = reorder(Nationality, n), y = n)) +
  geom_bar(stat = "identity", fill = "#e57373") +  # rojo suave
  coord_flip() +
  labs(
    title = "Top 10 Nacionalidades en la Premier League",
    x = "Nacionalidad",
    y = "Cantidad de Jugadores"
  ) +
  theme_minimal() +
  theme(axis.text.y = element_text(size = 10))
```


```{r}
"🔹 nacionalidad vs frecuencia "

"Esta gráfica muestra la distribución de nacionalidades de los jugadores de la Premier League. Como se puede observar, Inglaterra es el país con mayor representación, con más de 200 jugadores, lo cual es lógico al ser la liga local. Le siguen Francia, España y Brasil, con una participación significativamente menor. La gráfica también evidencia la diversidad internacional de la liga, incluyendo jugadores de países de todos los continentes, aunque en menor proporción. Esta diversidad refleja el carácter global de la Premier League y su capacidad para atraer talento de todo el mundo."
```
columns
-------------------------------------------

```{r}
ggplot(premier.league.2, aes(x = reorder(Club, -table(Club)[Club]))) +
  geom_bar(fill = "aquamarine") +
  labs(title = "Número de Jugadores por Club", x = "Club", y = "Cantidad") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8))
```

```{r}

"🔹 Jugadores vs club"

"Esta gráfica muestra la cantidad de jugadores registrados por cada club de la Premier League. Se observa que equipos como Liverpool, Brighton y Tottenham tienen plantillas más amplias, con más de 30 jugadores. En contraste, clubes como Wolverhampton y Southampton tienen plantillas ligeramente más reducidas. Esta diferencia puede deberse a factores como estrategias deportivas, presupuesto, o participación en competiciones internacionales que exigen una mayor rotación de jugadores. En general, la mayoría de los equipos mantienen una plantilla equilibrada, con pequeñas variaciones."
```
columns
-------------------------------------------


```{r}
ggplot(premier.league.2, aes(x = Passes)) +
  geom_histogram(fill = "red", bins = 20) +
  labs(title = "Distribución de Pases", x = "Pases", y = "Frecuencia") +
  theme_minimal()
```

```{r}
"🔹 Jugadores vs pases"

"Aquí se analiza la cantidad de goles recibidos por los equipos/jugadores. Al igual que en los arcos en cero, la mayoría de los jugadores están asociados con cifras bajas, y solo algunos acumulan un alto número de goles concedidos, probablemente defensores o arqueros con más minutos jugados."
```
columns
-------------------------------------------


```{r}
ggplot(premier.league.2, aes(x = Appearances)) +
  geom_histogram(fill = "orange", bins = 10) +
  labs(title = "Distribución de Apariciones", x = "Apariciones", y = "Frecuencia") +
  theme_minimal()
```

```{r}
"🔹 Jugadores vs Apariciones en Partido"

"La gráfica indica cuántos partidos ha jugado cada jugador. La mayoría ha tenido pocas apariciones, lo cual puede incluir suplentes, jugadores juveniles o recién fichados. Solo unos pocos jugadores tienen un número muy alto de partidos, lo que los señala como titulares habituales."
```
columns
-------------------------------------------

```{r}
ggplot(premier.league.2, aes(x = factor(Jersey.Number), fill = factor(Jersey.Number %% 2))) +
  geom_bar() +
  scale_fill_manual(values = c("blue", "red"), labels = c("Par", "Impar")) +
  labs(title = "Distribución de Números de Camiseta", x = "Número de Camiseta", y = "Cantidad de Jugadores", fill = "Tipo de Número") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8))
```

```{r}
"🔹 Jugadores vs Número de Camiseta"
"En esta gráfica se representan los números de camiseta utilizados por los jugadores, diferenciando entre números pares e impares. Se nota una mayor concentración en los números del 1 al 30, que suelen ser los más usados. No hay una diferencia significativa entre números pares e impares, aunque sí es notorio que los números más altos son poco comunes."
```


# matriz de correlacion reducida



### MATRIZ DE CORRELACION

```{r}

datos <- read.csv("graficos pearson.csv", sep = ";", header = TRUE)

datos_filtrados <- datos %>%
  filter(!is.na(Goals), !is.na(Passes))

datos_reducidos <- datos_filtrados %>%
  select(Goals, Passes, Age, Appearances)

ggpairs(datos_reducidos, title = "Matriz de correlación reducida")
```


columns
-----------------

### RESUMEN GRAFICO
```{r}
"se tuvo que hacer un summary de los datos ya que la ram del programa no pudo leerlos todos por completo, mas sin embargo en la matriz se analizaron las variables Goals, Passes, Age y Appearances.Se observa una correlación positiva moderada entre Goals y Passes, lo cual sugiere que los jugadores que marcan más goles también suelen tener una mayor participación en el juego ofensivo a través de los pases.La variable Age muestra una correlación débil con Goals y Passes, lo que indica que la edad no es un factor determinante en el rendimiento ofensivo dentro de este conjunto de datos.Appearances (apariciones) tiene una correlación positiva tanto con Goals como con Passes, lo cual es lógico: los jugadores que participan en más partidos tienen más oportunidades de anotar y asistir.las correlaciones obtenidas no son extremadamente altas, lo que indica que no hay dependencia fuerte entre las variables, pero sí hay tendencias importantes que permiten plantear modelos predictivos simples."
```

```{r, echo=FALSE, results='asis'}
cat('<center><img src="r1359826_1296x729_16-9.jpg" width="600"></center>')

```

#  Correlación entre variables cuantitativas
columns
-----------------
```{r correlacion}
datos <- read.csv("graficos pearson.csv", sep = ";", header = TRUE)
datos_filtrados <- datos %>% filter(!is.na(Goals), !is.na(Passes))
correlacion <- cor(datos_filtrados$Goals, datos_filtrados$Passes, method = "pearson")
correlacion
```

```{r dispersion}
ggplot(datos_filtrados, aes(x = Goals, y = Passes)) +
  geom_point(color = "steelblue", size = 3) +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "Dispersión entre Goals y Passes", x = "Goals", y = "Passes") +
  theme_minimal()
```

```{r}
"El gráfico de dispersión muestra una relación positiva entre los goles y los pases de los jugadores, lo que indica que, en general, quienes tienen mayor participación ofensiva también tienden a anotar más. La línea de regresión refuerza esta tendencia, mostrando que hay una conexión lineal entre ambas variables, aunque no perfecta, lo cual es lógico dado que influyen otros factores en el rendimiento individual.
"
```

columns
-----------------
```{r}
modelo <- lm(Passes ~ Goals, data = datos_filtrados)
summary(modelo)
```

```{r}
"La correlación de Pearson entre Goals y Passes fue `r round(correlacion, 2)`, indicando una relación positiva. El modelo lineal indica que por cada gol adicional, se generan `r round(coef(modelo)[2], 2)` pases en promedio. El intercepto estimado es `r round(coef(modelo)[1], 2)`."
```


#  diagrama de barras

columns
-------------------------


```{r}
Arsenal_data <- subset(premier.league.2, Club == "Arsenal")
tabla_cruzada_arsenal <- table(Arsenal_data$Position, Arsenal_data$Nationality)
print(tabla_cruzada_arsenal)
```
columns
----------------------------
```{r cruzada-arsenal}
ggplot(Arsenal_data, aes(x = Position, fill = Nationality)) +
  geom_bar(position = "fill") +
  labs(title = "Distribución de Nacionalidades por Posición (Arsenal)", 
       x = "Posición", y = "Proporción", fill = "Nacionalidad") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
```

```{r }
library(dplyr)
library(ggplot2)

# Clasificar posiciones en 4 principales
Arsenal_data <- Arsenal_data %>%
  mutate(MainPosition = case_when(
    grepl("Goalkeeper|GK", Position, ignore.case = TRUE) ~ "GK",
    grepl("Defender|DF", Position, ignore.case = TRUE) ~ "DF",
    grepl("Midfielder|MF", Position, ignore.case = TRUE) ~ "MF",
    grepl("Forward|FW", Position, ignore.case = TRUE) ~ "FW",
    TRUE ~ "Other"
  ))

# Calcular Top 5 nacionalidades
top5_nationalities <- Arsenal_data %>%
  count(Nationality, sort = TRUE) %>%
  slice_max(n, n = 5) %>%
  pull(Nationality)

# Filtrar solo posiciones principales y top 5 nacionalidades
filtered_data <- Arsenal_data %>%
  filter(MainPosition %in% c("GK", "DF", "MF", "FW"),
         Nationality %in% top5_nationalities)

# Reordenar nacionalidades por frecuencia
filtered_data$Nationality <- factor(filtered_data$Nationality,
  levels = filtered_data %>%
    count(Nationality, sort = TRUE) %>%
    pull(Nationality)
)

# Gráfico con etiquetas, colores personalizados y top 5
ggplot(filtered_data, aes(x = Nationality, fill = MainPosition)) +
  geom_bar(position = position_dodge(width = 0.8)) +
  geom_text(stat = "count", aes(label = ..count..),
            position = position_dodge(width = 0.8),
            vjust = -0.5, size = 3) +
  labs(
    title = "Top 5 Nacionalidades en el Arsenal por Posición",
    x = "Nacionalidad", y = "Cantidad de Jugadores", fill = "Posición"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_fill_manual(values = c(
    "GK" = "#ff9900",  # naranja
    "DF" = "#66bb6a",  # verde
    "MF" = "#e57373",  # rojo claro
    "FW" = "#ba68c8"   # morado
  ))
```



```{r}
"En el diagrama de barras, muestra la distribución de nacionalidades por posición en el equipo Arsenal, podemos ver en el diagrama que los defensores tienen una gran diversidad de nacionalidad, destacando Inglaterra, Alemania y Brasil; En los delanteros predominan los jugadores de Brasil, Inglaterra y Costa de marfil; En los porteros casi todos son solo de tres nacionalidades siendo Alemania e Inglaterra las más representativas y en los mediocampistas se nota la fuerte presencia de jugadores de Inglaterra, Suiza y España."
```

#  grafico bivariados

columns
---------------------------------------
```{r}

premier.league.2 <- premier.league.2 %>%
  mutate(Grupo_Posicion = case_when(
    Position %in% c("Defender", "Goalkeeper") ~ "Def/Portero",
    Position %in% c("Forward", "Midfielder") ~ "Del/Campista",
    TRUE ~ "Otros"
  ))

# Boxplot + puntos: variable cuantitativa = Goals
ggplot(premier.league.2, aes(x = Grupo_Posicion, y = Goals, fill = Grupo_Posicion)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.15, alpha = 0.35) +
  labs(title = "Goles por Grupo de Posición", x = "Grupo de Posición", y = "Goles") +
  theme_minimal() +
  theme(legend.position = "none")
```
columns
---------------------------
```{r}
ggplot(premier.league.2, aes(x = Grupo_Posicion, y = Passes, fill = Grupo_Posicion)) +
  geom_boxplot(alpha = 0.7, outlier.shape = NA) +
  geom_jitter(width = 0.15, alpha = 0.35) +
  labs(title = "Pases por Grupo de Posición", x = "Grupo de Posición", y = "Pases") +
  theme_minimal() +
  theme(legend.position = "none")
```

```{r}
ggplot(
  premier.league.2 %>% filter(!is.na(Appearances), !is.na(Grupo_Posicion)),
  aes(x = Grupo_Posicion, y = Appearances, fill = Grupo_Posicion)
) +
  geom_boxplot(outlier.shape = NA, alpha = 0.75) +
  geom_jitter(width = 0.15, alpha = 0.25) +
  labs(title = "Apariciones por Grupo de Posición", x = "Grupo de Posición", y = "Apariciones") +
  theme_minimal() +
  theme(legend.position = "none")
```

#  Conclusion

```{r}
"colcusiones"
"Este trabajo nos permitió conocer a fondo cómo se comportan los jugadores de la Premier League a partir de datos como goles, pases, edad, posición y nacionalidad. Al limpiar la base y visualizarla con gráficos, pudimos identificar diferencias interesantes entre países y roles dentro del campo. Al analizar la relación entre variables como goles y pases, notamos que sí existe una conexión, y el modelo lineal lo confirmó. Además, probamos una técnica de pronóstico con suavización exponencial para ver cómo podrían cambiar los goles en el futuro. En general, este análisis nos dio herramientas para entender mejor el rendimiento de los jugadores y cómo los datos pueden ayudarnos a tomar decisiones más acertadas en el deporte."

```