Integrantes: Isabella Gordillo Salas Wilson Acosta
Estos datos fueron recolectados de la pagina www.kaggle.com , los datos tienen un tamaño de muestrade 4788 con 21 variables
Descriptive Statistics
matches_premier_league
N: 4788
dist fk ga gf pk pkatt poss season
----------------- --------- --------- --------- --------- --------- --------- --------- ---------
Mean 17.36 0.45 1.41 1.45 0.12 0.15 50.43 2022.37
Std.Dev 3.05 0.67 1.29 1.31 0.34 0.38 12.81 1.46
Min 5.30 0.00 0.00 0.00 0.00 0.00 18.00 2020.00
Q1 15.40 0.00 0.00 0.00 0.00 0.00 41.00 2021.00
Median 17.20 0.00 1.00 1.00 0.00 0.00 51.00 2023.00
Q3 19.10 1.00 2.00 2.00 0.00 0.00 60.00 2024.00
Max 39.90 4.00 9.00 9.00 3.00 3.00 82.00 2024.00
MAD 2.82 0.00 1.48 1.48 0.00 0.00 14.83 1.48
IQR 3.70 1.00 2.00 2.00 0.00 0.00 19.00 3.00
CV 0.18 1.47 0.92 0.91 2.90 2.60 0.25 0.00
Skewness 0.60 1.44 1.11 1.11 2.90 2.56 -0.03 -0.34
SE.Skewness 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04
Kurtosis 2.93 2.07 1.85 1.89 8.56 6.41 -0.75 -1.29
N.Valid 4786.00 4788.00 4788.00 4788.00 4788.00 4788.00 4788.00 4788.00
Pct.Valid 99.96 100.00 100.00 100.00 100.00 100.00 100.00 100.00
Table: Table continues below
sh sot xg xga
----------------- --------- --------- --------- ---------
Mean 12.62 4.26 1.40 1.36
Std.Dev 5.55 2.46 0.83 0.81
Min 0.00 0.00 0.00 0.00
Q1 9.00 2.00 0.80 0.70
Median 12.00 4.00 1.30 1.20
Q3 16.00 6.00 1.90 1.80
Max 36.00 15.00 7.00 7.00
MAD 5.93 2.97 0.74 0.74
IQR 7.00 4.00 1.10 1.10
CV 0.44 0.58 0.59 0.60
Skewness 0.57 0.71 0.97 0.97
SE.Skewness 0.04 0.04 0.04 0.04
Kurtosis 0.20 0.50 1.39 1.38
N.Valid 4788.00 4788.00 4788.00 4788.00
Pct.Valid 100.00 100.00 100.00 100.00
round day venue result gf
Matchweek 1 : 126 Fri: 159 Away:2394 D:1073 Min. :0.000
Matchweek 10: 126 Mon: 315 Home:2394 L:1820 1st Qu.:0.000
Matchweek 11: 126 Sat:2055 W:1895 Median :1.000
Matchweek 12: 126 Sun:1355 Mean :1.448
Matchweek 13: 126 Thu: 198 3rd Qu.:2.000
Matchweek 14: 126 Tue: 280 Max. :9.000
(Other) :4032 Wed: 426
ga opponent xg xga
Min. :0.000 Arsenal : 240 Min. :0.000 Min. :0.000
1st Qu.:0.000 Aston Villa : 240 1st Qu.:0.800 1st Qu.:0.700
Median :1.000 Brighton : 240 Median :1.300 Median :1.200
Mean :1.405 Crystal Palace: 240 Mean :1.397 Mean :1.365
3rd Qu.:2.000 Everton : 240 3rd Qu.:1.900 3rd Qu.:1.800
Max. :9.000 Newcastle Utd : 240 Max. :7.000 Max. :7.000
(Other) :3348
poss captain referee
Min. :18.00 Lewis Dunk : 200 Anthony Taylor: 371
1st Qu.:41.00 Kasper Schmeichel: 181 Michael Oliver: 359
Median :51.00 Hugo Lloris : 179 Paul Tierney : 316
Mean :50.43 James Ward-Prowse: 162 Craig Pawson : 284
3rd Qu.:60.00 César Azpilicueta: 160 Stuart Attwell: 269
Max. :82.00 Harry Maguire : 154 Chris Kavanagh: 261
(Other) :3752 (Other) :2928
match.report sh sot dist
Match Report:4788 Min. : 0.00 Min. : 0.000 Min. : 5.30
1st Qu.: 9.00 1st Qu.: 2.000 1st Qu.:15.40
Median :12.00 Median : 4.000 Median :17.20
Mean :12.62 Mean : 4.261 Mean :17.36
3rd Qu.:16.00 3rd Qu.: 6.000 3rd Qu.:19.10
Max. :36.00 Max. :15.000 Max. :39.90
NA's :2
fk pk pkatt season
Min. :0.0000 Min. :0.0000 Min. :0.000 Min. :2020
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.000 1st Qu.:2021
Median :0.0000 Median :0.0000 Median :0.000 Median :2023
Mean :0.4532 Mean :0.1182 Mean :0.146 Mean :2022
3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:0.000 3rd Qu.:2024
Max. :4.0000 Max. :3.0000 Max. :3.000 Max. :2024
team
Chelsea : 266
Liverpool : 266
Manchester City : 266
Manchester United: 266
Tottenham Hotspur: 266
Arsenal : 228
(Other) :3230
[1] -0.1552657
Away Home
Fri 81 78
Mon 155 160
Sat 1026 1029
Sun 681 674
Thu 99 99
Tue 141 139
Wed 211 215
Este trabajo analiza los datos de partidos de la Premier League utilizando diferentes herramientas de visualización y estadística en R. Los datos provienen de una muestra de 4788 registros con 21 variables, recolectados de Kaggle. Se procesaron y visualizaron para observar tendencias y patrones en los resultados de los partidos, goles a favor y en contra, y otras variables clave.
Exploración de Datos y Estadísticas : Se realizó un análisis exploratorio que incluyó la eliminación de datos faltantes y la generación de estadísticas descriptivas para las variables. Esto permitió una visión general de la distribución y características básicas de los datos.
Visualización : Se usaron varios tipos de gráficos:
Diagramas de Barras : Para observar la frecuencia de los resultados en diferentes rondas y temporadas.
Diagramas de Cajas : Para analizar la dispersión de goles a favor y objetivos esperados, identificando posibles valores atípicos.
Gráfico de Correlación : Para evaluar la relación entre goles a favor y en contra.
Tablas Cruzadas : Para ver la distribución de partidos en diferentes días y estadios.
Hallazgos : Las visualizaciones resaltan patrones y relaciones significativas en los datos, como la frecuencia de ciertos resultados y variaciones en los goles según las condiciones de juego.
Conclusión : Este análisis proporciona una base sólida para entender mejor los resultados de la Premier League y sus tendencias en los datos de goles y rendimiento. Las visualizaciones y tablas permiten identificar factores clave que pueden influir en los resultados de los partidos. Esto abre la puerta a estudios más avanzados sobre el impacto de diversas variables en el rendimiento de los equipos, facilitando así un análisis más profundo para estrategias deportivas y análisis de rendimiento.