# INTRODUCCIÓN
El siguiente trabajo es realizado a partir de la importación del dataset de datos históricos de la liga de futbol Español temporada 2018-2019 específicamente la cúal se extrajo desde la página web (ww.kaggle.com),el dataset fue realizado por el usuario “Alvaro Bartolome” y representa un tema realmente interesante a tomar como objetivo de éste trabajo, el poder evaluar a partir del análisis estadístico a registro de duelos entre jugadores que son valorizados numéricamente y representan duelos con éxito o duelos fallidos en la temporada 2018-2019 de la liga Española.
Los datos se almacenan en un archivo Excel y la cantidad de registros en dicho archivo corresponde a 556 filas de registros.
#DESCRIPCIÓN DE LOS DATOS
Los datos que estan registrados en cada columna permiten reconocer información personal de cada jugador desde su nombre hasta su rendimiento personal en los partidos de fútbol realizados en la temporada 2018/19 de la liga Española.
La tabla contiene 62 columnas las cuales pasaremos a describir:
Equipo: El equipo de fútbol que pertenece el jugador x en la Liga Española.
Posición: ubicación táctica en la cancha de fútbol del jugador x .
Dorsal: Número de camiseta identificadora del jugador x de fútbol de la liga Española.
Nombre : Nombre del jugador x de fútbol de la liga Española temporada 2018/2019
Minutos Jugados: Minutos de juego que lleva el jugador de fútbol x con respecto a lo que lleva en la liga Española temporada 2018/2019
Partidos Jugados : Cantidad de Partidos jugados por el jugador de fútbol x con respecto a lo que lleva en liga Española temporada 2018/2019
Porcentaje de Partidos Jugados: Porcentaje que corresponde al total de los partidos que el jugador de fútbol x ha jugado en la temporada 2018/2019 de la liga Española.
Partidos Jugados Enteros : Cantidad de partidos en el que el jugador de fútbol x jugó como titular los 90 minutos.
Porcentaje de partidos Jugados Enteros : Porcentaje de partidos jugado por completo por parte del jugador de fútbol x
Partidos Jugados como Titular : Cantidad de partidos jugados por el jugador comenzando como titular en cada uno de ellos .
Pocentaje de partidos jugados como titular : Porcentaje de partidos que jugó el jugador de fútbol x como titular en la temporada 2018-2019 de la liga Española
Partidos Sustituido : Cantidad de partidos en que fue sustituido el jugador de fútbol x en la temporada 2018-2019 de la liga Española
Porcentaje de partidos sustituido: Porcentaje de partidos que fue sustituido el jugadorde fútbol x en la temporada 2018-2019 de la liga Española
Tarjeta Amarilla: cantidad de tarjetas amarillas que recibió el jugador de fútbol x en la temporada 2018-19 de la liga Española
Tarjetas Rojas:cantidad de tarjetas rojas que recibió el jugador de fútbol x en la temporada 2018-19 de la liga Española
Segunda Tarjeta Amarilla: cantidad de segundas tarjetas amarillas que recibió el jugador de fútbol x en la temporada 2018-19 de la liga Española.
Goles Marcados: cantidad de goles marcados por el jugador de fútbol x en la temporada 2018-19.
Penaltis Marcados: cantidad de penaltis realizados en la temporada 2018-19
Goles en Propia Puerta: cantidad de goles producidos por x jugador en su propio arco.
Goles encajados mientras el jugador estaba en el campo
Bloqueos: cantidad de intercepciones del balon cuando se dispara a puerta
intercepciones: cantidad de interrupciones a la trayectoria del balon
Recuperaciones: cantidad recuperaciones del balón del jugador x
Despejes:cantidad de desvíos de balón para proteger la defensa.
Entradas Con éxito:cantidad de intercepciones defensivas del balón con éxito
Entradas fallidas:cantidad de intercepciones defensivas del balón con éxito
Jugadas como último Hombre
Duelos con éxito: cantidad de enfrentamientos existosos que tuvo el jugador x en la liga temporada 2018/19.
Duelos Fallidos:cantidad de enfrentamientos fallidos que tuvo el jugador x en la liga temporada 2018/19.
Duelos aéreos con éxito: cantidad de duelos aéreos ganados por el jugador de fútbol x en la temporada 2018/19 de la liga Española
Duelos aéreos fallidos: cantidad de duelos aéreos perdidos por el jugador de fútbol x en la temporada 2018/19 de la liga Española
Fueras de juego Cometidos:cantidad total de fueras de juegos cometidos por el jugador de fútbol x en la temporada 2018/19 de la liga Española
Faltas recibidas: faltas recibidas de jugador de fútbol x por otro jugador
Faltas cometidas: faltas cometidas por el jugador de fútol x.
Penaltis Recibidos: cantidad de penaltis recibidos a favor del jugador x y del equipo
Penaltis Cometidos: cantidad de penaltis cometidos por el jugador x.
Faltas por manos: faltas cometidas por el jugadorde fútbol x
Faltas Cometidas por cada tarjeta Recibida:cantidad de faltas cometidas por el jugador de fútbo x en la temporada 2018/19 Tiros Realizados: cantidad de disparos de balón realizados a cualquier lugar, realizado por el jugador x en la temporada 2018/19 de la liga Española
Tiros a Puerta: cantidad de disparos de balón realizados a puerta por parte del jugador de fútbol x.
Asistencia de Gol: Asistencias de gol realizadas por jugador de fútbol x.
Regates Realizados con éxito: cantidad de regates con el balón por parte de l jugador de fútbol x.
Regates Fallidos: cantidad de regates fallidos con el balón por parte de l jugador de fútbol x.
Goles marcados desde dentro del área: cantidad de goles marcados por el jugador x dentro del área de juego.
Goles marcados desde fuera del área: cantidad de goles marcados por jugador x fuera del área de juego.
Goles marcados con el pie izquierdo: goles marcados por el jugador x de fúbol
Goles marcados con el pie derecho: goles macados por el jugador x de fútbol con el pie derecho.
Goles marcados de penalti: goles marcados de penalti por parte del jugador x de futbol
Goles marcados de cabeza: goles marcados de cabeza por parte del jugador x de fútbol
Goles marcados de jugada a balón parado: goles marcados a balón parado por parte del jugador x de fútbol.
# PROCESAMIENTO
El procesamiento de datos que se quiere hacer es analizar estadísticamente los valores de éxito y fracaso con respecto a los duelos personales que se dan de jugador contra jugador en la temporada 2018/19
# Procesamiento de Datos Los datos rescatados para este analisis provienen de un archivo excel exportado desde el sistema que administra esta información. ##Instalamos las librerias que usaremos, para el correcto manejo de los datos son:
Eliminaremos con RStudio los registros que contengan datos NA ya que no nos sirven para una correcta evaluación de los mismos. Revisaremos algunos gráficos paa identidicar información relevante para nuestro objetivo principal que es analizar los valores de éxitos y fracasos en los correspondientes duelos realizados entre jugadores en la temporada 2018/19
Crearemos tabla con datos filtrados para una mejor visualización del conjunto de datos que necesitamos para identificar la información que queremos obtener.
# OBTENCIÓN
A continuación realizamos la carga de los datos con RStudio desde un archivo excel “laliga_player_stats_spanish” ubicado en carpeta de datos y con el cual se crea un archivo .csv para trabajarlo de una mejor manera en el espacio de trabajo de RStudio, utilizaremos libreria “readr” que nos facilita la lectura de muchos datos en este caso de un archivo .csv.
En la siguiente tabla podemos apreciar que existe registros que son tomados como NA ya que no existe dato en dichas celdas por lo que realizaremos un proceso de limpieza para mantener unos registros mas consistentes para poder realizar el análisis de los datos.
## Parsed with column specification:
## cols(
## .default = col_double(),
## Equipo = col_character(),
## Posicion = col_character(),
## Nombre = col_character(),
## `Porcentaje de Partidos jugados` = col_character(),
## `Porcentaje de Partidos jugados enteros` = col_character(),
## `Porcentaje de Partidos jugados como titular` = col_character(),
## `Porcentaje de Partidos sustituido` = col_character()
## )
## See spec(...) for full column specifications.
En ésta siguiente tabla ya podemos ver que se ha realizado su respectiva limpieza de celdas que poseían categoría NA
con respecto a las columnas poseemos 62 columnas pero no todas son necesarias para el propósito que se tiene que es encontrar y evaluar estadísticamente los jugadores que tienen los mejores rendimientos con respecto a su cuota goleadora en la temporada 2018/19 de la liga Española
Las Columnas escogidas para ésto son:
Observamos un resumen general de todos los datos evaluados estadísticamente
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 3.00 18.00 25.49 37.00 237.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 8.00 45.00 53.25 86.00 236.00
** #Transformación** Para facilitar el trabajo con las variables se almacenan las columnas en variables correspondientes
## [1] 0 3 2 19 54 50 89 100 10 13 98 3 106 71 92 18 101
## [18] 75 102 168 14 0 12 145 139 42 0 1 49 75 43 18 0 51
## [35] 26 21 0 7 0 82 126 147 124 0 0 0 11 1 1 0 108
## [52] 23 178 119 61 58 56 1 0 1 0 38 49 4 102 59 26 18
## [69] 2 67 30 51 74 63 1 38 91 132 0 63 11 11 35 59 1
## [86] 0 0 21 76 9 35 30 50 16 62 108 55 142 67 82 196 0
## [103] 0 42 23 181 22 81 17 3 0 0 63 46 10 45 79 58 20
## [120] 11 0 0 83 113 118 36 13 35 106 139 198 119 17 15 0 1
## [137] 0 72 77 33 53 49 7 165 124 0 3 129 22 15 32 17 153
## [154] 87 19 137 99 134 0 3 38 0 34 33 10 33 56 40 14 0
## [171] 118 179 112 90 51 63 114 31 0 137 156 69 31 0 1 0 70
## [188] 53 24 85 34 20 52 18 42 29 198 230 190 37 159 161 1 0
## [205] 90 45 85 10 0 0 15 6 47 51 34 88 76 0 0 0 0
## [222] 19 28 150 33 169 147 128 47 104 1 0 0 113 97 24 2 2
## [239] 1 0 33 154 75 104 48 32 40 0 0 20 65 10 43 88 90
## [256] 51 70 104 8 0 0 146 157 181 0 9 0 1 1 0 106 27
## [273] 18 15 61 10 35 89 0 26 54 75 41 16 216 33 145 59 124
## [290] 82 47 0 0 17 10 72 84 85 45 40 0 118 119 74 32 5
## [307] 134 112 0 0 164 86 73 56 25 38 1 2 59 47 82 39 40
## [324] 72 76 0 0 12 141 64 85 55 108 154 28 0 0 0 0 0
## [341] 0 36 31 119 0 2 93 4 47 21 46 69 50 49 0 0 78
## [358] 131 119 27 33 72 34 83 81 0 0 14 109 68 120 77 3 1
## [375] 70 33 26 39 20 108 24 16 5 31 7 77 98 162 41 1 63
## [392] 52 2 0 39 1 0 80 188 115 96 31 59 3 2 0 10 13
## [409] 37 76 97 29 80 35 99 109 240 61 20 25 158 4 38 120 60
## [426] 66 0 0 1 17 54 18 83 39 21 25 76 7 141 134 91 3
## [443] 63 76 54 48 85 72 127 101 98 2 0 0 38 26 43 12 56
## [460] 14 15 51 28 110 183 34 34 41 148 23 180 24 7 104 128 51
## [477] 66 1 1 38 41 26 111 9 67 25 0 57 90 157 120 91 4
## [494] 69 65 0 57 102 46 124 77 0 1 0 94 40 63 33 38 34
## [511] 2 75 142 72 89 122 14 142 0 19 115 0 0 131 56 96
## [1] 0 3 0 19 108 76 52 154 10 13 72 3 88 46 85 8 80
## [18] 50 76 126 17 0 6 127 169 13 0 5 80 103 87 18 0 57
## [35] 60 50 5 9 0 121 135 141 163 0 0 0 2 0 1 0 82
## [52] 15 135 118 28 55 84 2 0 0 0 49 69 10 81 60 26 30
## [69] 3 77 67 37 64 45 1 19 120 88 0 60 8 7 26 37 3
## [86] 0 0 22 136 10 59 55 105 16 97 123 62 145 59 96 113 0
## [103] 0 45 9 123 28 33 6 3 0 0 84 73 10 67 74 76 27
## [120] 10 0 0 101 151 111 65 16 33 115 109 211 112 23 11 0 4
## [137] 0 98 81 38 63 56 4 171 78 0 2 99 13 22 34 15 146
## [154] 98 26 91 57 89 2 4 29 2 26 45 22 53 66 78 15 0
## [171] 130 156 176 87 43 68 117 54 0 108 105 21 22 0 3 2 66
## [188] 62 33 86 45 29 35 21 33 21 159 142 168 38 123 144 8 0
## [205] 62 40 47 8 2 0 23 12 103 73 53 67 157 0 0 0 0
## [222] 13 23 152 26 226 143 101 52 91 1 0 1 71 72 13 3 3
## [239] 6 0 29 162 86 135 70 62 52 0 0 13 53 10 33 110 63
## [256] 77 51 97 7 0 0 133 93 135 0 10 1 1 1 0 121 31
## [273] 48 27 88 14 42 122 0 24 47 109 25 7 236 36 141 58 80
## [290] 78 51 0 4 24 14 73 104 113 74 34 0 83 122 105 49 8
## [307] 128 126 0 0 92 66 48 58 10 34 1 2 105 65 136 76 25
## [324] 90 79 0 0 9 147 70 123 88 85 180 38 0 0 0 0 0
## [341] 0 23 23 78 0 4 108 8 77 46 47 87 54 63 0 0 117
## [358] 148 149 27 30 72 40 95 86 0 0 7 91 60 114 72 5 2
## [375] 119 40 30 88 21 165 35 39 8 39 10 80 109 113 29 0 62
## [392] 52 0 0 32 1 0 64 118 111 55 18 54 0 2 0 8 36
## [409] 59 128 82 41 90 40 126 160 183 51 13 11 144 1 23 63 32
## [426] 31 0 2 1 27 57 30 94 47 26 28 118 9 99 95 53 3
## [443] 49 112 66 39 85 69 98 84 60 4 1 0 56 38 48 13 76
## [460] 21 20 54 40 95 192 24 22 92 104 32 160 23 5 87 49 59
## [477] 74 0 2 65 57 28 175 8 76 32 0 86 117 112 161 81 2
## [494] 102 83 0 37 103 39 68 51 2 1 0 85 75 67 46 65 36
## [511] 2 91 128 70 72 103 12 174 0 9 91 0 0 88 24 91
procedemos a calcular la media, mediana, la mínima y máxima
## [1] 52.8346
## [1] 39
## [1] 0
## [1] 240
## [1] 53.24525
## [1] 45
## [1] 0
## [1] 236
Se genera un histograma en cada gráfico para mostrar la relación entre el total de duelos y los duelos exitosos o fallidos.
#Resultado Luego de realizar todo el análisis al dataset presentado, se cumple el objetivo principal el cual era informar sobre la cantidad de Duelos con éxito y facaso en la temporada 2018/19 de a liga Española,
Se genera un boxplot que muestra con el fin de analizar e identificar que tanto se encuentran los datos con respecto de su media estadistística. Nos permite identificar que la media de los duelos con Éxito no pasan una cantidad de 50-60 Duelos y además se genera una asimetría ya que se genera una concentración de los datos que tiende ir hacia la derecha, existe un extremo de los datos que posee mas de 150 duelos exitosos debido a condiciones excepcionales de sus juegos, corresponden a cierto grupo selecto de jugadores destacados.
# Discusión Una de las situaciones más difíciles al realizarce un trabajo como éste es encontrarle un enfoque que se le tiene que dar. Es por ello que sedecide dar una visión más general peo a la vez más relevante de como ha sido la situación a medida que ha pasado la temporada 2018/19 en los duelos realizados obteniendo éxitos y fracasos.
# Conclusión El análisis nos lleva a entender que entre éxitos y fracasos existe una tendencia a que los datos se asienten en una determinada cantidad de duelos realizados y que solo unos pocos datos se comporta de forma distinta generando una variación distinta en las gráficas y le llamaremos excepciones y en conclusión podemos determinar que existe una mayor tendencia a que los duelos sean más exitosos a que se se éstos se produzcan fracazos.
# Referencia
Las funciones utilizadas en este trabajo fueron:
R plotting: https://rpubs.com/Paraneda/rplot Estadística Descriptiva: http://www.rpubs.com/paraneda/SD1 Gráficos Estadísticos en R: https://cran.r-project.org/doc/contrib/grafi3.pdf Boxplot: https://www.youtube.com/watch?v=L59qaSEN2EM