# INTRODUCCIÓN

El siguiente trabajo es realizado a partir de la importación del dataset de datos históricos de la liga de futbol Español temporada 2018-2019 específicamente la cúal se extrajo desde la página web (ww.kaggle.com),el dataset fue realizado por el usuario “Alvaro Bartolome” y representa un tema realmente interesante a tomar como objetivo de éste trabajo, el poder evaluar a partir del análisis estadístico a registro de duelos entre jugadores que son valorizados numéricamente y representan duelos con éxito o duelos fallidos en la temporada 2018-2019 de la liga Española.

Los datos se almacenan en un archivo Excel y la cantidad de registros en dicho archivo corresponde a 556 filas de registros.

#DESCRIPCIÓN DE LOS DATOS

Los datos que estan registrados en cada columna permiten reconocer información personal de cada jugador desde su nombre hasta su rendimiento personal en los partidos de fútbol realizados en la temporada 2018/19 de la liga Española.

La tabla contiene 62 columnas las cuales pasaremos a describir:

Equipo: El equipo de fútbol que pertenece el jugador x en la Liga Española.

Posición: ubicación táctica en la cancha de fútbol del jugador x .

Dorsal: Número de camiseta identificadora del jugador x de fútbol de la liga Española.

Nombre : Nombre del jugador x de fútbol de la liga Española temporada 2018/2019

Minutos Jugados: Minutos de juego que lleva el jugador de fútbol x con respecto a lo que lleva en la liga Española temporada 2018/2019

Partidos Jugados : Cantidad de Partidos jugados por el jugador de fútbol x con respecto a lo que lleva en liga Española temporada 2018/2019

Porcentaje de Partidos Jugados: Porcentaje que corresponde al total de los partidos que el jugador de fútbol x ha jugado en la temporada 2018/2019 de la liga Española.

Partidos Jugados Enteros : Cantidad de partidos en el que el jugador de fútbol x jugó como titular los 90 minutos.

Porcentaje de partidos Jugados Enteros : Porcentaje de partidos jugado por completo por parte del jugador de fútbol x

Partidos Jugados como Titular : Cantidad de partidos jugados por el jugador comenzando como titular en cada uno de ellos .

Pocentaje de partidos jugados como titular : Porcentaje de partidos que jugó el jugador de fútbol x como titular en la temporada 2018-2019 de la liga Española

Partidos Sustituido : Cantidad de partidos en que fue sustituido el jugador de fútbol x en la temporada 2018-2019 de la liga Española

Porcentaje de partidos sustituido: Porcentaje de partidos que fue sustituido el jugadorde fútbol x en la temporada 2018-2019 de la liga Española

Tarjeta Amarilla: cantidad de tarjetas amarillas que recibió el jugador de fútbol x en la temporada 2018-19 de la liga Española

Tarjetas Rojas:cantidad de tarjetas rojas que recibió el jugador de fútbol x en la temporada 2018-19 de la liga Española

Segunda Tarjeta Amarilla: cantidad de segundas tarjetas amarillas que recibió el jugador de fútbol x en la temporada 2018-19 de la liga Española.

Goles Marcados: cantidad de goles marcados por el jugador de fútbol x en la temporada 2018-19.

Penaltis Marcados: cantidad de penaltis realizados en la temporada 2018-19

Goles en Propia Puerta: cantidad de goles producidos por x jugador en su propio arco.

Goles encajados mientras el jugador estaba en el campo

Bloqueos: cantidad de intercepciones del balon cuando se dispara a puerta

intercepciones: cantidad de interrupciones a la trayectoria del balon

Recuperaciones: cantidad recuperaciones del balón del jugador x

Despejes:cantidad de desvíos de balón para proteger la defensa.

Entradas Con éxito:cantidad de intercepciones defensivas del balón con éxito

Entradas fallidas:cantidad de intercepciones defensivas del balón con éxito

Jugadas como último Hombre

Duelos con éxito: cantidad de enfrentamientos existosos que tuvo el jugador x en la liga temporada 2018/19.

Duelos Fallidos:cantidad de enfrentamientos fallidos que tuvo el jugador x en la liga temporada 2018/19.

Duelos aéreos con éxito: cantidad de duelos aéreos ganados por el jugador de fútbol x en la temporada 2018/19 de la liga Española

Duelos aéreos fallidos: cantidad de duelos aéreos perdidos por el jugador de fútbol x en la temporada 2018/19 de la liga Española

Fueras de juego Cometidos:cantidad total de fueras de juegos cometidos por el jugador de fútbol x en la temporada 2018/19 de la liga Española

Faltas recibidas: faltas recibidas de jugador de fútbol x por otro jugador

Faltas cometidas: faltas cometidas por el jugador de fútol x.

Penaltis Recibidos: cantidad de penaltis recibidos a favor del jugador x y del equipo

Penaltis Cometidos: cantidad de penaltis cometidos por el jugador x.

Faltas por manos: faltas cometidas por el jugadorde fútbol x

Faltas Cometidas por cada tarjeta Recibida:cantidad de faltas cometidas por el jugador de fútbo x en la temporada 2018/19 Tiros Realizados: cantidad de disparos de balón realizados a cualquier lugar, realizado por el jugador x en la temporada 2018/19 de la liga Española

Tiros a Puerta: cantidad de disparos de balón realizados a puerta por parte del jugador de fútbol x.

Asistencia de Gol: Asistencias de gol realizadas por jugador de fútbol x.

Regates Realizados con éxito: cantidad de regates con el balón por parte de l jugador de fútbol x.

Regates Fallidos: cantidad de regates fallidos con el balón por parte de l jugador de fútbol x.

Goles marcados desde dentro del área: cantidad de goles marcados por el jugador x dentro del área de juego.

Goles marcados desde fuera del área: cantidad de goles marcados por jugador x fuera del área de juego.

Goles marcados con el pie izquierdo: goles marcados por el jugador x de fúbol

Goles marcados con el pie derecho: goles macados por el jugador x de fútbol con el pie derecho.

Goles marcados de penalti: goles marcados de penalti por parte del jugador x de futbol

Goles marcados de cabeza: goles marcados de cabeza por parte del jugador x de fútbol

Goles marcados de jugada a balón parado: goles marcados a balón parado por parte del jugador x de fútbol.

# PROCESAMIENTO

El procesamiento de datos que se quiere hacer es analizar estadísticamente los valores de éxito y fracaso con respecto a los duelos personales que se dan de jugador contra jugador en la temporada 2018/19

# Procesamiento de Datos Los datos rescatados para este analisis provienen de un archivo excel exportado desde el sistema que administra esta información. ##Instalamos las librerias que usaremos, para el correcto manejo de los datos son:

Eliminaremos con RStudio los registros que contengan datos NA ya que no nos sirven para una correcta evaluación de los mismos. Revisaremos algunos gráficos paa identidicar información relevante para nuestro objetivo principal que es analizar los valores de éxitos y fracasos en los correspondientes duelos realizados entre jugadores en la temporada 2018/19

Crearemos tabla con datos filtrados para una mejor visualización del conjunto de datos que necesitamos para identificar la información que queremos obtener.

# OBTENCIÓN

A continuación realizamos la carga de los datos con RStudio desde un archivo excel “laliga_player_stats_spanish” ubicado en carpeta de datos y con el cual se crea un archivo .csv para trabajarlo de una mejor manera en el espacio de trabajo de RStudio, utilizaremos libreria “readr” que nos facilita la lectura de muchos datos en este caso de un archivo .csv.

En la siguiente tabla podemos apreciar que existe registros que son tomados como NA ya que no existe dato en dichas celdas por lo que realizaremos un proceso de limpieza para mantener unos registros mas consistentes para poder realizar el análisis de los datos.

## Parsed with column specification:
## cols(
##   .default = col_double(),
##   Equipo = col_character(),
##   Posicion = col_character(),
##   Nombre = col_character(),
##   `Porcentaje de Partidos jugados` = col_character(),
##   `Porcentaje de Partidos jugados enteros` = col_character(),
##   `Porcentaje de Partidos jugados como titular` = col_character(),
##   `Porcentaje de Partidos sustituido` = col_character()
## )
## See spec(...) for full column specifications.

En ésta siguiente tabla ya podemos ver que se ha realizado su respectiva limpieza de celdas que poseían categoría NA

con respecto a las columnas poseemos 62 columnas pero no todas son necesarias para el propósito que se tiene que es encontrar y evaluar estadísticamente los jugadores que tienen los mejores rendimientos con respecto a su cuota goleadora en la temporada 2018/19 de la liga Española

Las Columnas escogidas para ésto son:

  • Duelos con éxito
  • Duelos fallidos

Observamos un resumen general de todos los datos evaluados estadísticamente

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    3.00   18.00   25.49   37.00  237.00
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    8.00   45.00   53.25   86.00  236.00

** #Transformación** Para facilitar el trabajo con las variables se almacenan las columnas en variables correspondientes

##   [1]   0   3   2  19  54  50  89 100  10  13  98   3 106  71  92  18 101
##  [18]  75 102 168  14   0  12 145 139  42   0   1  49  75  43  18   0  51
##  [35]  26  21   0   7   0  82 126 147 124   0   0   0  11   1   1   0 108
##  [52]  23 178 119  61  58  56   1   0   1   0  38  49   4 102  59  26  18
##  [69]   2  67  30  51  74  63   1  38  91 132   0  63  11  11  35  59   1
##  [86]   0   0  21  76   9  35  30  50  16  62 108  55 142  67  82 196   0
## [103]   0  42  23 181  22  81  17   3   0   0  63  46  10  45  79  58  20
## [120]  11   0   0  83 113 118  36  13  35 106 139 198 119  17  15   0   1
## [137]   0  72  77  33  53  49   7 165 124   0   3 129  22  15  32  17 153
## [154]  87  19 137  99 134   0   3  38   0  34  33  10  33  56  40  14   0
## [171] 118 179 112  90  51  63 114  31   0 137 156  69  31   0   1   0  70
## [188]  53  24  85  34  20  52  18  42  29 198 230 190  37 159 161   1   0
## [205]  90  45  85  10   0   0  15   6  47  51  34  88  76   0   0   0   0
## [222]  19  28 150  33 169 147 128  47 104   1   0   0 113  97  24   2   2
## [239]   1   0  33 154  75 104  48  32  40   0   0  20  65  10  43  88  90
## [256]  51  70 104   8   0   0 146 157 181   0   9   0   1   1   0 106  27
## [273]  18  15  61  10  35  89   0  26  54  75  41  16 216  33 145  59 124
## [290]  82  47   0   0  17  10  72  84  85  45  40   0 118 119  74  32   5
## [307] 134 112   0   0 164  86  73  56  25  38   1   2  59  47  82  39  40
## [324]  72  76   0   0  12 141  64  85  55 108 154  28   0   0   0   0   0
## [341]   0  36  31 119   0   2  93   4  47  21  46  69  50  49   0   0  78
## [358] 131 119  27  33  72  34  83  81   0   0  14 109  68 120  77   3   1
## [375]  70  33  26  39  20 108  24  16   5  31   7  77  98 162  41   1  63
## [392]  52   2   0  39   1   0  80 188 115  96  31  59   3   2   0  10  13
## [409]  37  76  97  29  80  35  99 109 240  61  20  25 158   4  38 120  60
## [426]  66   0   0   1  17  54  18  83  39  21  25  76   7 141 134  91   3
## [443]  63  76  54  48  85  72 127 101  98   2   0   0  38  26  43  12  56
## [460]  14  15  51  28 110 183  34  34  41 148  23 180  24   7 104 128  51
## [477]  66   1   1  38  41  26 111   9  67  25   0  57  90 157 120  91   4
## [494]  69  65   0  57 102  46 124  77   0   1   0  94  40  63  33  38  34
## [511]   2  75 142  72  89 122  14 142   0  19 115   0   0 131  56  96
##   [1]   0   3   0  19 108  76  52 154  10  13  72   3  88  46  85   8  80
##  [18]  50  76 126  17   0   6 127 169  13   0   5  80 103  87  18   0  57
##  [35]  60  50   5   9   0 121 135 141 163   0   0   0   2   0   1   0  82
##  [52]  15 135 118  28  55  84   2   0   0   0  49  69  10  81  60  26  30
##  [69]   3  77  67  37  64  45   1  19 120  88   0  60   8   7  26  37   3
##  [86]   0   0  22 136  10  59  55 105  16  97 123  62 145  59  96 113   0
## [103]   0  45   9 123  28  33   6   3   0   0  84  73  10  67  74  76  27
## [120]  10   0   0 101 151 111  65  16  33 115 109 211 112  23  11   0   4
## [137]   0  98  81  38  63  56   4 171  78   0   2  99  13  22  34  15 146
## [154]  98  26  91  57  89   2   4  29   2  26  45  22  53  66  78  15   0
## [171] 130 156 176  87  43  68 117  54   0 108 105  21  22   0   3   2  66
## [188]  62  33  86  45  29  35  21  33  21 159 142 168  38 123 144   8   0
## [205]  62  40  47   8   2   0  23  12 103  73  53  67 157   0   0   0   0
## [222]  13  23 152  26 226 143 101  52  91   1   0   1  71  72  13   3   3
## [239]   6   0  29 162  86 135  70  62  52   0   0  13  53  10  33 110  63
## [256]  77  51  97   7   0   0 133  93 135   0  10   1   1   1   0 121  31
## [273]  48  27  88  14  42 122   0  24  47 109  25   7 236  36 141  58  80
## [290]  78  51   0   4  24  14  73 104 113  74  34   0  83 122 105  49   8
## [307] 128 126   0   0  92  66  48  58  10  34   1   2 105  65 136  76  25
## [324]  90  79   0   0   9 147  70 123  88  85 180  38   0   0   0   0   0
## [341]   0  23  23  78   0   4 108   8  77  46  47  87  54  63   0   0 117
## [358] 148 149  27  30  72  40  95  86   0   0   7  91  60 114  72   5   2
## [375] 119  40  30  88  21 165  35  39   8  39  10  80 109 113  29   0  62
## [392]  52   0   0  32   1   0  64 118 111  55  18  54   0   2   0   8  36
## [409]  59 128  82  41  90  40 126 160 183  51  13  11 144   1  23  63  32
## [426]  31   0   2   1  27  57  30  94  47  26  28 118   9  99  95  53   3
## [443]  49 112  66  39  85  69  98  84  60   4   1   0  56  38  48  13  76
## [460]  21  20  54  40  95 192  24  22  92 104  32 160  23   5  87  49  59
## [477]  74   0   2  65  57  28 175   8  76  32   0  86 117 112 161  81   2
## [494] 102  83   0  37 103  39  68  51   2   1   0  85  75  67  46  65  36
## [511]   2  91 128  70  72 103  12 174   0   9  91   0   0  88  24  91

procedemos a calcular la media, mediana, la mínima y máxima

## [1] 52.8346
## [1] 39
## [1] 0
## [1] 240
## [1] 53.24525
## [1] 45
## [1] 0
## [1] 236

Se genera un histograma en cada gráfico para mostrar la relación entre el total de duelos y los duelos exitosos o fallidos.

#Resultado Luego de realizar todo el análisis al dataset presentado, se cumple el objetivo principal el cual era informar sobre la cantidad de Duelos con éxito y facaso en la temporada 2018/19 de a liga Española,

Se genera un boxplot que muestra con el fin de analizar e identificar que tanto se encuentran los datos con respecto de su media estadistística. Nos permite identificar que la media de los duelos con Éxito no pasan una cantidad de 50-60 Duelos y además se genera una asimetría ya que se genera una concentración de los datos que tiende ir hacia la derecha, existe un extremo de los datos que posee mas de 150 duelos exitosos debido a condiciones excepcionales de sus juegos, corresponden a cierto grupo selecto de jugadores destacados.

# Discusión Una de las situaciones más difíciles al realizarce un trabajo como éste es encontrarle un enfoque que se le tiene que dar. Es por ello que sedecide dar una visión más general peo a la vez más relevante de como ha sido la situación a medida que ha pasado la temporada 2018/19 en los duelos realizados obteniendo éxitos y fracasos.

# Conclusión El análisis nos lleva a entender que entre éxitos y fracasos existe una tendencia a que los datos se asienten en una determinada cantidad de duelos realizados y que solo unos pocos datos se comporta de forma distinta generando una variación distinta en las gráficas y le llamaremos excepciones y en conclusión podemos determinar que existe una mayor tendencia a que los duelos sean más exitosos a que se se éstos se produzcan fracazos.

# Referencia

Las funciones utilizadas en este trabajo fueron:

R plotting: https://rpubs.com/Paraneda/rplot Estadística Descriptiva: http://www.rpubs.com/paraneda/SD1 Gráficos Estadísticos en R: https://cran.r-project.org/doc/contrib/grafi3.pdf Boxplot: https://www.youtube.com/watch?v=L59qaSEN2EM