Objetivo

O intuito do trabalho tem como objetivo fazer uso de alguns metodos estátisticos com embasamento nos dados da UEFA e da FIFA, o Fifa 17, de uma amostra de 18207 objetos e 89 variáveis foi feita uma seleção de 6 dessas variáveis, são elas: Potential (potencial do atleta), overall(avaliação do atleta), preferred foot(perna boa), Age(idade), Aggression(agressividade) e Interceptions(interceptação). Com isso buscamos uma análise dos jogadores acerca de suas características individuais e como isso influencia na jogabilidade dentro do campo.

Hipótese

Nessa análise buscamos entender o que se faz necessário para um bom desempenho dentro do campo. Para isso fizemos a seleção de 6 variáveis, referente ao ano de 2017, com jogadores advindos de clubes espalhados pelo mundo e com as mais diversas características físicas e técnicas, sendo assim, possuímos uma extensa amostragem, fazendo com que nossa análise seja ampla e inclusiva. A partir disso identificaremos se há uma influência da idade, potencial, agressividade e interceptação na qualidade do jogador.

Metodologias

Boxplot: O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do dados. O boxplot é formado pelo primeiro e terceiro quartil e pela mediana. Ele pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos.

Diagrama de dispersão: o Diagrama de Dispersão é uma representação gráfica da possível relação entre duas variáveis e, dessa forma, mostra de forma gráfica os pares de dados numéricos e sua relação. Além disso, ele é utilizado para validar se determinada variável independente analisada tem impacto real em determinada variável dependente.

Matriz de correlação: A Matriz de Correlação possibilita a análise simultânea da associação entre variáveis, através dos coeficientes de Pearson, Spearman ou Kendall. E com isso podemos analisar o coeficiente de correlação das variáveis selecionadas.

Fonte de dados

https://github.com/UBC-MDS/DSCI532_Group17-R

library(readr)
Fifa <- read_csv("C:/Users/Usuario/Downloads/data.csv")
## Warning: Missing column names filled in: 'X1' [1]
## 
## -- Column specification --------------------------------------------------------
## cols(
##   .default = col_character(),
##   X1 = col_double(),
##   ID = col_double(),
##   Age = col_double(),
##   Overall = col_double(),
##   Potential = col_double(),
##   Special = col_double(),
##   `International Reputation` = col_double(),
##   `Weak Foot` = col_double(),
##   `Skill Moves` = col_double(),
##   `Jersey Number` = col_double(),
##   Crossing = col_double(),
##   Finishing = col_double(),
##   HeadingAccuracy = col_double(),
##   ShortPassing = col_double(),
##   Volleys = col_double(),
##   Dribbling = col_double(),
##   Curve = col_double(),
##   FKAccuracy = col_double(),
##   LongPassing = col_double(),
##   BallControl = col_double()
##   # ... with 24 more columns
## )
## i Use `spec()` for the full column specifications.

Bibliotecas utilizadas

library(readr)
library(kableExtra)
library(ggplot2)
library(ggthemes)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
## 
##     group_rows
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)

Descrição detalhada do conjunto de dados

str(Fifa)
## spec_tbl_df [18,207 x 89] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ X1                      : num [1:18207] 0 1 2 3 4 5 6 7 8 9 ...
##  $ ID                      : num [1:18207] 158023 20801 190871 193080 192985 ...
##  $ Name                    : chr [1:18207] "L. Messi" "Cristiano Ronaldo" "Neymar Jr" "De Gea" ...
##  $ Age                     : num [1:18207] 31 33 26 27 27 27 32 31 32 25 ...
##  $ Photo                   : chr [1:18207] "https://cdn.sofifa.org/players/4/19/158023.png" "https://cdn.sofifa.org/players/4/19/20801.png" "https://cdn.sofifa.org/players/4/19/190871.png" "https://cdn.sofifa.org/players/4/19/193080.png" ...
##  $ Nationality             : chr [1:18207] "Argentina" "Portugal" "Brazil" "Spain" ...
##  $ Flag                    : chr [1:18207] "https://cdn.sofifa.org/flags/52.png" "https://cdn.sofifa.org/flags/38.png" "https://cdn.sofifa.org/flags/54.png" "https://cdn.sofifa.org/flags/45.png" ...
##  $ Overall                 : num [1:18207] 94 94 92 91 91 91 91 91 91 90 ...
##  $ Potential               : num [1:18207] 94 94 93 93 92 91 91 91 91 93 ...
##  $ Club                    : chr [1:18207] "FC Barcelona" "Juventus" "Paris Saint-Germain" "Manchester United" ...
##  $ Club Logo               : chr [1:18207] "https://cdn.sofifa.org/teams/2/light/241.png" "https://cdn.sofifa.org/teams/2/light/45.png" "https://cdn.sofifa.org/teams/2/light/73.png" "https://cdn.sofifa.org/teams/2/light/11.png" ...
##  $ Value                   : chr [1:18207] "\200110.5M" "\20077M" "\200118.5M" "\20072M" ...
##  $ Wage                    : chr [1:18207] "\200565K" "\200405K" "\200290K" "\200260K" ...
##  $ Special                 : num [1:18207] 2202 2228 2143 1471 2281 ...
##  $ Preferred Foot          : chr [1:18207] "Left" "Right" "Right" "Right" ...
##  $ International Reputation: num [1:18207] 5 5 5 4 4 4 4 5 4 3 ...
##  $ Weak Foot               : num [1:18207] 4 4 5 3 5 4 4 4 3 3 ...
##  $ Skill Moves             : num [1:18207] 4 5 5 1 4 4 4 3 3 1 ...
##  $ Work Rate               : chr [1:18207] "Medium/ Medium" "High/ Low" "High/ Medium" "Medium/ Medium" ...
##  $ Body Type               : chr [1:18207] "Messi" "C. Ronaldo" "Neymar" "Lean" ...
##  $ Real Face               : chr [1:18207] "Yes" "Yes" "Yes" "Yes" ...
##  $ Position                : chr [1:18207] "RF" "ST" "LW" "GK" ...
##  $ Jersey Number           : num [1:18207] 10 7 10 1 7 10 10 9 15 1 ...
##  $ Joined                  : chr [1:18207] "Jul 1, 2004" "Jul 10, 2018" "Aug 3, 2017" "Jul 1, 2011" ...
##  $ Loaned From             : chr [1:18207] NA NA NA NA ...
##  $ Contract Valid Until    : chr [1:18207] "2021" "2022" "2022" "2020" ...
##  $ Height                  : chr [1:18207] "5'7" "6'2" "5'9" "6'4" ...
##  $ Weight                  : chr [1:18207] "159lbs" "183lbs" "150lbs" "168lbs" ...
##  $ LS                      : chr [1:18207] "88+2" "91+3" "84+3" NA ...
##  $ ST                      : chr [1:18207] "88+2" "91+3" "84+3" NA ...
##  $ RS                      : chr [1:18207] "88+2" "91+3" "84+3" NA ...
##  $ LW                      : chr [1:18207] "92+2" "89+3" "89+3" NA ...
##  $ LF                      : chr [1:18207] "93+2" "90+3" "89+3" NA ...
##  $ CF                      : chr [1:18207] "93+2" "90+3" "89+3" NA ...
##  $ RF                      : chr [1:18207] "93+2" "90+3" "89+3" NA ...
##  $ RW                      : chr [1:18207] "92+2" "89+3" "89+3" NA ...
##  $ LAM                     : chr [1:18207] "93+2" "88+3" "89+3" NA ...
##  $ CAM                     : chr [1:18207] "93+2" "88+3" "89+3" NA ...
##  $ RAM                     : chr [1:18207] "93+2" "88+3" "89+3" NA ...
##  $ LM                      : chr [1:18207] "91+2" "88+3" "88+3" NA ...
##  $ LCM                     : chr [1:18207] "84+2" "81+3" "81+3" NA ...
##  $ CM                      : chr [1:18207] "84+2" "81+3" "81+3" NA ...
##  $ RCM                     : chr [1:18207] "84+2" "81+3" "81+3" NA ...
##  $ RM                      : chr [1:18207] "91+2" "88+3" "88+3" NA ...
##  $ LWB                     : chr [1:18207] "64+2" "65+3" "65+3" NA ...
##  $ LDM                     : chr [1:18207] "61+2" "61+3" "60+3" NA ...
##  $ CDM                     : chr [1:18207] "61+2" "61+3" "60+3" NA ...
##  $ RDM                     : chr [1:18207] "61+2" "61+3" "60+3" NA ...
##  $ RWB                     : chr [1:18207] "64+2" "65+3" "65+3" NA ...
##  $ LB                      : chr [1:18207] "59+2" "61+3" "60+3" NA ...
##  $ LCB                     : chr [1:18207] "47+2" "53+3" "47+3" NA ...
##  $ CB                      : chr [1:18207] "47+2" "53+3" "47+3" NA ...
##  $ RCB                     : chr [1:18207] "47+2" "53+3" "47+3" NA ...
##  $ RB                      : chr [1:18207] "59+2" "61+3" "60+3" NA ...
##  $ Crossing                : num [1:18207] 84 84 79 17 93 81 86 77 66 13 ...
##  $ Finishing               : num [1:18207] 95 94 87 13 82 84 72 93 60 11 ...
##  $ HeadingAccuracy         : num [1:18207] 70 89 62 21 55 61 55 77 91 15 ...
##  $ ShortPassing            : num [1:18207] 90 81 84 50 92 89 93 82 78 29 ...
##  $ Volleys                 : num [1:18207] 86 87 84 13 82 80 76 88 66 13 ...
##  $ Dribbling               : num [1:18207] 97 88 96 18 86 95 90 87 63 12 ...
##  $ Curve                   : num [1:18207] 93 81 88 21 85 83 85 86 74 13 ...
##  $ FKAccuracy              : num [1:18207] 94 76 87 19 83 79 78 84 72 14 ...
##  $ LongPassing             : num [1:18207] 87 77 78 51 91 83 88 64 77 26 ...
##  $ BallControl             : num [1:18207] 96 94 95 42 91 94 93 90 84 16 ...
##  $ Acceleration            : num [1:18207] 91 89 94 57 78 94 80 86 76 43 ...
##  $ SprintSpeed             : num [1:18207] 86 91 90 58 76 88 72 75 75 60 ...
##  $ Agility                 : num [1:18207] 91 87 96 60 79 95 93 82 78 67 ...
##  $ Reactions               : num [1:18207] 95 96 94 90 91 90 90 92 85 86 ...
##  $ Balance                 : num [1:18207] 95 70 84 43 77 94 94 83 66 49 ...
##  $ ShotPower               : num [1:18207] 85 95 80 31 91 82 79 86 79 22 ...
##  $ Jumping                 : num [1:18207] 68 95 61 67 63 56 68 69 93 76 ...
##  $ Stamina                 : num [1:18207] 72 88 81 43 90 83 89 90 84 41 ...
##  $ Strength                : num [1:18207] 59 79 49 64 75 66 58 83 83 78 ...
##  $ LongShots               : num [1:18207] 94 93 82 12 91 80 82 85 59 12 ...
##  $ Aggression              : num [1:18207] 48 63 56 38 76 54 62 87 88 34 ...
##  $ Interceptions           : num [1:18207] 22 29 36 30 61 41 83 41 90 19 ...
##  $ Positioning             : num [1:18207] 94 95 89 12 87 87 79 92 60 11 ...
##  $ Vision                  : num [1:18207] 94 82 87 68 94 89 92 84 63 70 ...
##  $ Penalties               : num [1:18207] 75 85 81 40 79 86 82 85 75 11 ...
##  $ Composure               : num [1:18207] 96 95 94 68 88 91 84 85 82 70 ...
##  $ Marking                 : num [1:18207] 33 28 27 15 68 34 60 62 87 27 ...
##  $ StandingTackle          : num [1:18207] 28 31 24 21 58 27 76 45 92 12 ...
##  $ SlidingTackle           : num [1:18207] 26 23 33 13 51 22 73 38 91 18 ...
##  $ GKDiving                : num [1:18207] 6 7 9 90 15 11 13 27 11 86 ...
##  $ GKHandling              : num [1:18207] 11 11 9 85 13 12 9 25 8 92 ...
##  $ GKKicking               : num [1:18207] 15 15 15 87 5 6 7 31 9 78 ...
##  $ GKPositioning           : num [1:18207] 14 14 15 88 10 8 14 33 7 88 ...
##  $ GKReflexes              : num [1:18207] 8 11 11 94 13 8 9 37 11 89 ...
##  $ Release Clause          : chr [1:18207] "\200226.5M" "\200127.1M" "\200228.1M" "\200138.6M" ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   X1 = col_double(),
##   ..   ID = col_double(),
##   ..   Name = col_character(),
##   ..   Age = col_double(),
##   ..   Photo = col_character(),
##   ..   Nationality = col_character(),
##   ..   Flag = col_character(),
##   ..   Overall = col_double(),
##   ..   Potential = col_double(),
##   ..   Club = col_character(),
##   ..   `Club Logo` = col_character(),
##   ..   Value = col_character(),
##   ..   Wage = col_character(),
##   ..   Special = col_double(),
##   ..   `Preferred Foot` = col_character(),
##   ..   `International Reputation` = col_double(),
##   ..   `Weak Foot` = col_double(),
##   ..   `Skill Moves` = col_double(),
##   ..   `Work Rate` = col_character(),
##   ..   `Body Type` = col_character(),
##   ..   `Real Face` = col_character(),
##   ..   Position = col_character(),
##   ..   `Jersey Number` = col_double(),
##   ..   Joined = col_character(),
##   ..   `Loaned From` = col_character(),
##   ..   `Contract Valid Until` = col_character(),
##   ..   Height = col_character(),
##   ..   Weight = col_character(),
##   ..   LS = col_character(),
##   ..   ST = col_character(),
##   ..   RS = col_character(),
##   ..   LW = col_character(),
##   ..   LF = col_character(),
##   ..   CF = col_character(),
##   ..   RF = col_character(),
##   ..   RW = col_character(),
##   ..   LAM = col_character(),
##   ..   CAM = col_character(),
##   ..   RAM = col_character(),
##   ..   LM = col_character(),
##   ..   LCM = col_character(),
##   ..   CM = col_character(),
##   ..   RCM = col_character(),
##   ..   RM = col_character(),
##   ..   LWB = col_character(),
##   ..   LDM = col_character(),
##   ..   CDM = col_character(),
##   ..   RDM = col_character(),
##   ..   RWB = col_character(),
##   ..   LB = col_character(),
##   ..   LCB = col_character(),
##   ..   CB = col_character(),
##   ..   RCB = col_character(),
##   ..   RB = col_character(),
##   ..   Crossing = col_double(),
##   ..   Finishing = col_double(),
##   ..   HeadingAccuracy = col_double(),
##   ..   ShortPassing = col_double(),
##   ..   Volleys = col_double(),
##   ..   Dribbling = col_double(),
##   ..   Curve = col_double(),
##   ..   FKAccuracy = col_double(),
##   ..   LongPassing = col_double(),
##   ..   BallControl = col_double(),
##   ..   Acceleration = col_double(),
##   ..   SprintSpeed = col_double(),
##   ..   Agility = col_double(),
##   ..   Reactions = col_double(),
##   ..   Balance = col_double(),
##   ..   ShotPower = col_double(),
##   ..   Jumping = col_double(),
##   ..   Stamina = col_double(),
##   ..   Strength = col_double(),
##   ..   LongShots = col_double(),
##   ..   Aggression = col_double(),
##   ..   Interceptions = col_double(),
##   ..   Positioning = col_double(),
##   ..   Vision = col_double(),
##   ..   Penalties = col_double(),
##   ..   Composure = col_double(),
##   ..   Marking = col_double(),
##   ..   StandingTackle = col_double(),
##   ..   SlidingTackle = col_double(),
##   ..   GKDiving = col_double(),
##   ..   GKHandling = col_double(),
##   ..   GKKicking = col_double(),
##   ..   GKPositioning = col_double(),
##   ..   GKReflexes = col_double(),
##   ..   `Release Clause` = col_character()
##   .. )

Análise descritiva dos dados

ggplot(Fifa) +
 aes(x = "", y = Overall) +
 geom_boxplot(shape = "circle", fill = "#EF562D") +
 labs(y = "Avaliação do jogador", 
 title = "Boxplot da avaliação do jogador", subtitle = "Gráfico de boxplot") +
 ggthemes::theme_pander() +
 theme(plot.title = element_text(size = 15L, face = "bold", hjust = 0.5), axis.title.y = element_text(size = 14L))

resumo <- summary(Fifa$Overall)  
resumo_valores <- cbind(resumo[1],resumo[2],resumo[3],resumo[4],resumo[5],resumo[6])
colnames(resumo_valores) <- c("Mínimo", "1° quartil",  "Mediana",    "Média", "3° quartil",  "Máximo") 
rownames(resumo_valores) <- c("Resumo")
resumo_valores %>%
  kbl(caption = "Medidas descritivas para o Overall") %>% 
  kable_classic(full_width = F, html_font = "Cambria")
Medidas descritivas para o Overall
Mínimo 1° quartil Mediana Média 3° quartil Máximo
Resumo 46 62 66 66.2387 71 94

Escolhemos analisar os índices de overall dos jogadores por meio de gráfico Bloxpot, por acreditarmos ser uma ferramenta bem visual e clara dos números e dados em questão. Através dessa observação, podemos afirmar que a média de pontuação dos atletas circula por volta de 66 pontos, o atleta com menor desempenho possui 46 pontos, representando um outlier, assim como atletas com pontuação acima de 90 pontos. Além disso, podemos ver uma simetria dos dados, visto que a mediana está na mesma distância para o primeiro quartil e para o terceiro.

ggplot(Fifa) +
 aes(x = Overall, y = Potential) +
 geom_point(shape = "bullet", size = 1.7, colour = "#010610") +
 labs(x = "Avaliação do jogador", y = "Potencial do jogador", title = "Dispersão entre o potencial e a avaliação do jogador", 
 subtitle = "Gráfico de dispersão") +
 ggthemes::theme_fivethirtyeight() +
 theme(plot.title = element_text(size = 15L, 
 hjust = 0.5), axis.title.y = element_text(size = 13L), axis.title.x = element_text(size = 13L))

cor(Fifa$Overall,Fifa$Potential)
## [1] 0.6609385

Foi desenvolvido um gráfico de dispersão para para analisar o potencial e a classificação dos jogadores e foi possível observar e obter o índice de 0,66, sendo considerado um grau bom de associação de potencial e classificação do jogador. A partir disso, podemos notar que o potencial é gradual à avaliação do atleta, demonstrando que através de uma classificação elevada, a evolução será acelerada também.

library(tidyr)
table(Fifa$`Preferred Foot`)
## 
##  Left Right 
##  4211 13948
Fifa %>% drop_na(`Preferred Foot`) %>%
  ggplot(aes(x =`Preferred Foot`, y = Potential))+
  geom_boxplot(aes(fill = `Preferred Foot`),
               alpha = 0.8 )+ 
  labs(title = "Gráfico de boxplot entre destro e canhoto com o potencial do jogador",         
       subtitle = "",
       x="Destro ou Canhoto",
       y="Potencial",
       fill="Destro ou canhoto")

Analisando o gráfico Bloxpot que compara o potencial do jogador em relação a sua perna dominante, podemos concluir que a média potencial de canhotos e destros é aproximadamente 70. Porém, existem mais jogadores destros com índices mais elevados do que canhotos, visto que existem menos atletas sinistros no esporte, sendo assim, nota-se que há um número maior de outliers por parte dos jogadores destros, concluindo que ocorre uma oscilação no potencial do atleta, havendo a chance do mesmo ter um potencial maior ou menor.

par(bg="lightyellow")
plot(Fifa$Aggression,Fifa$Interceptions,pch=20,col="brown",
     main = "Diagrama de dispersão agressividade X Boa Interceptação",
     xlab="Agressividade",
     ylab = "Interceptação")
abline(lsfit(Fifa$Aggression,Fifa$Interceptions),col="darkred")
## Warning in lsfit(Fifa$Aggression, Fifa$Interceptions): 48 missing values deleted

Observando o diagrama de dispersão que compara as características de agressividade e boa interceptação, podemos observar que obtivemos um alto grau de associação, tendo como índice o valor de 0,75. Dessa forma, infere-se que quanto maior a agressividade, melhor será a ação defensiva do jogador, melhorando assim, o desempenho do atleta dentro de campo.

par(bg="lightgray")
plot(Fifa$Age,Fifa$Potential,pch=20,col="red",
     main = "Diagrama de dispersão idade X potencial do jogador",
     xlab="Idade",
     ylab = "Potencial do jogador")
abline(lsfit(Fifa$Age,Fifa$Potential),col="black")

cor(Fifa$Age,Fifa$Potential)
## [1] -0.2533121

Analisando o gráfico de dispersão que relaciona a idade do atleta com o potencial do mesmo, podemos observar um índice negativo, sendo computado o valor de -0,25 de grau associativo. Desse modo, podemos concluir que quanto maior a idade do jogador, menor será o seu potencial. Algo que podemos observar ao acompanhar diversos outros esportes, tendo em vista que o pico do potencial dos atletas gira em torno dos seus 25 anos devido a projeções de melhorias técnica e física.

library(corrplot)
## corrplot 0.84 loaded
Fifa2<- Fifa  %>% select(Potential,Overall,Age,Aggression,Interceptions) 
Fifa2 <-na.omit(Fifa2)
cor(Fifa2)
##                Potential   Overall        Age Aggression Interceptions
## Potential      1.0000000 0.6611801 -0.2522812  0.1711743     0.1549080
## Overall        0.6611801 1.0000000  0.4530693  0.3954700     0.3213263
## Age           -0.2522812 0.4530693  1.0000000  0.2651900     0.1978447
## Aggression     0.1711743 0.3954700  0.2651900  1.0000000     0.7518973
## Interceptions  0.1549080 0.3213263  0.1978447  0.7518973     1.0000000
MCorr <- cor(Fifa2)
corrplot(MCorr,addCoef.col=TRUE,number.cex=0.7)

Através da matriz de correlação é possível observar como os índices de diversas características dos jogadores conversam entre si, como por exemplo, é possível observar correlações fortes entre overall e potencial, agressividade e interceptação. Mas também podemos notar uma baixa relação entre potencial, agressividade e interceptação, visto que uma não impulsiona a outra. Além disso é válido ressaltar que a idade não influencia a classificação do atleta, demonstrando que o físico não é o único ponto a ser levado em conta, a qualidade técnica também predomina na hora de sua avaliação.

Teste de hipótese

Teste de correlação Quanti x Quanti

Considerando que a variável overall tem distribuição não normal, o teste de Correlação será o teste de Spearman.

Hipóteses:

H_0:NÃO existe correlação entre as variáveis

H_1:Existe correlação entre as variáveis

Teste de Spearman

p-value <= 0,05 → Rejeito a hipótese nula → Existe correlação

p-value > 0,05 → Não rejeito a hipótese nula → NÃO existe correlação

with(Fifa,cor.test(Overall,Potential, alternative="two.sided", method="spearman"))
## Warning in cor.test.default(Overall, Potential, alternative = "two.sided", :
## Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  Overall and Potential
## S = 3.7686e+11, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.6253591

pvalue = 2.2e-16 alpha 0,05 < alpha REJ H0 -> Há correlação

Logo, há correlação entre as variáveis

Teste de correlação Quanti x Quali

Hipóteses

H_0:Mesma distribuição

H_1:Pelo menos um dos grupos segue uma distribuição diferente.

Teste de Kruskal-Wallis

Fifa %>% drop_na(`Preferred Foot`) %>%
  with(Fifa, tapply(`Preferred Foot`, Potential, median, na.rm=TRUE))
## # A tibble: 18,207 x 89
##       X1     ID Name     Age Photo    Nationality Flag   Overall Potential Club 
##    <dbl>  <dbl> <chr>  <dbl> <chr>    <chr>       <chr>    <dbl>     <dbl> <chr>
##  1     0 158023 L. Me~    31 https:/~ Argentina   https~      94        94 FC B~
##  2     1  20801 Crist~    33 https:/~ Portugal    https~      94        94 Juve~
##  3     2 190871 Neyma~    26 https:/~ Brazil      https~      92        93 Pari~
##  4     3 193080 De Gea    27 https:/~ Spain       https~      91        93 Manc~
##  5     4 192985 K. De~    27 https:/~ Belgium     https~      91        92 Manc~
##  6     5 183277 E. Ha~    27 https:/~ Belgium     https~      91        91 Chel~
##  7     6 177003 L. Mo~    32 https:/~ Croatia     https~      91        91 Real~
##  8     7 176580 L. Su~    31 https:/~ Uruguay     https~      91        91 FC B~
##  9     8 155862 Sergi~    32 https:/~ Spain       https~      91        91 Real~
## 10     9 200389 J. Ob~    25 https:/~ Slovenia    https~      90        93 Atlé~
## # ... with 18,197 more rows, and 79 more variables: Club Logo <chr>,
## #   Value <chr>, Wage <chr>, Special <dbl>, Preferred Foot <chr>,
## #   International Reputation <dbl>, Weak Foot <dbl>, Skill Moves <dbl>,
## #   Work Rate <chr>, Body Type <chr>, Real Face <chr>, Position <chr>,
## #   Jersey Number <dbl>, Joined <chr>, Loaned From <chr>,
## #   Contract Valid Until <chr>, Height <chr>, Weight <chr>, LS <chr>, ST <chr>,
## #   RS <chr>, LW <chr>, LF <chr>, CF <chr>, RF <chr>, RW <chr>, LAM <chr>,
## #   CAM <chr>, RAM <chr>, LM <chr>, LCM <chr>, CM <chr>, RCM <chr>, RM <chr>,
## #   LWB <chr>, LDM <chr>, CDM <chr>, RDM <chr>, RWB <chr>, LB <chr>, LCB <chr>,
## #   CB <chr>, RCB <chr>, RB <chr>, Crossing <dbl>, Finishing <dbl>,
## #   HeadingAccuracy <dbl>, ShortPassing <dbl>, Volleys <dbl>, Dribbling <dbl>,
## #   Curve <dbl>, FKAccuracy <dbl>, LongPassing <dbl>, BallControl <dbl>,
## #   Acceleration <dbl>, SprintSpeed <dbl>, Agility <dbl>, Reactions <dbl>,
## #   Balance <dbl>, ShotPower <dbl>, Jumping <dbl>, Stamina <dbl>,
## #   Strength <dbl>, LongShots <dbl>, Aggression <dbl>, Interceptions <dbl>,
## #   Positioning <dbl>, Vision <dbl>, Penalties <dbl>, Composure <dbl>,
## #   Marking <dbl>, StandingTackle <dbl>, SlidingTackle <dbl>, GKDiving <dbl>,
## #   GKHandling <dbl>, GKKicking <dbl>, GKPositioning <dbl>, GKReflexes <dbl>,
## #   Release Clause <chr>
kruskal.test(Potential ~ `Preferred Foot`, data=Fifa)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Potential by Preferred Foot
## Kruskal-Wallis chi-squared = 23.236, df = 1, p-value = 1.433e-06

pvalue = 1.433e-06 alpha 0,05 pvalor < alpha REJ H0 -> Segue distribuição diferente

No caso, o potencial de destros é maior que o de canhotos.

Conclusão

Portanto, por meio de toda a avaliação que fizemos através dos mais diversos tipos de gráficos pela plataforma RStudio, podemos afirmar pontos como a média de overall de todos os jogadores no jogo é de 66, tendo poucos atletas com pontuação acima de 90 e abaixo de 46. Também foi possível constatar que jogadores com menos idade possuem um potencial de desenvolvimento maior quando comparados a personagens mais velhos, tendo um bom índice associativo. Essa análise nos permite entender a valorização do passe de um atleta de acordo com a sua idade. No futebol, jovens são negociados por valores exorbitantes enquanto profissionais que estão mais próximos do final da carreira possuem um valor de mercado menor.
Assim como pode-se observar que jogadores com maior agressividade possuem melhores números relativos a característica defensiva de interceptação de bolas. Esse fator se torna um pouco óbvio, visto que a força aplicada sobre determinadas jogadas em um esporte de contato faz enorme diferença em uma disputa de bola. Ademais, em diversos casos, jogadores com essa qualidade bem desenvolvida são escolhidos para setores defensivos propositalmente.
Além disso, foi possível observar que a média de potencial de jogadores destros e canhotos são equivalentes, apesar de existirem mais atletas que possuem mais habilidades com a mão direita, e inclusive existem menos jogadores sinistros acima da média quando comparados aos destros.
A última matriz analisada foi a de correlação entre os itens que constituem o overall de um jogador, tendo como grau associativo de 0,75, evidenciando o alto grau competitivo e equilibrado do jogo que o faz ser um sucesso mundial entre os amantes de videogames, sendo bastante verossímil, isso sendo atestado pelos fãs da NBA.