O intuito do trabalho tem como objetivo fazer uso de alguns metodos estátisticos com embasamento nos dados da UEFA e da FIFA, o Fifa 17, de uma amostra de 18207 objetos e 89 variáveis foi feita uma seleção de 6 dessas variáveis, são elas: Potential (potencial do atleta), overall(avaliação do atleta), preferred foot(perna boa), Age(idade), Aggression(agressividade) e Interceptions(interceptação). Com isso buscamos uma análise dos jogadores acerca de suas características individuais e como isso influencia na jogabilidade dentro do campo.
Nessa análise buscamos entender o que se faz necessário para um bom desempenho dentro do campo. Para isso fizemos a seleção de 6 variáveis, referente ao ano de 2017, com jogadores advindos de clubes espalhados pelo mundo e com as mais diversas características físicas e técnicas, sendo assim, possuímos uma extensa amostragem, fazendo com que nossa análise seja ampla e inclusiva. A partir disso identificaremos se há uma influência da idade, potencial, agressividade e interceptação na qualidade do jogador.
Boxplot: O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do dados. O boxplot é formado pelo primeiro e terceiro quartil e pela mediana. Ele pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos.
Diagrama de dispersão: o Diagrama de Dispersão é uma representação gráfica da possível relação entre duas variáveis e, dessa forma, mostra de forma gráfica os pares de dados numéricos e sua relação. Além disso, ele é utilizado para validar se determinada variável independente analisada tem impacto real em determinada variável dependente.
Matriz de correlação: A Matriz de Correlação possibilita a análise simultânea da associação entre variáveis, através dos coeficientes de Pearson, Spearman ou Kendall. E com isso podemos analisar o coeficiente de correlação das variáveis selecionadas.
https://github.com/UBC-MDS/DSCI532_Group17-R
library(readr)
Fifa <- read_csv("C:/Users/Usuario/Downloads/data.csv")
## Warning: Missing column names filled in: 'X1' [1]
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_character(),
## X1 = col_double(),
## ID = col_double(),
## Age = col_double(),
## Overall = col_double(),
## Potential = col_double(),
## Special = col_double(),
## `International Reputation` = col_double(),
## `Weak Foot` = col_double(),
## `Skill Moves` = col_double(),
## `Jersey Number` = col_double(),
## Crossing = col_double(),
## Finishing = col_double(),
## HeadingAccuracy = col_double(),
## ShortPassing = col_double(),
## Volleys = col_double(),
## Dribbling = col_double(),
## Curve = col_double(),
## FKAccuracy = col_double(),
## LongPassing = col_double(),
## BallControl = col_double()
## # ... with 24 more columns
## )
## i Use `spec()` for the full column specifications.
library(readr)
library(kableExtra)
library(ggplot2)
library(ggthemes)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
##
## group_rows
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(tidyr)
str(Fifa)
## spec_tbl_df [18,207 x 89] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ X1 : num [1:18207] 0 1 2 3 4 5 6 7 8 9 ...
## $ ID : num [1:18207] 158023 20801 190871 193080 192985 ...
## $ Name : chr [1:18207] "L. Messi" "Cristiano Ronaldo" "Neymar Jr" "De Gea" ...
## $ Age : num [1:18207] 31 33 26 27 27 27 32 31 32 25 ...
## $ Photo : chr [1:18207] "https://cdn.sofifa.org/players/4/19/158023.png" "https://cdn.sofifa.org/players/4/19/20801.png" "https://cdn.sofifa.org/players/4/19/190871.png" "https://cdn.sofifa.org/players/4/19/193080.png" ...
## $ Nationality : chr [1:18207] "Argentina" "Portugal" "Brazil" "Spain" ...
## $ Flag : chr [1:18207] "https://cdn.sofifa.org/flags/52.png" "https://cdn.sofifa.org/flags/38.png" "https://cdn.sofifa.org/flags/54.png" "https://cdn.sofifa.org/flags/45.png" ...
## $ Overall : num [1:18207] 94 94 92 91 91 91 91 91 91 90 ...
## $ Potential : num [1:18207] 94 94 93 93 92 91 91 91 91 93 ...
## $ Club : chr [1:18207] "FC Barcelona" "Juventus" "Paris Saint-Germain" "Manchester United" ...
## $ Club Logo : chr [1:18207] "https://cdn.sofifa.org/teams/2/light/241.png" "https://cdn.sofifa.org/teams/2/light/45.png" "https://cdn.sofifa.org/teams/2/light/73.png" "https://cdn.sofifa.org/teams/2/light/11.png" ...
## $ Value : chr [1:18207] "\200110.5M" "\20077M" "\200118.5M" "\20072M" ...
## $ Wage : chr [1:18207] "\200565K" "\200405K" "\200290K" "\200260K" ...
## $ Special : num [1:18207] 2202 2228 2143 1471 2281 ...
## $ Preferred Foot : chr [1:18207] "Left" "Right" "Right" "Right" ...
## $ International Reputation: num [1:18207] 5 5 5 4 4 4 4 5 4 3 ...
## $ Weak Foot : num [1:18207] 4 4 5 3 5 4 4 4 3 3 ...
## $ Skill Moves : num [1:18207] 4 5 5 1 4 4 4 3 3 1 ...
## $ Work Rate : chr [1:18207] "Medium/ Medium" "High/ Low" "High/ Medium" "Medium/ Medium" ...
## $ Body Type : chr [1:18207] "Messi" "C. Ronaldo" "Neymar" "Lean" ...
## $ Real Face : chr [1:18207] "Yes" "Yes" "Yes" "Yes" ...
## $ Position : chr [1:18207] "RF" "ST" "LW" "GK" ...
## $ Jersey Number : num [1:18207] 10 7 10 1 7 10 10 9 15 1 ...
## $ Joined : chr [1:18207] "Jul 1, 2004" "Jul 10, 2018" "Aug 3, 2017" "Jul 1, 2011" ...
## $ Loaned From : chr [1:18207] NA NA NA NA ...
## $ Contract Valid Until : chr [1:18207] "2021" "2022" "2022" "2020" ...
## $ Height : chr [1:18207] "5'7" "6'2" "5'9" "6'4" ...
## $ Weight : chr [1:18207] "159lbs" "183lbs" "150lbs" "168lbs" ...
## $ LS : chr [1:18207] "88+2" "91+3" "84+3" NA ...
## $ ST : chr [1:18207] "88+2" "91+3" "84+3" NA ...
## $ RS : chr [1:18207] "88+2" "91+3" "84+3" NA ...
## $ LW : chr [1:18207] "92+2" "89+3" "89+3" NA ...
## $ LF : chr [1:18207] "93+2" "90+3" "89+3" NA ...
## $ CF : chr [1:18207] "93+2" "90+3" "89+3" NA ...
## $ RF : chr [1:18207] "93+2" "90+3" "89+3" NA ...
## $ RW : chr [1:18207] "92+2" "89+3" "89+3" NA ...
## $ LAM : chr [1:18207] "93+2" "88+3" "89+3" NA ...
## $ CAM : chr [1:18207] "93+2" "88+3" "89+3" NA ...
## $ RAM : chr [1:18207] "93+2" "88+3" "89+3" NA ...
## $ LM : chr [1:18207] "91+2" "88+3" "88+3" NA ...
## $ LCM : chr [1:18207] "84+2" "81+3" "81+3" NA ...
## $ CM : chr [1:18207] "84+2" "81+3" "81+3" NA ...
## $ RCM : chr [1:18207] "84+2" "81+3" "81+3" NA ...
## $ RM : chr [1:18207] "91+2" "88+3" "88+3" NA ...
## $ LWB : chr [1:18207] "64+2" "65+3" "65+3" NA ...
## $ LDM : chr [1:18207] "61+2" "61+3" "60+3" NA ...
## $ CDM : chr [1:18207] "61+2" "61+3" "60+3" NA ...
## $ RDM : chr [1:18207] "61+2" "61+3" "60+3" NA ...
## $ RWB : chr [1:18207] "64+2" "65+3" "65+3" NA ...
## $ LB : chr [1:18207] "59+2" "61+3" "60+3" NA ...
## $ LCB : chr [1:18207] "47+2" "53+3" "47+3" NA ...
## $ CB : chr [1:18207] "47+2" "53+3" "47+3" NA ...
## $ RCB : chr [1:18207] "47+2" "53+3" "47+3" NA ...
## $ RB : chr [1:18207] "59+2" "61+3" "60+3" NA ...
## $ Crossing : num [1:18207] 84 84 79 17 93 81 86 77 66 13 ...
## $ Finishing : num [1:18207] 95 94 87 13 82 84 72 93 60 11 ...
## $ HeadingAccuracy : num [1:18207] 70 89 62 21 55 61 55 77 91 15 ...
## $ ShortPassing : num [1:18207] 90 81 84 50 92 89 93 82 78 29 ...
## $ Volleys : num [1:18207] 86 87 84 13 82 80 76 88 66 13 ...
## $ Dribbling : num [1:18207] 97 88 96 18 86 95 90 87 63 12 ...
## $ Curve : num [1:18207] 93 81 88 21 85 83 85 86 74 13 ...
## $ FKAccuracy : num [1:18207] 94 76 87 19 83 79 78 84 72 14 ...
## $ LongPassing : num [1:18207] 87 77 78 51 91 83 88 64 77 26 ...
## $ BallControl : num [1:18207] 96 94 95 42 91 94 93 90 84 16 ...
## $ Acceleration : num [1:18207] 91 89 94 57 78 94 80 86 76 43 ...
## $ SprintSpeed : num [1:18207] 86 91 90 58 76 88 72 75 75 60 ...
## $ Agility : num [1:18207] 91 87 96 60 79 95 93 82 78 67 ...
## $ Reactions : num [1:18207] 95 96 94 90 91 90 90 92 85 86 ...
## $ Balance : num [1:18207] 95 70 84 43 77 94 94 83 66 49 ...
## $ ShotPower : num [1:18207] 85 95 80 31 91 82 79 86 79 22 ...
## $ Jumping : num [1:18207] 68 95 61 67 63 56 68 69 93 76 ...
## $ Stamina : num [1:18207] 72 88 81 43 90 83 89 90 84 41 ...
## $ Strength : num [1:18207] 59 79 49 64 75 66 58 83 83 78 ...
## $ LongShots : num [1:18207] 94 93 82 12 91 80 82 85 59 12 ...
## $ Aggression : num [1:18207] 48 63 56 38 76 54 62 87 88 34 ...
## $ Interceptions : num [1:18207] 22 29 36 30 61 41 83 41 90 19 ...
## $ Positioning : num [1:18207] 94 95 89 12 87 87 79 92 60 11 ...
## $ Vision : num [1:18207] 94 82 87 68 94 89 92 84 63 70 ...
## $ Penalties : num [1:18207] 75 85 81 40 79 86 82 85 75 11 ...
## $ Composure : num [1:18207] 96 95 94 68 88 91 84 85 82 70 ...
## $ Marking : num [1:18207] 33 28 27 15 68 34 60 62 87 27 ...
## $ StandingTackle : num [1:18207] 28 31 24 21 58 27 76 45 92 12 ...
## $ SlidingTackle : num [1:18207] 26 23 33 13 51 22 73 38 91 18 ...
## $ GKDiving : num [1:18207] 6 7 9 90 15 11 13 27 11 86 ...
## $ GKHandling : num [1:18207] 11 11 9 85 13 12 9 25 8 92 ...
## $ GKKicking : num [1:18207] 15 15 15 87 5 6 7 31 9 78 ...
## $ GKPositioning : num [1:18207] 14 14 15 88 10 8 14 33 7 88 ...
## $ GKReflexes : num [1:18207] 8 11 11 94 13 8 9 37 11 89 ...
## $ Release Clause : chr [1:18207] "\200226.5M" "\200127.1M" "\200228.1M" "\200138.6M" ...
## - attr(*, "spec")=
## .. cols(
## .. X1 = col_double(),
## .. ID = col_double(),
## .. Name = col_character(),
## .. Age = col_double(),
## .. Photo = col_character(),
## .. Nationality = col_character(),
## .. Flag = col_character(),
## .. Overall = col_double(),
## .. Potential = col_double(),
## .. Club = col_character(),
## .. `Club Logo` = col_character(),
## .. Value = col_character(),
## .. Wage = col_character(),
## .. Special = col_double(),
## .. `Preferred Foot` = col_character(),
## .. `International Reputation` = col_double(),
## .. `Weak Foot` = col_double(),
## .. `Skill Moves` = col_double(),
## .. `Work Rate` = col_character(),
## .. `Body Type` = col_character(),
## .. `Real Face` = col_character(),
## .. Position = col_character(),
## .. `Jersey Number` = col_double(),
## .. Joined = col_character(),
## .. `Loaned From` = col_character(),
## .. `Contract Valid Until` = col_character(),
## .. Height = col_character(),
## .. Weight = col_character(),
## .. LS = col_character(),
## .. ST = col_character(),
## .. RS = col_character(),
## .. LW = col_character(),
## .. LF = col_character(),
## .. CF = col_character(),
## .. RF = col_character(),
## .. RW = col_character(),
## .. LAM = col_character(),
## .. CAM = col_character(),
## .. RAM = col_character(),
## .. LM = col_character(),
## .. LCM = col_character(),
## .. CM = col_character(),
## .. RCM = col_character(),
## .. RM = col_character(),
## .. LWB = col_character(),
## .. LDM = col_character(),
## .. CDM = col_character(),
## .. RDM = col_character(),
## .. RWB = col_character(),
## .. LB = col_character(),
## .. LCB = col_character(),
## .. CB = col_character(),
## .. RCB = col_character(),
## .. RB = col_character(),
## .. Crossing = col_double(),
## .. Finishing = col_double(),
## .. HeadingAccuracy = col_double(),
## .. ShortPassing = col_double(),
## .. Volleys = col_double(),
## .. Dribbling = col_double(),
## .. Curve = col_double(),
## .. FKAccuracy = col_double(),
## .. LongPassing = col_double(),
## .. BallControl = col_double(),
## .. Acceleration = col_double(),
## .. SprintSpeed = col_double(),
## .. Agility = col_double(),
## .. Reactions = col_double(),
## .. Balance = col_double(),
## .. ShotPower = col_double(),
## .. Jumping = col_double(),
## .. Stamina = col_double(),
## .. Strength = col_double(),
## .. LongShots = col_double(),
## .. Aggression = col_double(),
## .. Interceptions = col_double(),
## .. Positioning = col_double(),
## .. Vision = col_double(),
## .. Penalties = col_double(),
## .. Composure = col_double(),
## .. Marking = col_double(),
## .. StandingTackle = col_double(),
## .. SlidingTackle = col_double(),
## .. GKDiving = col_double(),
## .. GKHandling = col_double(),
## .. GKKicking = col_double(),
## .. GKPositioning = col_double(),
## .. GKReflexes = col_double(),
## .. `Release Clause` = col_character()
## .. )
ggplot(Fifa) +
aes(x = "", y = Overall) +
geom_boxplot(shape = "circle", fill = "#EF562D") +
labs(y = "Avaliação do jogador",
title = "Boxplot da avaliação do jogador", subtitle = "Gráfico de boxplot") +
ggthemes::theme_pander() +
theme(plot.title = element_text(size = 15L, face = "bold", hjust = 0.5), axis.title.y = element_text(size = 14L))
resumo <- summary(Fifa$Overall)
resumo_valores <- cbind(resumo[1],resumo[2],resumo[3],resumo[4],resumo[5],resumo[6])
colnames(resumo_valores) <- c("Mínimo", "1° quartil", "Mediana", "Média", "3° quartil", "Máximo")
rownames(resumo_valores) <- c("Resumo")
resumo_valores %>%
kbl(caption = "Medidas descritivas para o Overall") %>%
kable_classic(full_width = F, html_font = "Cambria")
| Mínimo | 1° quartil | Mediana | Média | 3° quartil | Máximo | |
|---|---|---|---|---|---|---|
| Resumo | 46 | 62 | 66 | 66.2387 | 71 | 94 |
Escolhemos analisar os índices de overall dos jogadores por meio de gráfico Bloxpot, por acreditarmos ser uma ferramenta bem visual e clara dos números e dados em questão. Através dessa observação, podemos afirmar que a média de pontuação dos atletas circula por volta de 66 pontos, o atleta com menor desempenho possui 46 pontos, representando um outlier, assim como atletas com pontuação acima de 90 pontos. Além disso, podemos ver uma simetria dos dados, visto que a mediana está na mesma distância para o primeiro quartil e para o terceiro.
ggplot(Fifa) +
aes(x = Overall, y = Potential) +
geom_point(shape = "bullet", size = 1.7, colour = "#010610") +
labs(x = "Avaliação do jogador", y = "Potencial do jogador", title = "Dispersão entre o potencial e a avaliação do jogador",
subtitle = "Gráfico de dispersão") +
ggthemes::theme_fivethirtyeight() +
theme(plot.title = element_text(size = 15L,
hjust = 0.5), axis.title.y = element_text(size = 13L), axis.title.x = element_text(size = 13L))
cor(Fifa$Overall,Fifa$Potential)
## [1] 0.6609385
Foi desenvolvido um gráfico de dispersão para para analisar o potencial e a classificação dos jogadores e foi possível observar e obter o índice de 0,66, sendo considerado um grau bom de associação de potencial e classificação do jogador. A partir disso, podemos notar que o potencial é gradual à avaliação do atleta, demonstrando que através de uma classificação elevada, a evolução será acelerada também.
library(tidyr)
table(Fifa$`Preferred Foot`)
##
## Left Right
## 4211 13948
Fifa %>% drop_na(`Preferred Foot`) %>%
ggplot(aes(x =`Preferred Foot`, y = Potential))+
geom_boxplot(aes(fill = `Preferred Foot`),
alpha = 0.8 )+
labs(title = "Gráfico de boxplot entre destro e canhoto com o potencial do jogador",
subtitle = "",
x="Destro ou Canhoto",
y="Potencial",
fill="Destro ou canhoto")
Analisando o gráfico Bloxpot que compara o potencial do jogador em relação a sua perna dominante, podemos concluir que a média potencial de canhotos e destros é aproximadamente 70. Porém, existem mais jogadores destros com índices mais elevados do que canhotos, visto que existem menos atletas sinistros no esporte, sendo assim, nota-se que há um número maior de outliers por parte dos jogadores destros, concluindo que ocorre uma oscilação no potencial do atleta, havendo a chance do mesmo ter um potencial maior ou menor.
par(bg="lightyellow")
plot(Fifa$Aggression,Fifa$Interceptions,pch=20,col="brown",
main = "Diagrama de dispersão agressividade X Boa Interceptação",
xlab="Agressividade",
ylab = "Interceptação")
abline(lsfit(Fifa$Aggression,Fifa$Interceptions),col="darkred")
## Warning in lsfit(Fifa$Aggression, Fifa$Interceptions): 48 missing values deleted
Observando o diagrama de dispersão que compara as características de agressividade e boa interceptação, podemos observar que obtivemos um alto grau de associação, tendo como índice o valor de 0,75. Dessa forma, infere-se que quanto maior a agressividade, melhor será a ação defensiva do jogador, melhorando assim, o desempenho do atleta dentro de campo.
par(bg="lightgray")
plot(Fifa$Age,Fifa$Potential,pch=20,col="red",
main = "Diagrama de dispersão idade X potencial do jogador",
xlab="Idade",
ylab = "Potencial do jogador")
abline(lsfit(Fifa$Age,Fifa$Potential),col="black")
cor(Fifa$Age,Fifa$Potential)
## [1] -0.2533121
Analisando o gráfico de dispersão que relaciona a idade do atleta com o potencial do mesmo, podemos observar um índice negativo, sendo computado o valor de -0,25 de grau associativo. Desse modo, podemos concluir que quanto maior a idade do jogador, menor será o seu potencial. Algo que podemos observar ao acompanhar diversos outros esportes, tendo em vista que o pico do potencial dos atletas gira em torno dos seus 25 anos devido a projeções de melhorias técnica e física.
library(corrplot)
## corrplot 0.84 loaded
Fifa2<- Fifa %>% select(Potential,Overall,Age,Aggression,Interceptions)
Fifa2 <-na.omit(Fifa2)
cor(Fifa2)
## Potential Overall Age Aggression Interceptions
## Potential 1.0000000 0.6611801 -0.2522812 0.1711743 0.1549080
## Overall 0.6611801 1.0000000 0.4530693 0.3954700 0.3213263
## Age -0.2522812 0.4530693 1.0000000 0.2651900 0.1978447
## Aggression 0.1711743 0.3954700 0.2651900 1.0000000 0.7518973
## Interceptions 0.1549080 0.3213263 0.1978447 0.7518973 1.0000000
MCorr <- cor(Fifa2)
corrplot(MCorr,addCoef.col=TRUE,number.cex=0.7)
Através da matriz de correlação é possível observar como os índices de diversas características dos jogadores conversam entre si, como por exemplo, é possível observar correlações fortes entre overall e potencial, agressividade e interceptação. Mas também podemos notar uma baixa relação entre potencial, agressividade e interceptação, visto que uma não impulsiona a outra. Além disso é válido ressaltar que a idade não influencia a classificação do atleta, demonstrando que o físico não é o único ponto a ser levado em conta, a qualidade técnica também predomina na hora de sua avaliação.
Considerando que a variável overall tem distribuição não normal, o teste de Correlação será o teste de Spearman.
Hipóteses:
H_0:NÃO existe correlação entre as variáveis
H_1:Existe correlação entre as variáveis
Teste de Spearman
p-value <= 0,05 → Rejeito a hipótese nula → Existe correlação
p-value > 0,05 → Não rejeito a hipótese nula → NÃO existe correlação
with(Fifa,cor.test(Overall,Potential, alternative="two.sided", method="spearman"))
## Warning in cor.test.default(Overall, Potential, alternative = "two.sided", :
## Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: Overall and Potential
## S = 3.7686e+11, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.6253591
pvalue = 2.2e-16 alpha 0,05 < alpha REJ H0 -> Há correlação
Logo, há correlação entre as variáveis
Hipóteses
H_0:Mesma distribuição
H_1:Pelo menos um dos grupos segue uma distribuição diferente.
Teste de Kruskal-Wallis
Fifa %>% drop_na(`Preferred Foot`) %>%
with(Fifa, tapply(`Preferred Foot`, Potential, median, na.rm=TRUE))
## # A tibble: 18,207 x 89
## X1 ID Name Age Photo Nationality Flag Overall Potential Club
## <dbl> <dbl> <chr> <dbl> <chr> <chr> <chr> <dbl> <dbl> <chr>
## 1 0 158023 L. Me~ 31 https:/~ Argentina https~ 94 94 FC B~
## 2 1 20801 Crist~ 33 https:/~ Portugal https~ 94 94 Juve~
## 3 2 190871 Neyma~ 26 https:/~ Brazil https~ 92 93 Pari~
## 4 3 193080 De Gea 27 https:/~ Spain https~ 91 93 Manc~
## 5 4 192985 K. De~ 27 https:/~ Belgium https~ 91 92 Manc~
## 6 5 183277 E. Ha~ 27 https:/~ Belgium https~ 91 91 Chel~
## 7 6 177003 L. Mo~ 32 https:/~ Croatia https~ 91 91 Real~
## 8 7 176580 L. Su~ 31 https:/~ Uruguay https~ 91 91 FC B~
## 9 8 155862 Sergi~ 32 https:/~ Spain https~ 91 91 Real~
## 10 9 200389 J. Ob~ 25 https:/~ Slovenia https~ 90 93 Atlé~
## # ... with 18,197 more rows, and 79 more variables: Club Logo <chr>,
## # Value <chr>, Wage <chr>, Special <dbl>, Preferred Foot <chr>,
## # International Reputation <dbl>, Weak Foot <dbl>, Skill Moves <dbl>,
## # Work Rate <chr>, Body Type <chr>, Real Face <chr>, Position <chr>,
## # Jersey Number <dbl>, Joined <chr>, Loaned From <chr>,
## # Contract Valid Until <chr>, Height <chr>, Weight <chr>, LS <chr>, ST <chr>,
## # RS <chr>, LW <chr>, LF <chr>, CF <chr>, RF <chr>, RW <chr>, LAM <chr>,
## # CAM <chr>, RAM <chr>, LM <chr>, LCM <chr>, CM <chr>, RCM <chr>, RM <chr>,
## # LWB <chr>, LDM <chr>, CDM <chr>, RDM <chr>, RWB <chr>, LB <chr>, LCB <chr>,
## # CB <chr>, RCB <chr>, RB <chr>, Crossing <dbl>, Finishing <dbl>,
## # HeadingAccuracy <dbl>, ShortPassing <dbl>, Volleys <dbl>, Dribbling <dbl>,
## # Curve <dbl>, FKAccuracy <dbl>, LongPassing <dbl>, BallControl <dbl>,
## # Acceleration <dbl>, SprintSpeed <dbl>, Agility <dbl>, Reactions <dbl>,
## # Balance <dbl>, ShotPower <dbl>, Jumping <dbl>, Stamina <dbl>,
## # Strength <dbl>, LongShots <dbl>, Aggression <dbl>, Interceptions <dbl>,
## # Positioning <dbl>, Vision <dbl>, Penalties <dbl>, Composure <dbl>,
## # Marking <dbl>, StandingTackle <dbl>, SlidingTackle <dbl>, GKDiving <dbl>,
## # GKHandling <dbl>, GKKicking <dbl>, GKPositioning <dbl>, GKReflexes <dbl>,
## # Release Clause <chr>
kruskal.test(Potential ~ `Preferred Foot`, data=Fifa)
##
## Kruskal-Wallis rank sum test
##
## data: Potential by Preferred Foot
## Kruskal-Wallis chi-squared = 23.236, df = 1, p-value = 1.433e-06
pvalue = 1.433e-06 alpha 0,05 pvalor < alpha REJ H0 -> Segue distribuição diferente
No caso, o potencial de destros é maior que o de canhotos.
Portanto, por meio de toda a avaliação que fizemos através dos mais diversos tipos de gráficos pela plataforma RStudio, podemos afirmar pontos como a média de overall de todos os jogadores no jogo é de 66, tendo poucos atletas com pontuação acima de 90 e abaixo de 46. Também foi possível constatar que jogadores com menos idade possuem um potencial de desenvolvimento maior quando comparados a personagens mais velhos, tendo um bom índice associativo. Essa análise nos permite entender a valorização do passe de um atleta de acordo com a sua idade. No futebol, jovens são negociados por valores exorbitantes enquanto profissionais que estão mais próximos do final da carreira possuem um valor de mercado menor.
Assim como pode-se observar que jogadores com maior agressividade possuem melhores números relativos a característica defensiva de interceptação de bolas. Esse fator se torna um pouco óbvio, visto que a força aplicada sobre determinadas jogadas em um esporte de contato faz enorme diferença em uma disputa de bola. Ademais, em diversos casos, jogadores com essa qualidade bem desenvolvida são escolhidos para setores defensivos propositalmente.
Além disso, foi possível observar que a média de potencial de jogadores destros e canhotos são equivalentes, apesar de existirem mais atletas que possuem mais habilidades com a mão direita, e inclusive existem menos jogadores sinistros acima da média quando comparados aos destros.
A última matriz analisada foi a de correlação entre os itens que constituem o overall de um jogador, tendo como grau associativo de 0,75, evidenciando o alto grau competitivo e equilibrado do jogo que o faz ser um sucesso mundial entre os amantes de videogames, sendo bastante verossímil, isso sendo atestado pelos fãs da NBA.