library(readr)
FifaData <- read_csv("C:/MESTRADO/SEMESTRE 1.4/Estatistica/Base_de_dados-master/FifaData.csv")
View(FifaData)
head(FifaData)
# A tibble: 6 x 53
Name Nationality National_Positi~ National_Kit Club Club_Position Club_Kit
<chr> <chr> <chr> <dbl> <chr> <chr> <dbl>
1 Cristi~ Portugal LS 7 Real~ LW 7
2 Lionel~ Argentina RW 10 FC B~ RW 10
3 Neymar Brazil LW 10 FC B~ LW 11
4 Luis S~ Uruguay LS 9 FC B~ ST 9
5 Manuel~ Germany GK 1 FC B~ GK 1
6 De Gea Spain GK 1 Manc~ GK 1
# ... with 46 more variables: Club_Joining <chr>, Contract_Expiry <dbl>,
# Rating <dbl>, Height <chr>, Weight <chr>, Preffered_Foot <chr>,
# Birth_Date <chr>, Age <dbl>, Preffered_Position <chr>, Work_Rate <chr>,
# Weak_foot <dbl>, Skill_Moves <dbl>, Ball_Control <dbl>, Dribbling <dbl>,
# Marking <dbl>, Sliding_Tackle <dbl>, Standing_Tackle <dbl>,
# Aggression <dbl>, Reactions <dbl>, Attacking_Position <dbl>,
# Interceptions <dbl>, Vision <dbl>, Composure <dbl>, Crossing <dbl>, ...
Realizado a divisão das categorias de futebol, de acordo com a faixa etária dos Atletas.
library(dplyr)
FifaData = FifaData %>%
mutate(
Faixa_Age = case_when(
Age < 20 ~ "1. Júnior",
Age < 35 ~ "2. Adulto",
Age < 45 ~ "3. Veterano",
TRUE ~ "5. Outra Categoria"))
library(reactable)
FifaData %>% select(Faixa_Age) %>% table() %>%
data.frame() %>% reactable()
plot(FifaData$Age,FifaData$Speed,
main="Gráfico 1 - Diagrama de dispersão",
xlab="Idade do Atleta",
ylab="Rapidez do Atleta",
col='blue',pch=19
,
)
abline(lsfit(FifaData$Age,FifaData$Speed),col="darkblue")
cor(FifaData$Age,FifaData$Speed)
[1] -0.1684175
Declínio na rapidez dos atletas na medida que avançam as categorias.
plot(FifaData$Age,FifaData$Stamina,
main="Gráfico 2 - Diagrama de dispersão",
xlab="Idade do Atleta",
ylab="Energia do Atleta",
col='green',pch=18
,
)
abline(lsfit(FifaData$Age,FifaData$Agility),col="darkblue")
cor(FifaData$Age,FifaData$Stamina)
[1] 0.07065294
Nota-se que a correlação entre as variáveis foi baixa ou nenhuma associação.
FifaData %>% select(Age,Speed,Agility,Stamina) %>%
cor()
Age Speed Agility Stamina
Age 1.00000000 -0.1684175 -0.01945646 0.07065294
Speed -0.16841745 1.0000000 0.74859211 0.62749618
Agility -0.01945646 0.7485921 1.00000000 0.55733328
Stamina 0.07065294 0.6274962 0.55733328 1.00000000
library(corrplot)
Apenas a variável energia não obteve número negativo com relação a idade, na matriz de correlação.
FifaData %>% select(Age,Speed,Agility,Stamina) %>%
cor() %>% corrplot(method = "number")
O coeficiente de correlação de Pearson (r) varia entre -1 e +1, cujos valores próximos de -1 e +1 indicam forte correlação linear e próximos de 0 indicam ausência de correlação linear. Vejamos que ele capta apenas relações lineares entre variáveis numéricas, neste contexto podemos observar que a maior parte dos Atletas encontram-se na categoria adulto, onde o fator idade começa apresentar interferência com relação as variáveis rapidez e agilidade, demonstrando uma tendência negativa para ambas. Porém, a variável energia apresenta r=0,07, pode-se “concluir” que a correlação entre as variáveis foi baixa ou nenhuma associação, a energia do atleta não está relacionada ao fator idade.