Carregamento de Dados

library(readr)
FifaData <- read_csv("C:/MESTRADO/SEMESTRE 1.4/Estatistica/Base_de_dados-master/FifaData.csv")
View(FifaData)

Verificação de Dados

head(FifaData)
# A tibble: 6 x 53
  Name    Nationality National_Positi~ National_Kit Club  Club_Position Club_Kit
  <chr>   <chr>       <chr>                   <dbl> <chr> <chr>            <dbl>
1 Cristi~ Portugal    LS                          7 Real~ LW                   7
2 Lionel~ Argentina   RW                         10 FC B~ RW                  10
3 Neymar  Brazil      LW                         10 FC B~ LW                  11
4 Luis S~ Uruguay     LS                          9 FC B~ ST                   9
5 Manuel~ Germany     GK                          1 FC B~ GK                   1
6 De Gea  Spain       GK                          1 Manc~ GK                   1
# ... with 46 more variables: Club_Joining <chr>, Contract_Expiry <dbl>,
#   Rating <dbl>, Height <chr>, Weight <chr>, Preffered_Foot <chr>,
#   Birth_Date <chr>, Age <dbl>, Preffered_Position <chr>, Work_Rate <chr>,
#   Weak_foot <dbl>, Skill_Moves <dbl>, Ball_Control <dbl>, Dribbling <dbl>,
#   Marking <dbl>, Sliding_Tackle <dbl>, Standing_Tackle <dbl>,
#   Aggression <dbl>, Reactions <dbl>, Attacking_Position <dbl>,
#   Interceptions <dbl>, Vision <dbl>, Composure <dbl>, Crossing <dbl>, ...

Frequência de Atletas em cada categoria

Realizado a divisão das categorias de futebol, de acordo com a faixa etária dos Atletas.

library(dplyr)
FifaData = FifaData %>%
 mutate(
  Faixa_Age = case_when(
      Age < 20 ~ "1. Júnior",
      Age < 35 ~ "2. Adulto",
      Age < 45 ~ "3. Veterano",
      TRUE ~ "5. Outra Categoria"))

library(reactable)
FifaData  %>% select(Faixa_Age) %>% table() %>%
  data.frame() %>% reactable()

Diagrama de dispersão - 1ª Etapa

plot(FifaData$Age,FifaData$Speed,
     main="Gráfico 1 - Diagrama de dispersão",
     xlab="Idade do Atleta",
     ylab="Rapidez do Atleta",
     col='blue',pch=19
     ,
)
abline(lsfit(FifaData$Age,FifaData$Speed),col="darkblue")

O coeficiente de correlação - 1ª Etapa

Medindo a associação linear entre as variáveis Idade x Rapidez.

cor(FifaData$Age,FifaData$Speed)
[1] -0.1684175

Declínio na rapidez dos atletas na medida que avançam as categorias.

Diagrama de dispersão - 2ª Etapa

plot(FifaData$Age,FifaData$Stamina,
     main="Gráfico 2 - Diagrama de dispersão",
     xlab="Idade do Atleta",
     ylab="Energia do Atleta",
     col='green',pch=18
     ,
)
abline(lsfit(FifaData$Age,FifaData$Agility),col="darkblue")

O coeficiente de correlação - 2ª Etapa

Medindo a associação linear entre as variáveis Idade x Energia.

cor(FifaData$Age,FifaData$Stamina)
[1] 0.07065294

Nota-se que a correlação entre as variáveis foi baixa ou nenhuma associação.

Matriz de Correlação

FifaData %>% select(Age,Speed,Agility,Stamina) %>%
  cor() 
                Age      Speed     Agility    Stamina
Age      1.00000000 -0.1684175 -0.01945646 0.07065294
Speed   -0.16841745  1.0000000  0.74859211 0.62749618
Agility -0.01945646  0.7485921  1.00000000 0.55733328
Stamina  0.07065294  0.6274962  0.55733328 1.00000000
library(corrplot)

Apenas a variável energia não obteve número negativo com relação a idade, na matriz de correlação.

FifaData %>% select(Age,Speed,Agility,Stamina) %>%
  cor() %>% corrplot(method = "number")

Comentários

O coeficiente de correlação de Pearson (r) varia entre -1 e +1, cujos valores próximos de -1 e +1 indicam forte correlação linear e próximos de 0 indicam ausência de correlação linear. Vejamos que ele capta apenas relações lineares entre variáveis numéricas, neste contexto podemos observar que a maior parte dos Atletas encontram-se na categoria adulto, onde o fator idade começa apresentar interferência com relação as variáveis rapidez e agilidade, demonstrando uma tendência negativa para ambas. Porém, a variável energia apresenta r=0,07, pode-se “concluir” que a correlação entre as variáveis foi baixa ou nenhuma associação, a energia do atleta não está relacionada ao fator idade.