Introdução

Primeiramente, carregou-se a base de dados “FifaData.csv”, onde foi analisada duas variáveis quantitativas dos jogadores de futebol, a variável idade e a variável velocidade.

library(readr)
FifaData <- read_csv("C:/Users/rober/Desktop/Base_de_dados-master/FifaData.csv")
View(FifaData)

library(dplyr)
library(corrplot)

Hipótese

Diante das variáveis quantitativas escolhidas, a hipótese a ser estudada será: quanto mais velho o jogador, menor será sua velocidade. Logo, analisaremos o desempenho da velocidade dos jogadores diante de sua idade.

Diagrama de Dispersão

Logo em seguida, para melhor análise dos dados, foi desenvolvido um diagrama de dispersão.

par(bg="white")
plot(FifaData$Age,FifaData$Speed,pch=18,col="#FF0000",
     main="Grafico - Idade x Velocidade",
     xlab= "Idade",
     ylab= "Velocidade")
abline(lsfit(FifaData$Age,FifaData$Speed),
       col="black",lwd= 3,lty= 1)

par(bg="white")

Dessa forma, ao observar o diagrama, podemos classificá-lo como sem correlação. Portanto, devido a alta dispersão entre os pontos ou pelo fato de que não há tendência positiva ou negativa no diagrama, podemos afirmar que não há correlação entre as variáveis.

Matriz de Correlação

No entanto, para representar visualmente o diagrama, foi desenvolvida uma matriz de correlação.

cor(FifaData$Age,FifaData$Speed)
## [1] -0.1684175
MC <- FifaData %>% select(Age,Speed) %>% cor()
corrplot(MC)
corrplot(MC, method = "circle")

Sendo assim, pode-se afirmar que, trata-se de uma matriz de grau fraco/moderado de associação, onde seu R é negativo, de valor aproximado -0,1.

Conclusão

Logo, diante dessas informações, pode-se afirmar que, a hipótese apresentada é inválida. Dessa maneira, a alta dispersão dos dados, vista no diagrama, nos faz compreender que, a variável idade não interfere na variável velocidade. Portanto, a idade não afeta o desempenho da velocidade dos jogadores. Além disso, segundo a matriz de correlação, não há associação de grau excelente.