Nesta atividade trabalharemos a base de dados “fifaData.csv” montando um diagrama de dispersão de variáveis quantitativas e uma matriz de Correlação de variáveis quantitativas.
library(readr)
FifaData <- read_csv("Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Na atividade em questão, trabalharemos com a hipótese que a idade dos jogares influenciam na sua capacidade de controle de bola e que quanto mais velho o jogador menor a sua capacidade de controle da bola.
names(FifaData)
## [1] "Name" "Nationality" "National_Position"
## [4] "National_Kit" "Club" "Club_Position"
## [7] "Club_Kit" "Club_Joining" "Contract_Expiry"
## [10] "Rating" "Height" "Weight"
## [13] "Preffered_Foot" "Birth_Date" "Age"
## [16] "Preffered_Position" "Work_Rate" "Weak_foot"
## [19] "Skill_Moves" "Ball_Control" "Dribbling"
## [22] "Marking" "Sliding_Tackle" "Standing_Tackle"
## [25] "Aggression" "Reactions" "Attacking_Position"
## [28] "Interceptions" "Vision" "Composure"
## [31] "Crossing" "Short_Pass" "Long_Pass"
## [34] "Acceleration" "Speed" "Stamina"
## [37] "Strength" "Balance" "Agility"
## [40] "Jumping" "Heading" "Shot_Power"
## [43] "Finishing" "Long_Shots" "Curve"
## [46] "Freekick_Accuracy" "Penalties" "Volleys"
## [49] "GK_Positioning" "GK_Diving" "GK_Kicking"
## [52] "GK_Handling" "GK_Reflexes"
plot(FifaData$Age,FifaData$Ball_Control, col = "pink",
pch=16, main = "diagrama de dispersão")
abline(lsfit(FifaData$Age,FifaData$Ball_Control), col="red")
cor(FifaData$Age,FifaData$Ball_Control)
## [1] 0.083066
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.92 loaded
FifaData %>% select(Age,Ball_Control) %>%
cor() %>% corrplot(method = "number")
Nessa análise nossa hipótese acabou sendo refutada, com os dados apresentados acima juntamente dos gráficos é possível visualizar que não existe uma forte correlação entre a idade dos jogadores e sua capacidade de controle de bola.
Além de também refutar nosso outro ponto em que diz que quanto mais velho o jogador menor a sua capacidade de domínio de bola, como visualizamos que as duas coisas não se correlacionam não podemos também afirmar esse outro fato.