Introdução

Nesta atividade trabalharemos a base de dados “fifaData.csv” montando um diagrama de dispersão de variáveis quantitativas e uma matriz de Correlação de variáveis quantitativas.

Importando base de dado

library(readr)
FifaData <- read_csv("Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Hipótese da pesquisa

Na atividade em questão, trabalharemos com a hipótese que a idade dos jogares influenciam na sua capacidade de controle de bola e que quanto mais velho o jogador menor a sua capacidade de controle da bola.

  • Variável de interesse (eixo y): controle de bola.
  • Variável de explicação (eixo x): idade.

Diagrama de dispersão

names(FifaData)
##  [1] "Name"               "Nationality"        "National_Position" 
##  [4] "National_Kit"       "Club"               "Club_Position"     
##  [7] "Club_Kit"           "Club_Joining"       "Contract_Expiry"   
## [10] "Rating"             "Height"             "Weight"            
## [13] "Preffered_Foot"     "Birth_Date"         "Age"               
## [16] "Preffered_Position" "Work_Rate"          "Weak_foot"         
## [19] "Skill_Moves"        "Ball_Control"       "Dribbling"         
## [22] "Marking"            "Sliding_Tackle"     "Standing_Tackle"   
## [25] "Aggression"         "Reactions"          "Attacking_Position"
## [28] "Interceptions"      "Vision"             "Composure"         
## [31] "Crossing"           "Short_Pass"         "Long_Pass"         
## [34] "Acceleration"       "Speed"              "Stamina"           
## [37] "Strength"           "Balance"            "Agility"           
## [40] "Jumping"            "Heading"            "Shot_Power"        
## [43] "Finishing"          "Long_Shots"         "Curve"             
## [46] "Freekick_Accuracy"  "Penalties"          "Volleys"           
## [49] "GK_Positioning"     "GK_Diving"          "GK_Kicking"        
## [52] "GK_Handling"        "GK_Reflexes"
plot(FifaData$Age,FifaData$Ball_Control, col = "pink",
     pch=16, main = "diagrama de dispersão")
abline(lsfit(FifaData$Age,FifaData$Ball_Control), col="red")

Cálculo de correlação

cor(FifaData$Age,FifaData$Ball_Control)
## [1] 0.083066

Matriz de correlação de duas variáveis

Baixando bibliotecas para a matriz

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.92 loaded

Executando a matriz de correlação

FifaData %>% select(Age,Ball_Control) %>% 
  cor() %>% corrplot(method = "number")

Conclusão

Nessa análise nossa hipótese acabou sendo refutada, com os dados apresentados acima juntamente dos gráficos é possível visualizar que não existe uma forte correlação entre a idade dos jogadores e sua capacidade de controle de bola.

Além de também refutar nosso outro ponto em que diz que quanto mais velho o jogador menor a sua capacidade de domínio de bola, como visualizamos que as duas coisas não se correlacionam não podemos também afirmar esse outro fato.