Diagrama de Dispersão e coeficiente de correlação

  1. Para duas variáveis quantitativas: fazer um diagrama de dispersão e uma matriz de correlação na base de dados FifaData.csv

  2. Fazer uma publicação no RPUBS do arquivo Rmarkdown. OBS - Obrigatória a interpretação dos resultados em pelo menos dois parágrafos.

Importação do banco de dados

library(readxl)
FifaData <- read.csv("C:/Users/jmachado/Desktop/Base_de_dados-master/FifaData.csv")
View(FifaData)

Visualização do banco de dados

head(FifaData)
##                Name Nationality National_Position National_Kit           Club
## 1 Cristiano Ronaldo    Portugal                LS            7    Real Madrid
## 2      Lionel Messi   Argentina                RW           10   FC Barcelona
## 3            Neymar      Brazil                LW           10   FC Barcelona
## 4      Luis Suárez     Uruguay                LS            9   FC Barcelona
## 5      Manuel Neuer     Germany                GK            1      FC Bayern
## 6            De Gea       Spain                GK            1 Manchester Utd
##   Club_Position Club_Kit Club_Joining Contract_Expiry Rating Height Weight
## 1            LW        7   07/01/2009            2021     94 185 cm  80 kg
## 2            RW       10   07/01/2004            2018     93 170 cm  72 kg
## 3            LW       11   07/01/2013            2021     92 174 cm  68 kg
## 4            ST        9   07/11/2014            2021     92 182 cm  85 kg
## 5            GK        1   07/01/2011            2021     92 193 cm  92 kg
## 6            GK        1   07/01/2011            2019     90 193 cm  82 kg
##   Preffered_Foot Birth_Date Age Preffered_Position       Work_Rate Weak_foot
## 1          Right 02/05/1985  32              LW/ST      High / Low         4
## 2           Left 06/24/1987  29                 RW Medium / Medium         4
## 3          Right 02/05/1992  25                 LW   High / Medium         5
## 4          Right 01/24/1987  30                 ST   High / Medium         4
## 5          Right 03/27/1986  31                 GK Medium / Medium         4
## 6          Right 11/07/1990  26                 GK Medium / Medium         3
##   Skill_Moves Ball_Control Dribbling Marking Sliding_Tackle Standing_Tackle
## 1           5           93        92      22             23              31
## 2           4           95        97      13             26              28
## 3           5           95        96      21             33              24
## 4           4           91        86      30             38              45
## 5           1           48        30      10             11              10
## 6           1           31        13      13             13              21
##   Aggression Reactions Attacking_Position Interceptions Vision Composure
## 1         63        96                 94            29     85        86
## 2         48        95                 93            22     90        94
## 3         56        88                 90            36     80        80
## 4         78        93                 92            41     84        83
## 5         29        85                 12            30     70        70
## 6         38        88                 12            30     68        60
##   Crossing Short_Pass Long_Pass Acceleration Speed Stamina Strength Balance
## 1       84         83        77           91    92      92       80      63
## 2       77         88        87           92    87      74       59      95
## 3       75         81        75           93    90      79       49      82
## 4       77         83        64           88    77      89       76      60
## 5       15         55        59           58    61      44       83      35
## 6       17         31        32           56    56      25       64      43
##   Agility Jumping Heading Shot_Power Finishing Long_Shots Curve
## 1      90      95      85         92        93         90    81
## 2      90      68      71         85        95         88    89
## 3      96      61      62         78        89         77    79
## 4      86      69      77         87        94         86    86
## 5      52      78      25         25        13         16    14
## 6      57      67      21         31        13         12    21
##   Freekick_Accuracy Penalties Volleys GK_Positioning GK_Diving GK_Kicking
## 1                76        85      88             14         7         15
## 2                90        74      85             14         6         15
## 3                84        81      83             15         9         15
## 4                84        85      88             33        27         31
## 5                11        47      11             91        89         95
## 6                19        40      13             86        88         87
##   GK_Handling GK_Reflexes
## 1          11          11
## 2          11           8
## 3           9          11
## 4          25          37
## 5          90          89
## 6          85          90

Correlação de variáveis

FifaData$Height <- gsub("cm","",FifaData$Height)
FifaData$Height <- as.numeric(FifaData$Height)

FifaData$Weight <- gsub("kg","",FifaData$Weight)
FifaData$Weight <- as.numeric(FifaData$Weight)

head(FifaData)
##                Name Nationality National_Position National_Kit           Club
## 1 Cristiano Ronaldo    Portugal                LS            7    Real Madrid
## 2      Lionel Messi   Argentina                RW           10   FC Barcelona
## 3            Neymar      Brazil                LW           10   FC Barcelona
## 4      Luis Suárez     Uruguay                LS            9   FC Barcelona
## 5      Manuel Neuer     Germany                GK            1      FC Bayern
## 6            De Gea       Spain                GK            1 Manchester Utd
##   Club_Position Club_Kit Club_Joining Contract_Expiry Rating Height Weight
## 1            LW        7   07/01/2009            2021     94    185     80
## 2            RW       10   07/01/2004            2018     93    170     72
## 3            LW       11   07/01/2013            2021     92    174     68
## 4            ST        9   07/11/2014            2021     92    182     85
## 5            GK        1   07/01/2011            2021     92    193     92
## 6            GK        1   07/01/2011            2019     90    193     82
##   Preffered_Foot Birth_Date Age Preffered_Position       Work_Rate Weak_foot
## 1          Right 02/05/1985  32              LW/ST      High / Low         4
## 2           Left 06/24/1987  29                 RW Medium / Medium         4
## 3          Right 02/05/1992  25                 LW   High / Medium         5
## 4          Right 01/24/1987  30                 ST   High / Medium         4
## 5          Right 03/27/1986  31                 GK Medium / Medium         4
## 6          Right 11/07/1990  26                 GK Medium / Medium         3
##   Skill_Moves Ball_Control Dribbling Marking Sliding_Tackle Standing_Tackle
## 1           5           93        92      22             23              31
## 2           4           95        97      13             26              28
## 3           5           95        96      21             33              24
## 4           4           91        86      30             38              45
## 5           1           48        30      10             11              10
## 6           1           31        13      13             13              21
##   Aggression Reactions Attacking_Position Interceptions Vision Composure
## 1         63        96                 94            29     85        86
## 2         48        95                 93            22     90        94
## 3         56        88                 90            36     80        80
## 4         78        93                 92            41     84        83
## 5         29        85                 12            30     70        70
## 6         38        88                 12            30     68        60
##   Crossing Short_Pass Long_Pass Acceleration Speed Stamina Strength Balance
## 1       84         83        77           91    92      92       80      63
## 2       77         88        87           92    87      74       59      95
## 3       75         81        75           93    90      79       49      82
## 4       77         83        64           88    77      89       76      60
## 5       15         55        59           58    61      44       83      35
## 6       17         31        32           56    56      25       64      43
##   Agility Jumping Heading Shot_Power Finishing Long_Shots Curve
## 1      90      95      85         92        93         90    81
## 2      90      68      71         85        95         88    89
## 3      96      61      62         78        89         77    79
## 4      86      69      77         87        94         86    86
## 5      52      78      25         25        13         16    14
## 6      57      67      21         31        13         12    21
##   Freekick_Accuracy Penalties Volleys GK_Positioning GK_Diving GK_Kicking
## 1                76        85      88             14         7         15
## 2                90        74      85             14         6         15
## 3                84        81      83             15         9         15
## 4                84        85      88             33        27         31
## 5                11        47      11             91        89         95
## 6                19        40      13             86        88         87
##   GK_Handling GK_Reflexes
## 1          11          11
## 2          11           8
## 3           9          11
## 4          25          37
## 5          90          89
## 6          85          90

Análise de duas variaveis quantitativas e plotagem de Diagrama de dispersão

Velocidade X Aceleração

plot(FifaData$Speed,FifaData$Acceleration,main = 'diagrama de dispersão: Velocidade x Aceleração',
     xlab = 'velocidade',ylab = 'aceleração',
     col = 'gray', pch = 16,
     cex = 0.5)
abline(lsfit(FifaData$Speed,FifaData$Acceleration),col='blue')

Calculo do coeficiente de correlação

round(cor(FifaData$Speed,FifaData$Acceleration),2)
## [1] 0.92

Agressividade X Força

plot(FifaData$Aggression,FifaData$Strength,main = 'Diagrama de Dispersão: Agressao x Forca',
     xlab = 'Agressao',ylab = 'forca',
     col = 'blue', pch = 16,
     cex = 0.5)
abline(lsfit(FifaData$Aggression,FifaData$Strength),col='black')

Calculo do coeficiente de correlação

round(cor(FifaData$Aggression,FifaData$Strength),2)
## [1] 0.45

Força de Chute X PRecisão ao bater falta

plot(FifaData$Shot_Power,FifaData$Freekick_Accuracy,main = 'Diagrama de dispersão Força Chute x Precisão do chute na falta',
     xlab = 'Força chute', ylab = 'precisão na falta',
     col = 'yellow', pch = 16,
     cex = 0.5)
abline(lsfit(FifaData$Shot_Power,FifaData$Strength), col='blue')

Calculo do coeficiente de correlação

round(cor(FifaData$Shot_Power,FifaData$Strength),2)
## [1] 0.17

Baixando as bibliotecas

library(corrplot)
## corrplot 0.92 loaded
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Matriz de correlação

FifaData %>% select(Speed,Acceleration,Aggression,Strength,Shot_Power,Freekick_Accuracy) %>%
  cor()
##                         Speed Acceleration Aggression     Strength Shot_Power
## Speed              1.00000000    0.9226815  0.2918154 -0.085943850  0.5489210
## Acceleration       0.92268150    1.0000000  0.2605415 -0.164059474  0.5382741
## Aggression         0.29181536    0.2605415  1.0000000  0.450110940  0.4963621
## Strength          -0.08594385   -0.1640595  0.4501109  1.000000000  0.1730064
## Shot_Power         0.54892105    0.5382741  0.4963621  0.173006378  1.0000000
## Freekick_Accuracy  0.46229199    0.4861625  0.4024663 -0.003469157  0.7491053
##                   Freekick_Accuracy
## Speed                   0.462291987
## Acceleration            0.486162536
## Aggression              0.402466327
## Strength               -0.003469157
## Shot_Power              0.749105330
## Freekick_Accuracy       1.000000000

Representação gráfica da matriz de correlação

FifaData %>% select(Speed,Acceleration,Aggression,Strength,Shot_Power,Freekick_Accuracy) %>%
  cor() %>% corrplot.mixed()

Matriz de correlação para as variáveis quantitativas

Uma matriz de correlação é uma tabela que mostra a correlação entre as variáveis e é usada para ter um entendimento prévio dos dados antes de partir para análises mais avançadas.” Ao fazer uma análise de dados, normalmente temos várias variáveis que precisaremos analisar qual a correlação entre elas. Quanto maior for o valor absoluto do coeficiente, mais forte é a relação entre as variáveis. Para a correlação de Pearson, um valor absoluto de 1 indica uma relação linear perfeita. A correlação perto de 0 indica que não há relação linear entre as variáveis. O sinal de cada coeficiente indica a direção da relação.

FifaData %>% select(Rating, Height, Weight, Skill_Moves, Ball_Control, Dribbling, Marking, Sliding_Tackle, Standing_Tackle, Aggression, Reactions, Attacking_Position, Interceptions, Vision, Composure, Crossing, Short_Pass, Long_Pass, Acceleration, Speed, Stamina, Strength, Balance, Agility, Jumping, Heading, Shot_Power, Finishing, Long_Shots, Curve, Freekick_Accuracy, Penalties, Volleys) %>%
  cor() %>% corrplot()