Para duas variáveis quantitativas: fazer um diagrama de dispersão e uma matriz de correlação na base de dados FifaData.csv
Fazer uma publicação no RPUBS do arquivo Rmarkdown. OBS - Obrigatória a interpretação dos resultados em pelo menos dois parágrafos.
library(readxl)
FifaData <- read.csv("C:/Users/jmachado/Desktop/Base_de_dados-master/FifaData.csv")
View(FifaData)
head(FifaData)
## Name Nationality National_Position National_Kit Club
## 1 Cristiano Ronaldo Portugal LS 7 Real Madrid
## 2 Lionel Messi Argentina RW 10 FC Barcelona
## 3 Neymar Brazil LW 10 FC Barcelona
## 4 Luis Suárez Uruguay LS 9 FC Barcelona
## 5 Manuel Neuer Germany GK 1 FC Bayern
## 6 De Gea Spain GK 1 Manchester Utd
## Club_Position Club_Kit Club_Joining Contract_Expiry Rating Height Weight
## 1 LW 7 07/01/2009 2021 94 185 cm 80 kg
## 2 RW 10 07/01/2004 2018 93 170 cm 72 kg
## 3 LW 11 07/01/2013 2021 92 174 cm 68 kg
## 4 ST 9 07/11/2014 2021 92 182 cm 85 kg
## 5 GK 1 07/01/2011 2021 92 193 cm 92 kg
## 6 GK 1 07/01/2011 2019 90 193 cm 82 kg
## Preffered_Foot Birth_Date Age Preffered_Position Work_Rate Weak_foot
## 1 Right 02/05/1985 32 LW/ST High / Low 4
## 2 Left 06/24/1987 29 RW Medium / Medium 4
## 3 Right 02/05/1992 25 LW High / Medium 5
## 4 Right 01/24/1987 30 ST High / Medium 4
## 5 Right 03/27/1986 31 GK Medium / Medium 4
## 6 Right 11/07/1990 26 GK Medium / Medium 3
## Skill_Moves Ball_Control Dribbling Marking Sliding_Tackle Standing_Tackle
## 1 5 93 92 22 23 31
## 2 4 95 97 13 26 28
## 3 5 95 96 21 33 24
## 4 4 91 86 30 38 45
## 5 1 48 30 10 11 10
## 6 1 31 13 13 13 21
## Aggression Reactions Attacking_Position Interceptions Vision Composure
## 1 63 96 94 29 85 86
## 2 48 95 93 22 90 94
## 3 56 88 90 36 80 80
## 4 78 93 92 41 84 83
## 5 29 85 12 30 70 70
## 6 38 88 12 30 68 60
## Crossing Short_Pass Long_Pass Acceleration Speed Stamina Strength Balance
## 1 84 83 77 91 92 92 80 63
## 2 77 88 87 92 87 74 59 95
## 3 75 81 75 93 90 79 49 82
## 4 77 83 64 88 77 89 76 60
## 5 15 55 59 58 61 44 83 35
## 6 17 31 32 56 56 25 64 43
## Agility Jumping Heading Shot_Power Finishing Long_Shots Curve
## 1 90 95 85 92 93 90 81
## 2 90 68 71 85 95 88 89
## 3 96 61 62 78 89 77 79
## 4 86 69 77 87 94 86 86
## 5 52 78 25 25 13 16 14
## 6 57 67 21 31 13 12 21
## Freekick_Accuracy Penalties Volleys GK_Positioning GK_Diving GK_Kicking
## 1 76 85 88 14 7 15
## 2 90 74 85 14 6 15
## 3 84 81 83 15 9 15
## 4 84 85 88 33 27 31
## 5 11 47 11 91 89 95
## 6 19 40 13 86 88 87
## GK_Handling GK_Reflexes
## 1 11 11
## 2 11 8
## 3 9 11
## 4 25 37
## 5 90 89
## 6 85 90
FifaData$Height <- gsub("cm","",FifaData$Height)
FifaData$Height <- as.numeric(FifaData$Height)
FifaData$Weight <- gsub("kg","",FifaData$Weight)
FifaData$Weight <- as.numeric(FifaData$Weight)
head(FifaData)
## Name Nationality National_Position National_Kit Club
## 1 Cristiano Ronaldo Portugal LS 7 Real Madrid
## 2 Lionel Messi Argentina RW 10 FC Barcelona
## 3 Neymar Brazil LW 10 FC Barcelona
## 4 Luis Suárez Uruguay LS 9 FC Barcelona
## 5 Manuel Neuer Germany GK 1 FC Bayern
## 6 De Gea Spain GK 1 Manchester Utd
## Club_Position Club_Kit Club_Joining Contract_Expiry Rating Height Weight
## 1 LW 7 07/01/2009 2021 94 185 80
## 2 RW 10 07/01/2004 2018 93 170 72
## 3 LW 11 07/01/2013 2021 92 174 68
## 4 ST 9 07/11/2014 2021 92 182 85
## 5 GK 1 07/01/2011 2021 92 193 92
## 6 GK 1 07/01/2011 2019 90 193 82
## Preffered_Foot Birth_Date Age Preffered_Position Work_Rate Weak_foot
## 1 Right 02/05/1985 32 LW/ST High / Low 4
## 2 Left 06/24/1987 29 RW Medium / Medium 4
## 3 Right 02/05/1992 25 LW High / Medium 5
## 4 Right 01/24/1987 30 ST High / Medium 4
## 5 Right 03/27/1986 31 GK Medium / Medium 4
## 6 Right 11/07/1990 26 GK Medium / Medium 3
## Skill_Moves Ball_Control Dribbling Marking Sliding_Tackle Standing_Tackle
## 1 5 93 92 22 23 31
## 2 4 95 97 13 26 28
## 3 5 95 96 21 33 24
## 4 4 91 86 30 38 45
## 5 1 48 30 10 11 10
## 6 1 31 13 13 13 21
## Aggression Reactions Attacking_Position Interceptions Vision Composure
## 1 63 96 94 29 85 86
## 2 48 95 93 22 90 94
## 3 56 88 90 36 80 80
## 4 78 93 92 41 84 83
## 5 29 85 12 30 70 70
## 6 38 88 12 30 68 60
## Crossing Short_Pass Long_Pass Acceleration Speed Stamina Strength Balance
## 1 84 83 77 91 92 92 80 63
## 2 77 88 87 92 87 74 59 95
## 3 75 81 75 93 90 79 49 82
## 4 77 83 64 88 77 89 76 60
## 5 15 55 59 58 61 44 83 35
## 6 17 31 32 56 56 25 64 43
## Agility Jumping Heading Shot_Power Finishing Long_Shots Curve
## 1 90 95 85 92 93 90 81
## 2 90 68 71 85 95 88 89
## 3 96 61 62 78 89 77 79
## 4 86 69 77 87 94 86 86
## 5 52 78 25 25 13 16 14
## 6 57 67 21 31 13 12 21
## Freekick_Accuracy Penalties Volleys GK_Positioning GK_Diving GK_Kicking
## 1 76 85 88 14 7 15
## 2 90 74 85 14 6 15
## 3 84 81 83 15 9 15
## 4 84 85 88 33 27 31
## 5 11 47 11 91 89 95
## 6 19 40 13 86 88 87
## GK_Handling GK_Reflexes
## 1 11 11
## 2 11 8
## 3 9 11
## 4 25 37
## 5 90 89
## 6 85 90
plot(FifaData$Speed,FifaData$Acceleration,main = 'diagrama de dispersão: Velocidade x Aceleração',
xlab = 'velocidade',ylab = 'aceleração',
col = 'gray', pch = 16,
cex = 0.5)
abline(lsfit(FifaData$Speed,FifaData$Acceleration),col='blue')
round(cor(FifaData$Speed,FifaData$Acceleration),2)
## [1] 0.92
plot(FifaData$Aggression,FifaData$Strength,main = 'Diagrama de Dispersão: Agressao x Forca',
xlab = 'Agressao',ylab = 'forca',
col = 'blue', pch = 16,
cex = 0.5)
abline(lsfit(FifaData$Aggression,FifaData$Strength),col='black')
round(cor(FifaData$Aggression,FifaData$Strength),2)
## [1] 0.45
plot(FifaData$Shot_Power,FifaData$Freekick_Accuracy,main = 'Diagrama de dispersão Força Chute x Precisão do chute na falta',
xlab = 'Força chute', ylab = 'precisão na falta',
col = 'yellow', pch = 16,
cex = 0.5)
abline(lsfit(FifaData$Shot_Power,FifaData$Strength), col='blue')
round(cor(FifaData$Shot_Power,FifaData$Strength),2)
## [1] 0.17
Baixando as bibliotecas
library(corrplot)
## corrplot 0.92 loaded
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
FifaData %>% select(Speed,Acceleration,Aggression,Strength,Shot_Power,Freekick_Accuracy) %>%
cor()
## Speed Acceleration Aggression Strength Shot_Power
## Speed 1.00000000 0.9226815 0.2918154 -0.085943850 0.5489210
## Acceleration 0.92268150 1.0000000 0.2605415 -0.164059474 0.5382741
## Aggression 0.29181536 0.2605415 1.0000000 0.450110940 0.4963621
## Strength -0.08594385 -0.1640595 0.4501109 1.000000000 0.1730064
## Shot_Power 0.54892105 0.5382741 0.4963621 0.173006378 1.0000000
## Freekick_Accuracy 0.46229199 0.4861625 0.4024663 -0.003469157 0.7491053
## Freekick_Accuracy
## Speed 0.462291987
## Acceleration 0.486162536
## Aggression 0.402466327
## Strength -0.003469157
## Shot_Power 0.749105330
## Freekick_Accuracy 1.000000000
FifaData %>% select(Speed,Acceleration,Aggression,Strength,Shot_Power,Freekick_Accuracy) %>%
cor() %>% corrplot.mixed()
Uma matriz de correlação é uma tabela que mostra a correlação entre as variáveis e é usada para ter um entendimento prévio dos dados antes de partir para análises mais avançadas.” Ao fazer uma análise de dados, normalmente temos várias variáveis que precisaremos analisar qual a correlação entre elas. Quanto maior for o valor absoluto do coeficiente, mais forte é a relação entre as variáveis. Para a correlação de Pearson, um valor absoluto de 1 indica uma relação linear perfeita. A correlação perto de 0 indica que não há relação linear entre as variáveis. O sinal de cada coeficiente indica a direção da relação.
FifaData %>% select(Rating, Height, Weight, Skill_Moves, Ball_Control, Dribbling, Marking, Sliding_Tackle, Standing_Tackle, Aggression, Reactions, Attacking_Position, Interceptions, Vision, Composure, Crossing, Short_Pass, Long_Pass, Acceleration, Speed, Stamina, Strength, Balance, Agility, Jumping, Heading, Shot_Power, Finishing, Long_Shots, Curve, Freekick_Accuracy, Penalties, Volleys) %>%
cor() %>% corrplot()