Nesta tabela de matriz de correlação nos temos alguns exemplos de varivaies quantitativas como idade e outras como Stamina, Strength, Rating, Aggression, Reactions, Vision, Composure, Speed, Balance, essas listadas que são atributos físicos de cada jogador.
library(readr)
FifaData <- read_csv("C:/Users/User/Desktop/Faculdade/Adm P/8 Periodo/Estatistica/Base_de_dados-master/Base_de_dados-master/FifaData.csv")
Rows: 17588 Columns: 53
-- Column specification --------------------------------------------------------
Delimiter: ","
chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
i Use `spec()` to retrieve the full column specification for this data.
i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(FifaData)
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(corrplot)
corrplot 0.90 loaded
MC<-FifaData %>% select(Age, Stamina, Strength, Rating, Aggression, Reactions, Vision, Composure, Speed, Balance) %>% cor()
MC
Age Stamina Strength Rating Aggression Reactions
Age 1.00000000 0.07065294 0.32945914 0.45827627 0.2595643 0.4568886
Stamina 0.07065294 1.00000000 0.23021977 0.35527898 0.6432075 0.3459944
Strength 0.32945914 0.23021977 1.00000000 0.36916877 0.4501109 0.2910602
Rating 0.45827627 0.35527898 0.36916877 1.00000000 0.4045138 0.8283686
Aggression 0.25956434 0.64320746 0.45011094 0.40451379 1.0000000 0.3905429
Reactions 0.45688859 0.34599442 0.29106021 0.82836859 0.3905429 1.0000000
Vision 0.19018526 0.48230037 -0.03574628 0.48937051 0.3122379 0.4821710
Composure 0.35576560 0.54426762 0.25897238 0.61369322 0.5350438 0.5893948
Speed -0.16841745 0.62749618 -0.08594385 0.22421237 0.2918154 0.1886685
Balance -0.10020216 0.45826797 -0.41906449 0.08772942 0.1719698 0.1300112
Vision Composure Speed Balance
Age 0.19018526 0.3557656 -0.16841745 -0.10020216
Stamina 0.48230037 0.5442676 0.62749618 0.45826797
Strength -0.03574628 0.2589724 -0.08594385 -0.41906449
Rating 0.48937051 0.6136932 0.22421237 0.08772942
Aggression 0.31223788 0.5350438 0.29181536 0.17196976
Reactions 0.48217102 0.5893948 0.18866853 0.13001119
Vision 1.00000000 0.6489427 0.43129625 0.47670589
Composure 0.64894272 1.0000000 0.39135813 0.32934616
Speed 0.43129625 0.3913581 1.00000000 0.61954967
Balance 0.47670589 0.3293462 0.61954967 1.00000000
corrplot(MC, method = "pie")
O Número de Correlações Bem Fracas Existentes são:
Positivas:5 Negativas:4 Total:9
O Número de Correlações Fracas Existentes são:
Positivas:14 Negativas:0 Total:14
O Número de Correlações Moderadas Existentes São:
Positivas:18 Negativas:1 Total:19
O Número de Correlações Fortes Existentes são:
Positivas:3 Negativas:0 Total:3
O Número de Correlações Muito Fortes Existentes são:
Positivas:0 Negativas:0 Total:0
Aqui foi feita uma tabela para mostrar a matriz em valores. Continuando e complementando a matriz acima nós mostra de relevantes é que somente existe uma Correlação forte entre Atributos de Rating e Reactions, Vision e Composure, e por fim Speed e Balance
library(dplyr)
library(flextable)
library(corrplot)
MC<-FifaData %>% select(Age, Stamina, Strength, Rating, Aggression, Reactions, Vision, Composure, Speed, Balance) %>% cor() %>%
data.frame() %>% flextable()
MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC
Age | Stamina | Strength | Rating | Aggression | Reactions | Vision | Composure | Speed | Balance |
1.00000000 | 0.07065294 | 0.32945914 | 0.45827627 | 0.2595643 | 0.4568886 | 0.19018526 | 0.3557656 | -0.16841745 | -0.10020216 |
0.07065294 | 1.00000000 | 0.23021977 | 0.35527898 | 0.6432075 | 0.3459944 | 0.48230037 | 0.5442676 | 0.62749618 | 0.45826797 |
0.32945914 | 0.23021977 | 1.00000000 | 0.36916877 | 0.4501109 | 0.2910602 | -0.03574628 | 0.2589724 | -0.08594385 | -0.41906449 |
0.45827627 | 0.35527898 | 0.36916877 | 1.00000000 | 0.4045138 | 0.8283686 | 0.48937051 | 0.6136932 | 0.22421237 | 0.08772942 |
0.25956434 | 0.64320746 | 0.45011094 | 0.40451379 | 1.0000000 | 0.3905429 | 0.31223788 | 0.5350438 | 0.29181536 | 0.17196976 |
0.45688859 | 0.34599442 | 0.29106021 | 0.82836859 | 0.3905429 | 1.0000000 | 0.48217102 | 0.5893948 | 0.18866853 | 0.13001119 |
0.19018526 | 0.48230037 | -0.03574628 | 0.48937051 | 0.3122379 | 0.4821710 | 1.00000000 | 0.6489427 | 0.43129625 | 0.47670589 |
0.35576560 | 0.54426762 | 0.25897238 | 0.61369322 | 0.5350438 | 0.5893948 | 0.64894272 | 1.0000000 | 0.39135813 | 0.32934616 |
-0.16841745 | 0.62749618 | -0.08594385 | 0.22421237 | 0.2918154 | 0.1886685 | 0.43129625 | 0.3913581 | 1.00000000 | 0.61954967 |
-0.10020216 | 0.45826797 | -0.41906449 | 0.08772942 | 0.1719698 | 0.1300112 | 0.47670589 | 0.3293462 | 0.61954967 | 1.00000000 |
Aqui eu decidi utilizar duas variavéis quantitativas Age e Shot_Power, nesse caso aqui eu quero entender a correlação entre a idade e o pode de chute dos jogadores.
library(dplyr)
library(flextable)
library(corrplot)
MC<-FifaData %>% select(Age, Shot_Power) %>% cor() %>%
data.frame() %>% flextable()
MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC
Age | Shot_Power |
1.0000000 | 0.1514011 |
0.1514011 | 1.0000000 |
Nessa tabela usei a variavél Reactions e Vision, e viso entender qual a correlação da reação com a visão.
library(dplyr)
library(flextable)
library(corrplot)
MC<-FifaData %>% select(Reactions, Vision) %>% cor() %>%
data.frame() %>% flextable()
MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC
Reactions | Vision |
1.000000 | 0.482171 |
0.482171 | 1.000000 |
Aqui eu já utilizei Age e Reactions, correlacionei com a idade e a reação.
library(dplyr)
library(flextable)
library(corrplot)
MC<-FifaData %>% select(Age, Reactions) %>% cor() %>%
data.frame() %>% flextable()
MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC
Age | Reactions |
1.0000000 | 0.4568886 |
0.4568886 | 1.0000000 |
Aqui correlacionio Idade e Poder de Chute e puder perceber que o nível de correlação deu 0.1514011, que mostra uma correlação positiva muito fraca.
library(dplyr)
library(corrplot)
library(RColorBrewer)
COL <- brewer.pal(3, "Set1")
COL
[1] "#E41A1C" "#377EB8" "#4DAF4A"
par(bg="#DFFF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
plot(FifaData$Age, FifaData$Shot_Power,pch=19,col=COL,
main="Gráfico 2",ylab = "Poder de Chute", xlab = "Idade")
abline(lsfit(FifaData$Age, FifaData$Shot_Power),col="Black")
cor(FifaData$Age, FifaData$Shot_Power)
[1] 0.1514011
Aqui Correlacionei Reação e Avaliação, pude perceber que o nível de correlação é de 0.8283686, o que mostra uma correlação positiva forte.
library(dplyr)
library(corrplot)
library(RColorBrewer)
COL <- brewer.pal(3, "Set1")
COL
[1] "#E41A1C" "#377EB8" "#4DAF4A"
par(bg="#DFFF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
plot(FifaData$Rating, FifaData$Reactions,pch=19,col=COL,
main="Gráfico 2",ylab = "Avaliação", xlab = "Reação")
abline(lsfit(FifaData$Rating, FifaData$Reactions),col="Black")
cor(FifaData$Rating, FifaData$Reactions)
[1] 0.8283686
Aqui correlacionei idade com a Reação e pude avaliar que o nível de correlação é de 0.4568886, e isso significa que é uma correlação positiva moderada.
library(dplyr)
library(corrplot)
library(RColorBrewer)
COL <- brewer.pal(3, "Set1")
COL
[1] "#E41A1C" "#377EB8" "#4DAF4A"
par(bg="#DFFF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
plot(FifaData$Age, FifaData$Reactions,pch=19,col=COL,
main="Gráfico 2",ylab = "Reação", xlab = "Idade")
abline(lsfit(FifaData$Age, FifaData$Reactions),col="Black")
cor(FifaData$Age, FifaData$Reactions)
[1] 0.4568886
Dado os dados analisados é possível perceber que os gráficos de dispersão são ferramentas importantíssimas para avaliar a relação entre as variavéis e como elas acabam se impactando. Um detalhe importante quanto a questão de correlação é avaliar se de fato existem causalidades entre elas.
A Causalidade não necessariamente implica em correlação das variavéis. A exemplo usamos a variavél Idade e Reação como variavél central da analise das outras variaveís como Avaliação e Poder de Chute.
Como podemos perceber, em primeiro lugar pensariamos em a Idade está associada maior parte dos atributos listados aos jogadores como Reação e Poder de Chute, porém o que podemos perceber é que tanto a correlação Idade e Poder de Chute tem uma correlação muito fraca e a correlação Reação e Idade teve uma correlação moderada, ambas estas as que mais poderiam ter algum tipo de causalidade, não tiveram nenhuma correlação significativamente forte. Já a correlação Avaliação e Reação, que em teoria não teria causalidade alguma, teve a correlção mais forte de todas as correlações analisadas.