Passo 1 - Importar dados e criar um corrplot

Comandos utilizados - readr, corrplot

Nesta tabela de matriz de correlação nos temos alguns exemplos de varivaies quantitativas como idade e outras como Stamina, Strength, Rating, Aggression, Reactions, Vision, Composure, Speed, Balance, essas listadas que são atributos físicos de cada jogador.

library(readr)
FifaData <- read_csv("C:/Users/User/Desktop/Faculdade/Adm P/8 Periodo/Estatistica/Base_de_dados-master/Base_de_dados-master/FifaData.csv")
Rows: 17588 Columns: 53
-- Column specification --------------------------------------------------------
Delimiter: ","
chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...

i Use `spec()` to retrieve the full column specification for this data.
i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(FifaData)


library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(corrplot)
corrplot 0.90 loaded
MC<-FifaData %>% select(Age, Stamina, Strength, Rating, Aggression, Reactions, Vision, Composure, Speed, Balance) %>% cor()

MC
                   Age    Stamina    Strength     Rating Aggression Reactions
Age         1.00000000 0.07065294  0.32945914 0.45827627  0.2595643 0.4568886
Stamina     0.07065294 1.00000000  0.23021977 0.35527898  0.6432075 0.3459944
Strength    0.32945914 0.23021977  1.00000000 0.36916877  0.4501109 0.2910602
Rating      0.45827627 0.35527898  0.36916877 1.00000000  0.4045138 0.8283686
Aggression  0.25956434 0.64320746  0.45011094 0.40451379  1.0000000 0.3905429
Reactions   0.45688859 0.34599442  0.29106021 0.82836859  0.3905429 1.0000000
Vision      0.19018526 0.48230037 -0.03574628 0.48937051  0.3122379 0.4821710
Composure   0.35576560 0.54426762  0.25897238 0.61369322  0.5350438 0.5893948
Speed      -0.16841745 0.62749618 -0.08594385 0.22421237  0.2918154 0.1886685
Balance    -0.10020216 0.45826797 -0.41906449 0.08772942  0.1719698 0.1300112
                Vision Composure       Speed     Balance
Age         0.19018526 0.3557656 -0.16841745 -0.10020216
Stamina     0.48230037 0.5442676  0.62749618  0.45826797
Strength   -0.03574628 0.2589724 -0.08594385 -0.41906449
Rating      0.48937051 0.6136932  0.22421237  0.08772942
Aggression  0.31223788 0.5350438  0.29181536  0.17196976
Reactions   0.48217102 0.5893948  0.18866853  0.13001119
Vision      1.00000000 0.6489427  0.43129625  0.47670589
Composure   0.64894272 1.0000000  0.39135813  0.32934616
Speed       0.43129625 0.3913581  1.00000000  0.61954967
Balance     0.47670589 0.3293462  0.61954967  1.00000000
corrplot(MC, method = "pie")

Passo 2 - Descrever a Matriz de Correlação e realizar Paramêtros Gráficos

Comandos utilizados - par

No Gráfico de Matriz de Correlações nós temos 45 Correlações Totais e delas nós temos alguns tipos de Correlações.

O Número de Correlações Bem Fracas Existentes são:

Positivas:5 Negativas:4 Total:9

O Número de Correlações Fracas Existentes são:

Positivas:14 Negativas:0 Total:14

O Número de Correlações Moderadas Existentes São:

Positivas:18 Negativas:1 Total:19

O Número de Correlações Fortes Existentes são:

Positivas:3 Negativas:0 Total:3

O Número de Correlações Muito Fortes Existentes são:

Positivas:0 Negativas:0 Total:0

Tabela

Aqui foi feita uma tabela para mostrar a matriz em valores. Continuando e complementando a matriz acima nós mostra de relevantes é que somente existe uma Correlação forte entre Atributos de Rating e Reactions, Vision e Composure, e por fim Speed e Balance

library(dplyr)
library(flextable)
library(corrplot)

MC<-FifaData %>% select(Age, Stamina, Strength, Rating, Aggression, Reactions, Vision, Composure, Speed, Balance) %>% cor() %>%

data.frame() %>% flextable()

MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC

Passo 3 - Gerar Tabela de Correlação e Gráfico de Correlação

Comandos Utlizados - corrplot e flextable

Age e Shot_Power

Aqui eu decidi utilizar duas variavéis quantitativas Age e Shot_Power, nesse caso aqui eu quero entender a correlação entre a idade e o pode de chute dos jogadores.

library(dplyr)
library(flextable)
library(corrplot)

MC<-FifaData %>% select(Age, Shot_Power) %>% cor() %>%

data.frame() %>% flextable()

MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC

Reactions e Vision

Nessa tabela usei a variavél Reactions e Vision, e viso entender qual a correlação da reação com a visão.

library(dplyr)
library(flextable)
library(corrplot)

MC<-FifaData %>% select(Reactions, Vision) %>% cor() %>%

data.frame() %>% flextable()

MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC

Age e Reactions

Aqui eu já utilizei Age e Reactions, correlacionei com a idade e a reação.

library(dplyr)
library(flextable)
library(corrplot)

MC<-FifaData %>% select(Age, Reactions) %>% cor() %>%

data.frame() %>% flextable()

MC <- bg(MC, bg = "#DFFF00", part = "header")
MC <- bg(MC, bg = "#DFFF00", part = "body")
MC <- color(MC, color = "#301934", part = "all")
MC <- bold(MC, bold = TRUE, part = "all")
MC

Passo 4 - Criar Diagrama de Dispersão e gerar paramêtros gráficos

Comandos Utilizados - par, plot, abline e cor

Idade e Poder de Chute

Aqui correlacionio Idade e Poder de Chute e puder perceber que o nível de correlação deu 0.1514011, que mostra uma correlação positiva muito fraca.

library(dplyr)
library(corrplot)
library(RColorBrewer)
COL <- brewer.pal(3, "Set1")
COL
[1] "#E41A1C" "#377EB8" "#4DAF4A"
par(bg="#DFFF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
plot(FifaData$Age, FifaData$Shot_Power,pch=19,col=COL,
     main="Gráfico 2",ylab = "Poder de Chute", xlab = "Idade")
abline(lsfit(FifaData$Age, FifaData$Shot_Power),col="Black")

cor(FifaData$Age, FifaData$Shot_Power)
[1] 0.1514011

Reação e Avaliação

Aqui Correlacionei Reação e Avaliação, pude perceber que o nível de correlação é de 0.8283686, o que mostra uma correlação positiva forte.

library(dplyr)
library(corrplot)
library(RColorBrewer)
COL <- brewer.pal(3, "Set1")
COL
[1] "#E41A1C" "#377EB8" "#4DAF4A"
par(bg="#DFFF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
plot(FifaData$Rating, FifaData$Reactions,pch=19,col=COL,
     main="Gráfico 2",ylab = "Avaliação", xlab = "Reação")
abline(lsfit(FifaData$Rating, FifaData$Reactions),col="Black")

cor(FifaData$Rating, FifaData$Reactions)
[1] 0.8283686

Reação e Idade

Aqui correlacionei idade com a Reação e pude avaliar que o nível de correlação é de 0.4568886, e isso significa que é uma correlação positiva moderada.

library(dplyr)
library(corrplot)
library(RColorBrewer)
COL <- brewer.pal(3, "Set1")
COL
[1] "#E41A1C" "#377EB8" "#4DAF4A"
par(bg="#DFFF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
plot(FifaData$Age, FifaData$Reactions,pch=19,col=COL,
     main="Gráfico 2",ylab = "Reação", xlab = "Idade")
abline(lsfit(FifaData$Age, FifaData$Reactions),col="Black")

cor(FifaData$Age, FifaData$Reactions)
[1] 0.4568886

Passo Final - Conclusão

Dado os dados analisados é possível perceber que os gráficos de dispersão são ferramentas importantíssimas para avaliar a relação entre as variavéis e como elas acabam se impactando. Um detalhe importante quanto a questão de correlação é avaliar se de fato existem causalidades entre elas.

A Causalidade não necessariamente implica em correlação das variavéis. A exemplo usamos a variavél Idade e Reação como variavél central da analise das outras variaveís como Avaliação e Poder de Chute.

Como podemos perceber, em primeiro lugar pensariamos em a Idade está associada maior parte dos atributos listados aos jogadores como Reação e Poder de Chute, porém o que podemos perceber é que tanto a correlação Idade e Poder de Chute tem uma correlação muito fraca e a correlação Reação e Idade teve uma correlação moderada, ambas estas as que mais poderiam ter algum tipo de causalidade, não tiveram nenhuma correlação significativamente forte. Já a correlação Avaliação e Reação, que em teoria não teria causalidade alguma, teve a correlção mais forte de todas as correlações analisadas.