Para duas variáveis quantitativas: fazer um diagrama de dispersão e uma matriz de correlação na base de dados FifaData.csv

Fazer uma publicação no RPUBS do arquivo Rmarkdown. OBS - Obrigatória a interpretação dos resultados em pelo menos dois parágrafos.

BASE DE DADOS

library(readr)
FifaData <- read_csv("C:/Users/carol/OneDrive/Documentos/Estatistica1/Base_de_dados-master/FifaData.csv")
View(FifaData)
head(FifaData)
# A tibble: 6 x 53
  Name    Nationality National_Positi~ National_Kit Club  Club_Position Club_Kit
  <chr>   <chr>       <chr>                   <dbl> <chr> <chr>            <dbl>
1 Cristi~ Portugal    LS                          7 Real~ LW                   7
2 Lionel~ Argentina   RW                         10 FC B~ RW                  10
3 Neymar  Brazil      LW                         10 FC B~ LW                  11
4 Luis S~ Uruguay     LS                          9 FC B~ ST                   9
5 Manuel~ Germany     GK                          1 FC B~ GK                   1
6 De Gea  Spain       GK                          1 Manc~ GK                   1
# ... with 46 more variables: Club_Joining <chr>, Contract_Expiry <dbl>,
#   Rating <dbl>, Height <chr>, Weight <chr>, Preffered_Foot <chr>,
#   Birth_Date <chr>, Age <dbl>, Preffered_Position <chr>, Work_Rate <chr>,
#   Weak_foot <dbl>, Skill_Moves <dbl>, Ball_Control <dbl>, Dribbling <dbl>,
#   Marking <dbl>, Sliding_Tackle <dbl>, Standing_Tackle <dbl>,
#   Aggression <dbl>, Reactions <dbl>, Attacking_Position <dbl>,
#   Interceptions <dbl>, Vision <dbl>, Composure <dbl>, Crossing <dbl>, ...

LIMPEZA DOS DADOS

library(dplyr)
library(stringr)
FifaData = FifaData %>%
      mutate(
      Peso = as.integer(gsub('[a-zA-Z]', '', FifaData$Weight)),
      Altura = as.integer(gsub('[a-zA-Z]', '', FifaData$Height)))

ANALISE DE DADOS

summary(FifaData$Altura)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  155.0   176.0   181.0   181.1   186.0   207.0 

DESVIO PADRAO

desvio=sd(FifaData$Peso)
desvio
[1] 6.897948

VARIAÇÃO

coeficientepeso = (desvio/mean(FifaData$Altura))*100
coeficientepeso
[1] 3.808801

HISTOGRAMA

altura=diff(range(FifaData$Altura))
maxaltura=max(FifaData$Altura)
minaltura=min(FifaData$Altura)
mediaaltura=mean(FifaData$Altura)

quebalt=(altura/20)
hist(FifaData$Altura, main="Gráfico 1 - Altura", xlab = "Valores", ylab = "Frequência", col="purple" ,density = 45, angle = 45, breaks = seq(minaltura,maxaltura, quebalt), axes = TRUE, probability = TRUE)
x = minaltura:maxaltura
y = dnorm(x = x, mean = mediaaltura, sd = desvio)
lines(x = x, y = y, col = "pink", lwd=2)

ALTURAS

FifaData = FifaData %>%
 mutate(
  compalturas = case_when(
    Altura < 160 ~ "1. Pequeno",
    Altura < 175 ~ "2. Medio",
    Altura < 190 ~ "3. Normal",
    Altura < 205 ~ "4. Alto",
    Altura < 215 ~ "5. Muito Alto",
        TRUE ~ "8. Outros"))

library(reactable)
FifaData %>% select(compalturas) %>% table() %>%
  data.frame() %>% reactable()

BOXSPLOT

boxplot(Altura~compalturas,
        data = FifaData,main="Análise de Alturas",
        col=c("pink","red"), horizontal = T,
        xlab = "Altura (cm)", ylab = "Tipos de altura")

AJUSTE DAS ALTURAS

FifaData = FifaData %>%
 mutate(
  compalturas2 = case_when(
    Altura < 166 ~ "1. Muito Pequeno",
    Altura < 171 ~ "2. Pequeno",
    Altura < 176 ~ "3. Normal",
    Altura < 181 ~ "4. Normal/Alto",
    Altura < 186 ~ "5. Alto",
    Altura < 191 ~ "6. Muito alto",
    Altura < 196 ~ "7. Muito/muito Alto",
    Altura < 215 ~ "8. Gigante",
        TRUE ~ "9. Outros"))

library(reactable)
FifaData %>% select(compalturas2) %>% table() %>%
  data.frame() %>% reactable()

NOVO BOXSPLOT

boxplot(Altura~compalturas2,
        data = FifaData,main="Análise de Alturas 2",
        col=c("purple","pink"), horizontal = T,
        xlab = "Altura (cm))", ylab = "Tipos de altura")

PESO

summary(FifaData$Peso)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  48.00   70.00   75.00   75.25   80.00  110.00 

DESVIO PADRAO PESO

desviopeso=sd(FifaData$Peso)
desviopeso
[1] 6.897948

VARIAÇÃO DO PESO

variacaopeso = (desviopeso/mean(FifaData$Peso))*100
variacaopeso
[1] 9.166299

DIAGRAMA DE DISPERÇÃO

plot(FifaData$Peso,FifaData$Altura, main="Diagrama de Dispersão",
     xlab = "Peso dos Jogadores", 
     ylab = "Altura dos Jogadores",col="red", pch=16)

abline(lsfit(FifaData$Peso,FifaData$Altura),col="darkblue")

MATRIZ DE CORRELAÇÃO

FifaData %>% select(Vision,Ball_Control, Marking,Aggression,Reactions,Composure) %>%
  cor() 
                Vision Ball_Control   Marking Aggression Reactions Composure
Vision       1.0000000    0.7325480 0.0977956  0.3122379 0.4821710 0.6489427
Ball_Control 0.7325480    1.0000000 0.3553238  0.5431890 0.4250702 0.7047603
Marking      0.0977956    0.3553238 1.0000000  0.7085298 0.2180890 0.3277943
Aggression   0.3122379    0.5431890 0.7085298  1.0000000 0.3905429 0.5350438
Reactions    0.4821710    0.4250702 0.2180890  0.3905429 1.0000000 0.5893948
Composure    0.6489427    0.7047603 0.3277943  0.5350438 0.5893948 1.0000000