Atividade 6

………………………………..

Gráfico de Dispersão e Mapa de Correlação

………………………………..

library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(ggthemes)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✔ tibble  3.1.7     ✔ stringr 1.4.0
## ✔ tidyr   1.2.0     ✔ forcats 0.5.1
## ✔ purrr   0.3.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()

1. Carregar a base de dados

FifaData <- read_csv("C:/Users/Kelly Grigorio/Desktop/Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

2. Gráfico de Dispersão

Disp <- ggplot(FifaData)

Disp <- Disp +
  geom_smooth(formula = y ~ x, method = "lm", 
               aes(x = Age,
                   y = Speed))+
  geom_point(aes(y = Speed,
                 x = Age,
                 color = "continent"),
             size = 2)

Disp <- Disp +
  labs(title = 'Relação entre a idade do jogador e a sua rapidez',
       y = 'Rapidez',
       x = 'Idade')

plot(Disp)

3. Mapa de Correlação

# calcular correlacao entre as variaveis numericas
Mapa_Cor <- FifaData %>%
  select(Age, Speed) %>%
  # removar NAs
  na.omit()

# criar matriz de correlacao
matriz_correl <- cor(Mapa_Cor)

# transformar para dataframe
matriz_correl <- as.data.frame(matriz_correl) 

# conveter linhas para uma coluna
matriz_correl <- rownames_to_column(matriz_correl, "var1")

# converter dataframe para formato tidy
matriz_correl_tidy <- matriz_correl %>% 
  gather(var2, correlacao, -var1)

head(matriz_correl_tidy)
##    var1  var2 correlacao
## 1   Age   Age  1.0000000
## 2 Speed   Age -0.1684175
## 3   Age Speed -0.1684175
## 4 Speed Speed  1.0000000
matriz_correl_tidy %>% 
  ggplot(aes(x = var1, y = var2, fill = correlacao)) +
  geom_tile()

4. Relatório

O intuito do presente trabalho é avaliar Se há relação entre a idade do jogador e a sua rapidez.

O gráfico de dispersão nos mostra uma ausência de correlação e o mapa de correlação nos da um valor de -0.1684175, ou seja, deixa claro que os dados tem baixa ou nenhuma associação.

Sendo assim, penso que é possível afirmar que a idade não tem associação com a rapidez do jogador