Atividade 6
………………………………..
Gráfico de Dispersão e Mapa de Correlação
………………………………..
library(readr)
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(ggthemes)
library(tidyverse)## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✔ tibble 3.1.7 ✔ stringr 1.4.0
## ✔ tidyr 1.2.0 ✔ forcats 0.5.1
## ✔ purrr 0.3.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
1. Carregar a base de dados
FifaData <- read_csv("C:/Users/Kelly Grigorio/Desktop/Base_de_dados-master/FifaData.csv")## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
2. Gráfico de Dispersão
Disp <- ggplot(FifaData)
Disp <- Disp +
geom_smooth(formula = y ~ x, method = "lm",
aes(x = Age,
y = Speed))+
geom_point(aes(y = Speed,
x = Age,
color = "continent"),
size = 2)
Disp <- Disp +
labs(title = 'Relação entre a idade do jogador e a sua rapidez',
y = 'Rapidez',
x = 'Idade')
plot(Disp)3. Mapa de Correlação
# calcular correlacao entre as variaveis numericas
Mapa_Cor <- FifaData %>%
select(Age, Speed) %>%
# removar NAs
na.omit()
# criar matriz de correlacao
matriz_correl <- cor(Mapa_Cor)
# transformar para dataframe
matriz_correl <- as.data.frame(matriz_correl)
# conveter linhas para uma coluna
matriz_correl <- rownames_to_column(matriz_correl, "var1")
# converter dataframe para formato tidy
matriz_correl_tidy <- matriz_correl %>%
gather(var2, correlacao, -var1)
head(matriz_correl_tidy)## var1 var2 correlacao
## 1 Age Age 1.0000000
## 2 Speed Age -0.1684175
## 3 Age Speed -0.1684175
## 4 Speed Speed 1.0000000
matriz_correl_tidy %>%
ggplot(aes(x = var1, y = var2, fill = correlacao)) +
geom_tile()4. Relatório
O intuito do presente trabalho é avaliar Se há relação entre a idade do jogador e a sua rapidez.
O gráfico de dispersão nos mostra uma ausência de correlação e o mapa de correlação nos da um valor de -0.1684175, ou seja, deixa claro que os dados tem baixa ou nenhuma associação.
Sendo assim, penso que é possível afirmar que a idade não tem associação com a rapidez do jogador