class: center, middle, inverse, title-slide # Analise de Variáveis Quantitativas - Fifa ## ⚔
with xaringan ### Lucas Cândido Bonifácio de Queiroz ### Unirio - CCJP ### 2021-04-13) --- --- class: center, middle # Análise de duas variáveis quantitativas ### Diagrama de Dispersão --- # Passo 1 - Carregando a Base de Dados: ```r library(readr) FD <- read_csv("C:/Users/Casa/OneDrive/Imagens/Base_de_dados-master/FifaData.csv") ``` ``` ## ## -- Column specification -------------------------------------------------------- ## cols( ## .default = col_double(), ## Name = col_character(), ## Nationality = col_character(), ## National_Position = col_character(), ## Club = col_character(), ## Club_Position = col_character(), ## Club_Joining = col_character(), ## Height = col_character(), ## Weight = col_character(), ## Preffered_Foot = col_character(), ## Birth_Date = col_character(), ## Preffered_Position = col_character(), ## Work_Rate = col_character() ## ) ## i Use `spec()` for the full column specifications. ``` ```r View(FD) names(FD) ``` ``` ## [1] "Name" "Nationality" "National_Position" ## [4] "National_Kit" "Club" "Club_Position" ## [7] "Club_Kit" "Club_Joining" "Contract_Expiry" ## [10] "Rating" "Height" "Weight" ## [13] "Preffered_Foot" "Birth_Date" "Age" ## [16] "Preffered_Position" "Work_Rate" "Weak_foot" ## [19] "Skill_Moves" "Ball_Control" "Dribbling" ## [22] "Marking" "Sliding_Tackle" "Standing_Tackle" ## [25] "Aggression" "Reactions" "Attacking_Position" ## [28] "Interceptions" "Vision" "Composure" ## [31] "Crossing" "Short_Pass" "Long_Pass" ## [34] "Acceleration" "Speed" "Stamina" ## [37] "Strength" "Balance" "Agility" ## [40] "Jumping" "Heading" "Shot_Power" ## [43] "Finishing" "Long_Shots" "Curve" ## [46] "Freekick_Accuracy" "Penalties" "Volleys" ## [49] "GK_Positioning" "GK_Diving" "GK_Kicking" ## [52] "GK_Handling" "GK_Reflexes" ``` --- # Passo 2 - Carregando a Biblioteca Dplyr: ```r library(dplyr) ``` ``` ## ## Attaching package: 'dplyr' ``` ``` ## The following objects are masked from 'package:stats': ## ## filter, lag ``` ``` ## The following objects are masked from 'package:base': ## ## intersect, setdiff, setequal, union ``` --- # Passo 3 - Resumo Completo das Variáveis Idade e Força de chute: ```r resumo1 <- FD %>% summarise(media_Age=mean(Age), Shot_Power_media=mean(Shot_Power), dp_Age=sd(Age), Shot_Power_dp=sd(Shot_Power)) print(resumo1) ``` ``` ## # A tibble: 1 x 4 ## media_Age Shot_Power_media dp_Age Shot_Power_dp ## <dbl> <dbl> <dbl> <dbl> ## 1 25.5 55.6 4.68 17.6 ``` --- # Passo 4 - Resumo Completo das Variáveis Dribles e Agilidade: ```r resumo2 <- FD %>% summarise(media_Dribbling=mean(Dribbling), Agility_media=mean(Agility), dp_Dribbling=sd(Dribbling), Agility_dp=sd(Agility)) print(resumo2) ``` ``` ## # A tibble: 1 x 4 ## media_Dribbling Agility_media dp_Dribbling Agility_dp ## <dbl> <dbl> <dbl> <dbl> ## 1 54.8 63.2 18.9 14.6 ``` --- # Passo 5 - Diagrama de Disperção das variáveis Idade e Força de Chute: ```r # # # Relação entre a Idade dos Jogadores e a força do chute: par(bg="lightyellow") plot(FD$Age,FD$Shot_Power,pch=20,col="blue", main = "Diagrama de Dispersão", xlab = "Idades dos Jogadores", ylab = "Poder do chute dos jogadores") abline(lsfit(FD$Age,FD$Shot_Power),col="black") ``` <!-- --> --- # Passo 6 - Diagrama de Dispersão das Variáveis Dribles e Agilidade: ```r # Relação entre a quantidade de dribles e a agilidade dos jogadores: par(bg="lightyellow") plot(FD$Dribbling,FD$Agility,pch=20,col="blue", main="Diagrama de Dispersão", xlab = "Quantidade de Dribles", ylab = "Agilidade dos Jogadores") abline(lsfit(FD$Dribbling,FD$Agility),col="black") ``` <!-- --> --- # Passo 7 - Correlações ```r cor(FD$Age,FD$Shot_Power) ``` ``` ## [1] 0.1514011 ``` Baixa ou nenhuma associação Entre as variáveis Idade e Força do Chute ```r cor(FD$Dribbling,FD$Agility) ``` ``` ## [1] 0.7546824 ``` Grau bom ou excelente de associação / correlação positiva forte --- ```r FD_quanti <- FD %>% select("Age","Shot_Power","Dribbling","Agility") FD_quanti <- na.omit(FD_quanti) cor(FD_quanti) ``` ``` ## Age Shot_Power Dribbling Agility ## Age 1.000000000 0.1514011 0.004740379 -0.01945646 ## Shot_Power 0.151401105 1.0000000 0.795026320 0.56372987 ## Dribbling 0.004740379 0.7950263 1.000000000 0.75468236 ## Agility -0.019456460 0.5637299 0.754682364 1.00000000 ``` ```r library(corrplot) ``` ``` ## Warning: package 'corrplot' was built under R version 4.0.5 ``` ``` ## corrplot 0.84 loaded ``` ```r Mcorr <- cor(FD_quanti) corrplot(Mcorr) ``` <!-- --> --- # Gráficos ```r corrplot.mixed(Mcorr) ``` <!-- --> --- ```r corrplot(Mcorr,method = "square") ``` <!-- --> --- ```r corrplot(Mcorr,method = "number") ``` <!-- --> --- # # Conclusão das Análises Bom, eu busquei analisar 4 tipos de variáveis, afim realizar uma correlação em dois pares distintos. Obtive resultados interessantes quanto a análise feita. A primeira correlação foi entre a Idade dos Jogadores da Fifa e a Força de Chute dos mesmos. Minha hipótese inicial era de que os jogadores mais novos (compreendidos de 17 a 27), teriam uma força de chute superior aos jogadores mais velhos (30 a 40). E para minha surpresa, o gráfico de dispersão não tendenciou para nenhum lado, e mostrou que a correlação das duas variáveis era quase nula, ou seja, a idade não interfere na força de chute dos jogadores da Fifa. Em contrapartida a segunda análise, feita entre a quantidade de Dribles dos Jogadores e suas respectivas agilidades, foi totalmente de acordo com a minha hipótese inicial, que consistia em: Quanto mais alto o nivel de agilidade dos jogadores, maior era a quantidade de Dribles que os mesmos haviam feito em campo, o gráfico mostrou uma uma correlação positiva extremamente forte, ou seja, a quantidade de Dribles está muito associada ao nivel de agilidade do Jogador ---