class: center, middle, inverse, title-slide # Análise de duas variáveis quantitativas ## Diagrama de dispersão e correlações ### Marcos Vinícius Salgado Mattos ### Unirio ### 08/04/2021 --- --- class: center, middle # Análise de duas variáveis quantitativas ### Diagrama de dispersão ### Coeficiente de correlação --- # Passo 1 - Carregar a base de dados ```r # Carregar a base de dados library(readxl) QE <- read_excel("C:/Users/Usuario/Desktop/Base_de_dados-master/Questionario_Estresse.xls") names(QE) ``` ``` ## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a" ## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo" ``` ```r load("C:/Users/Usuario/Desktop/Base_de_dados-master/CARROS.RData") ``` --- # Passo 2 - Carregar a biblioteca DPLYR ```r library(dplyr) ``` ``` ## ## Attaching package: 'dplyr' ``` ``` ## The following objects are masked from 'package:stats': ## ## filter, lag ``` ``` ## The following objects are masked from 'package:base': ## ## intersect, setdiff, setequal, union ``` --- # Passo 3 - Mudança da coluna "Créditos" ```r colnames(QE)[9] <- 'Creditos' ``` --- # Passo 4 - Resumo das variáveis ```r QE %>% summarise(media=mean(Creditos,na.rm=TRUE)) ``` ``` ## # A tibble: 1 x 1 ## media ## <dbl> ## 1 24.9 ``` ```r resumo<-QE %>% summarise(media_HE=mean(Horas_estudo), nota_media=mean(Desempenho), Estresse_medio=mean(Estresse), Cred_medio=mean(Creditos,na.rm=TRUE), dp_HE=sd(Horas_estudo), nota_dp=sd(Desempenho), Estresse_dp=sd(Estresse), Cred_medio=sd(Creditos,na.rm=TRUE)) resumo ``` ``` ## # A tibble: 1 x 7 ## media_HE nota_media Estresse_medio Cred_medio dp_HE nota_dp Estresse_dp ## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 30.7 8.59 27.8 4.08 7.28 0.775 7.54 ``` --- # Passo 5 - Diagrama de dispersão <!-- --> --- <!-- --> --- ## Horas de Estudos e Estresse do aluno(a) <!-- --> --- class: center, middle # Correlações --- # Qual a correlação entre horas estudadas e desempenho? ```r cor(QE$Desempenho,QE$Horas_estudo) ``` ``` ## [1] 0.2231532 ``` ```r cor(QE$Desempenho,QE$Estresse) ``` ``` ## [1] 0.08257246 ``` ```r cor(QE$Horas_estudo,QE$Estresse) ``` ``` ## [1] 0.303917 ``` --- ``` ## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a" ## [6] "Trabalha" "Desempenho" "Estresse" "Creditos" "Horas_estudo" ``` ``` ## Desempenho Estresse Creditos Horas_estudo ## Desempenho 1.00000000 0.08826556 0.08631523 0.2251028 ## Estresse 0.08826556 1.00000000 -0.05898032 0.3016580 ## Creditos 0.08631523 -0.05898032 1.00000000 0.4984399 ## Horas_estudo 0.22510279 0.30165796 0.49843993 1.0000000 ``` ``` ## Warning: package 'corrplot' was built under R version 4.0.5 ``` ``` ## corrplot 0.84 loaded ``` <!-- --> --- ```r names(CARROS) ``` ``` ## [1] "Kmporlitro" "Cilindros" ## [3] "Preco" "HP" ## [5] "Amperagem_circ_eletrico" "Peso" ## [7] "RPM" "Tipodecombustivel" ## [9] "TipodeMarcha" "NumdeMarchas" ## [11] "NumdeValvulas" ``` ```r CARROS_quanti <- CARROS %>% select(Kmporlitro,Preco,HP,Amperagem_circ_eletrico,Peso,RPM) MCorr2<- cor(CARROS_quanti) ``` --- <!-- --> --- <!-- --> --- # Conclusão ## Diversos fatores influenciam o preço do carro!