class: center, middle, inverse, title-slide # Correlações ## ⚔
com o xaringan ### Thayanne Pinheiro ### UNIRIO ### 08/04/2021 --- --- class: center, middle # Análise de duas variáveis quantitativas ### Diagrama de dispersão ### Coeficiente de correlação --- # Passo 1 - Carregar a base de dados ```r # Carregar o banco de dados library(readxl) QE <- read_excel("C:/Users/thaya/Desktop/Base_de_dados-master/Questionario_Estresse.xls") View(QE) names(QE) ``` ``` ## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a" ## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo" ``` ```r load("C:/Users/thaya/Desktop/Base_de_dados-master/CARROS.RData") names(CARROS) ``` ``` ## [1] "Kmporlitro" "Cilindros" ## [3] "Preco" "HP" ## [5] "Amperagem_circ_eletrico" "Peso" ## [7] "RPM" "Tipodecombustivel" ## [9] "TipodeMarcha" "NumdeMarchas" ## [11] "NumdeValvulas" ``` --- # Passo 2 - Carregar a biblioteca dplyr ```r library(dplyr) ``` ``` ## ## Attaching package: 'dplyr' ``` ``` ## The following objects are masked from 'package:stats': ## ## filter, lag ``` ``` ## The following objects are masked from 'package:base': ## ## intersect, setdiff, setequal, union ``` --- # Passo 3 - Mudança da coluna **Créditos** ```r colnames(QE) [9] <- 'Creditos' ``` --- # Passo 4 - Resumão das variáveis ```r QE %>% summarise(media=mean(Creditos,na.rm=TRUE)) ``` ``` ## # A tibble: 1 x 1 ## media ## <dbl> ## 1 24.9 ``` ```r resumo <- QE %>% summarise(media_HE=mean(Horas_estudo), nota_media=mean(Desempenho), Estresse_medio=mean(Estresse), Cred_medio=mean(Creditos,na.rm = TRUE), dp_HE=sd(Horas_estudo), nota_dp=sd(Desempenho), Estresse_dp=sd(Estresse), Cred_dp=sd(Creditos,na.rm = TRUE)) resumo ``` ``` ## # A tibble: 1 x 8 ## media_HE nota_media Estresse_medio Cred_medio dp_HE nota_dp Estresse_dp ## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 30.7 8.59 27.8 24.9 7.28 0.775 7.54 ## # ... with 1 more variable: Cred_dp <dbl> ``` --- # Passo 5 - Diagrama de dispersão <!-- --> --- ## Relação entre desempenho e estresse ```r plot(QE$Desempenho,QE$Estresse,pch=20,col="blue", main = "Diagrama de dispersão", xlab = "Nota do aluno(a)", ylab = "Estresse") abline(lsfit(QE$Desempenho,QE$Estresse),col="darkred") ``` <!-- --> --- ##HE e Estresse ```r plot(QE$Horas_estudo,QE$Estresse,pch=20,col="blue", main="Diagrama de dispersao", xlab = "Horas de estudo", ylab = "Estresse") abline(lsfit(QE$Horas_estudo,QE$Estresse), col="darkblue") ``` <!-- --> --- class: center, middle # Correlações --- # qual a correlação entre HE e Desempenho? ```r cor(QE$Desempenho,QE$Horas_estudo) ``` ``` ## [1] 0.2231532 ``` ```r #Existe uma correlação linear, positiva e fraca cor(QE$Desempenho,QE$Estresse) ``` ``` ## [1] 0.08257246 ``` ```r #Como a correlação é muito baixa, ela pode ser considerada desprezível, sem correlação entre as variáveis cor(QE$Horas_estudo,QE$Estresse) ``` ``` ## [1] 0.303917 ``` ```r #Existe uma correlação linear, positiva e fraca ``` --- ```r names(QE) ``` ``` ## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a" ## [6] "Trabalha" "Desempenho" "Estresse" "Creditos" "Horas_estudo" ``` ```r variaveis.quanti<- c("Desempenho","Estresse","Creditos", "Horas_estudo") QE_quanti <- QE %>% select(Desempenho,Estresse,Creditos,Horas_estudo) QE_quanti <- na.omit(QE_quanti) cor(QE_quanti) ``` ``` ## Desempenho Estresse Creditos Horas_estudo ## Desempenho 1.00000000 0.08826556 0.08631523 0.2251028 ## Estresse 0.08826556 1.00000000 -0.05898032 0.3016580 ## Creditos 0.08631523 -0.05898032 1.00000000 0.4984399 ## Horas_estudo 0.22510279 0.30165796 0.49843993 1.0000000 ``` ```r #Matriz simétrica library(corrplot) ``` ``` ## Warning: package 'corrplot' was built under R version 4.0.5 ``` ``` ## corrplot 0.84 loaded ``` ```r Mcorr <- cor(QE_quanti) corrplot(Mcorr) ``` <!-- --> --- ```r names(CARROS) ``` ``` ## [1] "Kmporlitro" "Cilindros" ## [3] "Preco" "HP" ## [5] "Amperagem_circ_eletrico" "Peso" ## [7] "RPM" "Tipodecombustivel" ## [9] "TipodeMarcha" "NumdeMarchas" ## [11] "NumdeValvulas" ``` ```r CARROS_quanti <- CARROS %>% select(Kmporlitro,Preco,HP,Amperagem_circ_eletrico,Peso,RPM) MCorr2 <- cor(CARROS_quanti) ``` --- ```r corrplot.mixed(MCorr2) ``` <!-- --> --- ```r corrplot(MCorr2,addCoef.col=TRUE,number.cex=0.7) ``` <!-- --> --- # Conclusão ## Diversos fatores influenciam o preço do carro.