class: center, middle, inverse, title-slide # Correlações ## ⚔
com o xaringan ### Larissa ### UNIRIO ### 2021-04-14 --- --- class: center, middle # Análise de duas variáveis quantitativas ### Diagrama de dispersão ### Coeficiente de correlação --- # Passo 1 - carregar a base de dados ```r library(readxl) QE <- read_excel("C:/Users/sgonc/Desktop/Base_de_dados-master/Questionario_Estresse.xls") View(QE) names(QE) ``` ``` ## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a" ## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo" ``` ```r load("C:/Users/sgonc/Desktop/Base_de_dados-master/CARROS.RData") ``` --- # Passo 2 - carregar a biblioteca dplyr ```r library(dplyr) ``` ``` ## ## Attaching package: 'dplyr' ``` ``` ## The following objects are masked from 'package:stats': ## ## filter, lag ``` ``` ## The following objects are masked from 'package:base': ## ## intersect, setdiff, setequal, union ``` --- # Passo 3 - resumão das variáveis ```r QE %>% summarise(media=mean(Créditos,na.rm=TRUE)) ``` ``` ## # A tibble: 1 x 1 ## media ## <dbl> ## 1 24.9 ``` ```r resumo <- QE %>% summarise(media_HE=mean(Horas_estudo), nota_media=mean(Desempenho), estresse_medio=mean(Estresse), cred_medio=mean(Créditos,na.rm=TRUE), dp_HE=sd(Horas_estudo), nota_dp=sd(Desempenho), estresse_dp=sd(Estresse), cred_dp=sd(Créditos,na.rm=TRUE)) print(resumo) ``` ``` ## # A tibble: 1 x 8 ## media_HE nota_media estresse_medio cred_medio dp_HE nota_dp estresse_dp ## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 30.7 8.59 27.8 24.9 7.28 0.775 7.54 ## # ... with 1 more variable: cred_dp <dbl> ``` --- # Passo 4 - diagrama de dispersão ```r # Visualização de dados ## Diagrama de dispersão plot(QE$Horas_estudo, QE$Desempenho, pch=20, col="blue", main = "Diagrama de dispersão", xlab = "Horas de Estudo", ylab = "Nota do aluno(a)") abline(lsfit(QE$Horas_estudo, QE$Desempenho), col="darkred") ``` <!-- --> --- ```r ## Relação entre desempenho e estresse plot(QE$Desempenho, QE$Estresse, pch=20, col="blue", main = "Diagrama de dispersão", xlab = "Nota do aluno(a)", ylab = "Estresse") abline(lsfit(QE$Desempenho, QE$Estresse), col="darkblue") ``` <!-- --> --- ```r ## HE e Estresse plot(QE$Horas_estudo, QE$Estresse, pch=20, col="blue", main = "Diagrama de dispersão", xlab = "Horas de estudo", ylab = "Estresse") abline(lsfit(QE$Horas_estudo, QE$Estresse), col="darkblue") ``` <!-- --> --- # Correlações --- ```r # Qual a correlação entre HE e Desempenho? cor(QE$Desempenho, QE$Horas_estudo) ``` ``` ## [1] 0.2231532 ``` ```r cor(QE$Desempenho, QE$Estresse) ``` ``` ## [1] 0.08257246 ``` ```r cor(QE$Desempenho, QE$Estresse) ``` ``` ## [1] 0.08257246 ``` ```r cor(QE$Horas_estudo, QE$Estresse) ``` ``` ## [1] 0.303917 ``` --- ``` ## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a" ## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo" ``` ``` ## Desempenho Estresse Créditos Horas_estudo ## Desempenho 1.00000000 0.08826556 0.08631523 0.2251028 ## Estresse 0.08826556 1.00000000 -0.05898032 0.3016580 ## Créditos 0.08631523 -0.05898032 1.00000000 0.4984399 ## Horas_estudo 0.22510279 0.30165796 0.49843993 1.0000000 ``` ``` ## Warning: package 'corrplot' was built under R version 4.0.5 ``` ``` ## corrplot 0.84 loaded ``` <!-- --> --- ```r CARROS_quanti <- CARROS %>% select(Kmporlitro, Preco, HP, Amperagem_circ_eletrico, Peso, RPM) CARROS_quanti ``` ``` ## Kmporlitro Preco HP Amperagem_circ_eletrico Peso RPM ## Mazda RX4 21.0 160.0 110 3.90 2.620 16.46 ## Mazda RX4 Wag 21.0 160.0 110 3.90 2.875 17.02 ## Datsun 710 22.8 108.0 93 3.85 2.320 18.61 ## Hornet 4 Drive 21.4 258.0 110 3.08 3.215 19.44 ## Hornet Sportabout 18.7 360.0 175 3.15 3.440 17.02 ## Valiant 18.1 225.0 105 2.76 3.460 20.22 ## Duster 360 14.3 360.0 245 3.21 3.570 15.84 ## Merc 240D 24.4 146.7 62 3.69 3.190 20.00 ## Merc 230 22.8 140.8 95 3.92 3.150 22.90 ## Merc 280 19.2 167.6 123 3.92 3.440 18.30 ## Merc 280C 17.8 167.6 123 3.92 3.440 18.90 ## Merc 450SE 16.4 275.8 180 3.07 4.070 17.40 ## Merc 450SL 17.3 275.8 180 3.07 3.730 17.60 ## Merc 450SLC 15.2 275.8 180 3.07 3.780 18.00 ## Cadillac Fleetwood 10.4 472.0 205 2.93 5.250 17.98 ## Lincoln Continental 10.4 460.0 215 3.00 5.424 17.82 ## Chrysler Imperial 14.7 440.0 230 3.23 5.345 17.42 ## Fiat 128 32.4 78.7 66 4.08 2.200 19.47 ## Honda Civic 30.4 75.7 52 4.93 1.615 18.52 ## Toyota Corolla 33.9 71.1 65 4.22 1.835 19.90 ## Toyota Corona 21.5 120.1 97 3.70 2.465 20.01 ## Dodge Challenger 15.5 318.0 150 2.76 3.520 16.87 ## AMC Javelin 15.2 304.0 150 3.15 3.435 17.30 ## Camaro Z28 13.3 350.0 245 3.73 3.840 15.41 ## Pontiac Firebird 19.2 400.0 175 3.08 3.845 17.05 ## Fiat X1-9 27.3 79.0 66 4.08 1.935 18.90 ## Porsche 914-2 26.0 120.3 91 4.43 2.140 16.70 ## Lotus Europa 30.4 95.1 113 3.77 1.513 16.90 ## Ford Pantera L 15.8 351.0 264 4.22 3.170 14.50 ## Ferrari Dino 19.7 145.0 175 3.62 2.770 15.50 ## Maserati Bora 15.0 301.0 335 3.54 3.570 14.60 ## Volvo 142E 21.4 121.0 109 4.11 2.780 18.60 ``` ```r MCorr2 <- cor(CARROS_quanti) MCorr2 ``` ``` ## Kmporlitro Preco HP ## Kmporlitro 1.0000000 -0.8475514 -0.7761684 ## Preco -0.8475514 1.0000000 0.7909486 ## HP -0.7761684 0.7909486 1.0000000 ## Amperagem_circ_eletrico 0.6811719 -0.7102139 -0.4487591 ## Peso -0.8676594 0.8879799 0.6587479 ## RPM 0.4186840 -0.4336979 -0.7082234 ## Amperagem_circ_eletrico Peso RPM ## Kmporlitro 0.68117191 -0.8676594 0.41868403 ## Preco -0.71021393 0.8879799 -0.43369788 ## HP -0.44875912 0.6587479 -0.70822339 ## Amperagem_circ_eletrico 1.00000000 -0.7124406 0.09120476 ## Peso -0.71244065 1.0000000 -0.17471588 ## RPM 0.09120476 -0.1747159 1.00000000 ``` --- ```r corrplot(MCorr2, addCoef.col = TRUE, number.cex = 0.7) ``` <!-- --> --- # Conclusão ## Diversos fatores influenciam o preço do carro!