#passo 1 - carregar a base de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/helen/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
#passo 2 olha a base de dados
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
#transformar dados
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"Sim","Não")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Sim","Não")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"Sim","Não")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"Sim","Não")
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Length:95 Length:95
## 1st Qu.:24.5 1st Qu.:1.000 Class :character Class :character
## Median :48.0 Median :2.000 Mode :character Mode :character
## Mean :48.0 Mean :2.074
## 3rd Qu.:71.5 3rd Qu.:3.000
## Max. :95.0 Max. :3.000
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
#Passo 3 - visualização de dados ##diagrama de dispersão ### para duas variaveis quantitativas
par(bg="lightyellow")
plot(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo,pch=16,col="blue",
main="Diagrama de dispersão entre Estresse e horas de estudo",
ylab = "Horas de estudo", xlab= "Estresse")
abline(lsfit(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo),col="darkred")
#Passo 4 correlação
cor(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo)
## [1] 0.303917
#Passo 5 matriz de correlação names(Questionario_Estresse)
names(Questionario_Estresse)
## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a"
## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo"
selecao<- c( "Aluno","Turma","Desempenho","Estresse","Créditos","Horas_estudo")
cor_estresse <-(Questionario_Estresse[,selecao])
cor_estresse
## # A tibble: 95 x 6
## Aluno Turma Desempenho Estresse Créditos Horas_estudo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 8.89 23 27 27
## 2 2 1 8.8 24 28 28
## 3 3 1 8 25 25 25
## 4 4 1 8.8 38 21 30
## 5 5 1 8.9 41 18 20
## 6 6 1 8.1 25 29 32
## 7 7 1 9.2 41 26 25
## 8 8 1 8.5 20 24 25
## 9 9 1 8.7 26 20 25
## 10 10 1 8.3 36 49 59
## # ... with 85 more rows
library(corrplot)
## corrplot 0.92 loaded
par(cex=0.7)
#Conclusão
A partir do diagrama de dipersão entre estresse e horas de estudos percebemos que se trata de um grafico sem correlação, onde a quantidade de horas de estudo não está relacionada com o nivel de estresse apresentado nos candidatos, provavelmente os niveis de estresse se dão por motivos externos e variados.