#passo 1 - carregar a base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/helen/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

#passo 2 olha a base de dados

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 
#transformar dados

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"Sim","Não")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Sim","Não")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"Sim","Não")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"Sim","Não")

summary(Questionario_Estresse)
##      Aluno          Turma        Mora_pais              RJ           
##  Min.   : 1.0   Min.   :1.000   Length:95          Length:95         
##  1st Qu.:24.5   1st Qu.:1.000   Class :character   Class :character  
##  Median :48.0   Median :2.000   Mode  :character   Mode  :character  
##  Mean   :48.0   Mean   :2.074                                        
##  3rd Qu.:71.5   3rd Qu.:3.000                                        
##  Max.   :95.0   Max.   :3.000                                        
##                                                                      
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

#Passo 3 - visualização de dados ##diagrama de dispersão ### para duas variaveis quantitativas

par(bg="lightyellow")
plot(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo,pch=16,col="blue",
     main="Diagrama de dispersão entre Estresse e horas de estudo",
     ylab = "Horas de estudo", xlab= "Estresse")
abline(lsfit(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo),col="darkred")

#Passo 4 correlação

cor(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo)
## [1] 0.303917

#Passo 5 matriz de correlação names(Questionario_Estresse)

names(Questionario_Estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
selecao<- c( "Aluno","Turma","Desempenho","Estresse","Créditos","Horas_estudo")

cor_estresse <-(Questionario_Estresse[,selecao])
cor_estresse 
## # A tibble: 95 x 6
##    Aluno Turma Desempenho Estresse Créditos Horas_estudo
##    <dbl> <dbl>      <dbl>    <dbl>    <dbl>        <dbl>
##  1     1     1       8.89       23       27           27
##  2     2     1       8.8        24       28           28
##  3     3     1       8          25       25           25
##  4     4     1       8.8        38       21           30
##  5     5     1       8.9        41       18           20
##  6     6     1       8.1        25       29           32
##  7     7     1       9.2        41       26           25
##  8     8     1       8.5        20       24           25
##  9     9     1       8.7        26       20           25
## 10    10     1       8.3        36       49           59
## # ... with 85 more rows
library(corrplot)
## corrplot 0.92 loaded
par(cex=0.7)

#Conclusão

A partir do diagrama de dipersão entre estresse e horas de estudos percebemos que se trata de um grafico sem correlação, onde a quantidade de horas de estudo não está relacionada com o nivel de estresse apresentado nos candidatos, provavelmente os niveis de estresse se dão por motivos externos e variados.