Passo 1 - Importar Base de Dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/victo/Desktop/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")

Passo 2 - Dispersão e coeficiente de correlação

Nível de Estresse versus Número de Créditos:

Associação inexistente, linha praticamente reta.

Mostra que não há correlação entre o nível de estresse e o número de créditos.

plot(Questionario_Estresse$Estresse,Questionario_Estresse$Créditos, pch=19)
abline(lsfit(Questionario_Estresse$Estresse,Questionario_Estresse$Créditos),col="red")
## Warning in lsfit(Questionario_Estresse$Estresse,
## Questionario_Estresse$Créditos): 1 missing value deleted

cor(Questionario_Estresse$Estresse,Questionario_Estresse$Créditos)
## [1] NA

Nível de Estresse versus Desempenho:

Associação levemente posisitiva, próximo a zero, porém positiva.

Mostra que há leve correlação entre o nível de estresse e o desempenho dos alunos.

plot(Questionario_Estresse$Estresse,Questionario_Estresse$Desempenho, pch=19)
abline(lsfit(Questionario_Estresse$Estresse,Questionario_Estresse$Desempenho),col="red")

cor(Questionario_Estresse$Estresse,Questionario_Estresse$Desempenho) # positiva próximo a zero
## [1] 0.08257246

Nível de estresse versus Horas de estudo:

Associação levemente posisitiva.

Mostra que alunos que estudam mais horas, tendem a ter maior nível de estresse.

plot(Questionario_Estresse$Estresse,Questionario_Estresse$Horas_estudo, pch=19)
abline(lsfit(Questionario_Estresse$Estresse,Questionario_Estresse$Horas_estudo),col="red")

cor(Questionario_Estresse$Estresse,Questionario_Estresse$Horas_estudo) # Mais próximo de zero do que de 1
## [1] 0.303917

Horas de estudo versus desempenho:

Associação levemente posisitiva

Mostra leve correlação positiva entre horas de estudo e desempenho.

plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho, pch=19)
abline(lsfit(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho),col="red")

cor(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho)
## [1] 0.2231532

Passo 3 - Matriz e Corrplot

Matriz:

names(Questionario_Estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado(a)" 
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
variaveis_quantitativas<-c("Desempenho", "Estresse", "Créditos", "Horas_estudo")
Questionario_Estresse[,variaveis_quantitativas]
## # A tibble: 95 x 4
##    Desempenho Estresse Créditos Horas_estudo
##         <dbl>    <dbl>    <dbl>        <dbl>
##  1       8.89       23       27           27
##  2       8.8        24       28           28
##  3       8          25       25           25
##  4       8.8        38       21           30
##  5       8.9        41       18           20
##  6       8.1        25       29           32
##  7       9.2        41       26           25
##  8       8.5        20       24           25
##  9       8.7        26       20           25
## 10       8.3        36       49           59
## # ... with 85 more rows
cor(Questionario_Estresse[,variaveis_quantitativas])
##              Desempenho   Estresse Créditos Horas_estudo
## Desempenho   1.00000000 0.08257246       NA    0.2231532
## Estresse     0.08257246 1.00000000       NA    0.3039170
## Créditos             NA         NA        1           NA
## Horas_estudo 0.22315316 0.30391699       NA    1.0000000
library(corrplot)
## corrplot 0.84 loaded
correlacao_questionario<-cor(Questionario_Estresse[,variaveis_quantitativas])
correlacao_questionario
##              Desempenho   Estresse Créditos Horas_estudo
## Desempenho   1.00000000 0.08257246       NA    0.2231532
## Estresse     0.08257246 1.00000000       NA    0.3039170
## Créditos             NA         NA        1           NA
## Horas_estudo 0.22315316 0.30391699       NA    1.0000000

Corrplot:

corrplot(correlacao_questionario)

Passo 4 - Boxplot (Mora ou não com os pais / Trabalha ou não)

Questionario_Estresse$Mora_pais<-ifelse(Questionario_Estresse$Mora_pais==1, "Com os pais", "Sem os pais")
Questionario_Estresse$Trabalha<-ifelse(Questionario_Estresse$Trabalha==1, "Trabalha", "Nao trabalha")

Boxplot - Desempenho e Moradia

Embora apresente outliers, observa-se que o valor máximo de desempenho é alcançado por alunos que moram com os pais.

Etretanto a mediana de desempenho de quem não mora com os pais é maior.

Ambos apresentam leve assimetria.

É possível perceber que o grupo que mora com os pais apresentou valor mínimo de desempenho inferior aos que moram com os pais.

boxplot(Questionario_Estresse$Desempenho ~ Questionario_Estresse$Mora_pais,
        horizontal = T,
        col=c("red","blue"),
        main = "Boxplot - Desempenho x Moradia",
        xlab = "Desempenho",
        ylab = "Moradia")

Boxplot - Estresse e Trabalho

Percebe-se que a mediana do nível de estresse de quem não trabalha é superior a de quem não trabalha.

O grupo dos alunos que trabalham apresentou como valor de máximo um nível de estresse ligeiramente superior.

Ambos apresentam assimetria.

boxplot(Questionario_Estresse$Estresse ~ Questionario_Estresse$Trabalha,
        horizontal = T,
        col=c("green","yellow"),
        main = "Boxplot - Estresse x Trabalho ",
        xlab = "Nível de estresse",
        ylab = "Trabalho")

Passo 5 - Média e Desvio padrão

library(psych)

Estresse X Trabalho:

A média do nível de estresse de quem não trabalha é 27,93, com desvio padrão de 7,38.

A média do nível de estresse de quem trabalha é 27,64, com desvio padrão de 7,90.

describeBy(Questionario_Estresse$Estresse ~ Trabalha, Questionario_Estresse)
## 
##  Descriptive statistics by group 
## Trabalha: Nao trabalha
##              vars  n  mean    sd median trimmed   mad min  max range  skew
## Aluno           1 59 49.31 24.57   49.0   49.55 28.17   1 95.0  94.0 -0.05
## Turma           2 59  2.12  0.74    2.0    2.14  1.48   1  3.0   2.0 -0.19
## Mora_pais*      3 59  1.54  0.50    2.0    1.55  0.00   1  2.0   1.0 -0.17
## RJ              4 59  1.68  0.47    2.0    1.71  0.00   1  2.0   1.0 -0.74
## Namorado(a)     5 59  1.51  0.50    2.0    1.51  0.00   1  2.0   1.0 -0.03
## Trabalha*       6 59  1.00  0.00    1.0    1.00  0.00   1  1.0   0.0   NaN
## Desempenho      7 59  8.63  0.70    8.8    8.72  0.44   6  9.6   3.6 -1.68
## Estresse        8 59 27.93  7.38   29.0   27.88  7.41  12 44.0  32.0  0.02
## Créditos        9 58 25.43  2.68   25.5   25.54  2.22  20 32.0  12.0 -0.15
## Horas_estudo   10 59 31.56  6.93   30.0   31.06  4.45  20 60.0  40.0  1.27
##              kurtosis   se
## Aluno           -0.86 3.20
## Turma           -1.21 0.10
## Mora_pais*      -2.01 0.07
## RJ              -1.47 0.06
## Namorado(a)     -2.03 0.07
## Trabalha*         NaN 0.00
## Desempenho       3.60 0.09
## Estresse        -0.57 0.96
## Créditos        -0.29 0.35
## Horas_estudo     3.11 0.90
## ------------------------------------------------------------ 
## Trabalha: Trabalha
##              vars  n  mean    sd median trimmed   mad   min  max range  skew
## Aluno           1 36 45.86 32.14   40.5   45.40 44.48  4.00 93.0 89.00  0.12
## Turma           2 36  2.00  0.93    2.0    2.00  1.48  1.00  3.0  2.00  0.00
## Mora_pais*      3 36  1.53  0.51    2.0    1.53  0.00  1.00  2.0  1.00 -0.11
## RJ              4 36  1.61  0.49    2.0    1.63  0.00  1.00  2.0  1.00 -0.44
## Namorado(a)     5 36  1.50  0.51    1.5    1.50  0.74  1.00  2.0  1.00  0.00
## Trabalha*       6 36  1.00  0.00    1.0    1.00  0.00  1.00  1.0  0.00   NaN
## Desempenho      7 36  8.54  0.90    8.7    8.67  0.56  5.82  9.7  3.88 -1.55
## Estresse        8 36 27.64  7.90   26.0   27.53  8.15 13.00 44.0 31.00  0.15
## Créditos        9 36 24.17  5.62   24.0   23.70  4.45 15.00 49.0 34.00  2.19
## Horas_estudo   10 36 29.36  7.72   30.0   28.63  7.41 19.00 59.0 40.00  1.46
##              kurtosis   se
## Aluno           -1.68 5.36
## Turma           -1.87 0.15
## Mora_pais*      -2.04 0.08
## RJ              -1.86 0.08
## Namorado(a)     -2.05 0.08
## Trabalha*         NaN 0.00
## Desempenho       2.21 0.15
## Estresse        -0.84 1.32
## Créditos         8.08 0.94
## Horas_estudo     3.69 1.29

Desempenho X Morar ou não com os pais

A média do desempenho de quem mora com os pais é 8,50, com desvio padrão de 0,93.

A média do desempenho de quem não mora com os pais é 8,67, com desvio padrão de 0,61.

describeBy(Questionario_Estresse$Desempenho ~ Mora_pais, Questionario_Estresse)
## 
##  Descriptive statistics by group 
## Mora_pais: Com os pais
##              vars  n  mean    sd median trimmed   mad   min  max range  skew
## Aluno           1 44 49.00 27.41  44.50   48.78 35.58  2.00 95.0 93.00  0.02
## Turma           2 44  2.16  0.83   2.00    2.19  1.48  1.00  3.0  2.00 -0.29
## Mora_pais*      3 44  1.00  0.00   1.00    1.00  0.00  1.00  1.0  0.00   NaN
## RJ              4 44  1.32  0.47   1.00    1.28  0.00  1.00  2.0  1.00  0.75
## Namorado(a)     5 44  1.57  0.50   2.00    1.58  0.00  1.00  2.0  1.00 -0.27
## Trabalha*       6 44  1.39  0.49   1.00    1.36  0.00  1.00  2.0  1.00  0.45
## Desempenho      7 44  8.50  0.93   8.65    8.63  0.59  5.82  9.7  3.88 -1.27
## Estresse        8 44 28.11  7.16  27.50   28.14  5.93 12.00 44.0 32.00  0.01
## Créditos        9 43 25.37  4.76  24.00   25.03  2.97 17.00 49.0 32.00  2.60
## Horas_estudo   10 44 31.57  8.67  30.00   30.58  7.41 20.00 60.0 40.00  1.42
##              kurtosis   se
## Aluno           -1.31 4.13
## Turma           -1.53 0.13
## Mora_pais*        NaN 0.00
## RJ              -1.46 0.07
## Namorado(a)     -1.97 0.08
## Trabalha*       -1.84 0.07
## Desempenho       1.13 0.14
## Estresse        -0.36 1.08
## Créditos        11.64 0.73
## Horas_estudo     2.53 1.31
## ------------------------------------------------------------ 
## Mora_pais: Sem os pais
##              vars  n  mean    sd median trimmed   mad  min  max range  skew
## Aluno           1 51 47.14 27.95   49.0   47.24 37.06  1.0 93.0  92.0 -0.01
## Turma           2 51  2.00  0.80    2.0    2.00  1.48  1.0  3.0   2.0  0.00
## Mora_pais*      3 51  1.00  0.00    1.0    1.00  0.00  1.0  1.0   0.0   NaN
## RJ              4 51  1.94  0.24    2.0    2.00  0.00  1.0  2.0   1.0 -3.64
## Namorado(a)     5 51  1.45  0.50    1.0    1.44  0.00  1.0  2.0   1.0  0.19
## Trabalha*       6 51  1.37  0.49    1.0    1.34  0.00  1.0  2.0   1.0  0.51
## Desempenho      7 51  8.67  0.61    8.8    8.74  0.44  5.9  9.5   3.6 -2.13
## Estresse        8 51 27.57  7.92   27.0   27.41  8.90 13.0 44.0  31.0  0.13
## Créditos        9 51 24.59  3.41   24.0   24.71  4.45 15.0 32.0  17.0 -0.41
## Horas_estudo   10 51 30.00  5.81   30.0   29.85  7.41 19.0 44.0  25.0  0.22
##              kurtosis   se
## Aluno           -1.25 3.91
## Turma           -1.47 0.11
## Mora_pais*        NaN 0.00
## RJ              11.48 0.03
## Namorado(a)     -2.00 0.07
## Trabalha*       -1.77 0.07
## Desempenho       6.97 0.09
## Estresse        -0.89 1.11
## Créditos        -0.16 0.48
## Horas_estudo    -0.44 0.81

Desempenho X Trabalho

A média do desempenho de quem não trabalha é 8,63, com desvio padrão de 0,70.

A média do desempenho de quem trabalha é 8,54, com desvio padrão de 0,90.

describeBy(Questionario_Estresse$Desempenho ~ Trabalha, Questionario_Estresse)
## 
##  Descriptive statistics by group 
## Trabalha: Nao trabalha
##              vars  n  mean    sd median trimmed   mad min  max range  skew
## Aluno           1 59 49.31 24.57   49.0   49.55 28.17   1 95.0  94.0 -0.05
## Turma           2 59  2.12  0.74    2.0    2.14  1.48   1  3.0   2.0 -0.19
## Mora_pais*      3 59  1.54  0.50    2.0    1.55  0.00   1  2.0   1.0 -0.17
## RJ              4 59  1.68  0.47    2.0    1.71  0.00   1  2.0   1.0 -0.74
## Namorado(a)     5 59  1.51  0.50    2.0    1.51  0.00   1  2.0   1.0 -0.03
## Trabalha*       6 59  1.00  0.00    1.0    1.00  0.00   1  1.0   0.0   NaN
## Desempenho      7 59  8.63  0.70    8.8    8.72  0.44   6  9.6   3.6 -1.68
## Estresse        8 59 27.93  7.38   29.0   27.88  7.41  12 44.0  32.0  0.02
## Créditos        9 58 25.43  2.68   25.5   25.54  2.22  20 32.0  12.0 -0.15
## Horas_estudo   10 59 31.56  6.93   30.0   31.06  4.45  20 60.0  40.0  1.27
##              kurtosis   se
## Aluno           -0.86 3.20
## Turma           -1.21 0.10
## Mora_pais*      -2.01 0.07
## RJ              -1.47 0.06
## Namorado(a)     -2.03 0.07
## Trabalha*         NaN 0.00
## Desempenho       3.60 0.09
## Estresse        -0.57 0.96
## Créditos        -0.29 0.35
## Horas_estudo     3.11 0.90
## ------------------------------------------------------------ 
## Trabalha: Trabalha
##              vars  n  mean    sd median trimmed   mad   min  max range  skew
## Aluno           1 36 45.86 32.14   40.5   45.40 44.48  4.00 93.0 89.00  0.12
## Turma           2 36  2.00  0.93    2.0    2.00  1.48  1.00  3.0  2.00  0.00
## Mora_pais*      3 36  1.53  0.51    2.0    1.53  0.00  1.00  2.0  1.00 -0.11
## RJ              4 36  1.61  0.49    2.0    1.63  0.00  1.00  2.0  1.00 -0.44
## Namorado(a)     5 36  1.50  0.51    1.5    1.50  0.74  1.00  2.0  1.00  0.00
## Trabalha*       6 36  1.00  0.00    1.0    1.00  0.00  1.00  1.0  0.00   NaN
## Desempenho      7 36  8.54  0.90    8.7    8.67  0.56  5.82  9.7  3.88 -1.55
## Estresse        8 36 27.64  7.90   26.0   27.53  8.15 13.00 44.0 31.00  0.15
## Créditos        9 36 24.17  5.62   24.0   23.70  4.45 15.00 49.0 34.00  2.19
## Horas_estudo   10 36 29.36  7.72   30.0   28.63  7.41 19.00 59.0 40.00  1.46
##              kurtosis   se
## Aluno           -1.68 5.36
## Turma           -1.87 0.15
## Mora_pais*      -2.04 0.08
## RJ              -1.86 0.08
## Namorado(a)     -2.05 0.08
## Trabalha*         NaN 0.00
## Desempenho       2.21 0.15
## Estresse        -0.84 1.32
## Créditos         8.08 0.94
## Horas_estudo     3.69 1.29

Estresse X Morar ou não com os pais

A média do nível de estresse de quem mora com os pais é 28,11, com desvio padrão de 7,16.

A média do nível de estresse de quem não mora com os pais é 27,57 com desvio padrão de 7,92.

describeBy(Questionario_Estresse$Estresse ~ Mora_pais, Questionario_Estresse)
## 
##  Descriptive statistics by group 
## Mora_pais: Com os pais
##              vars  n  mean    sd median trimmed   mad   min  max range  skew
## Aluno           1 44 49.00 27.41  44.50   48.78 35.58  2.00 95.0 93.00  0.02
## Turma           2 44  2.16  0.83   2.00    2.19  1.48  1.00  3.0  2.00 -0.29
## Mora_pais*      3 44  1.00  0.00   1.00    1.00  0.00  1.00  1.0  0.00   NaN
## RJ              4 44  1.32  0.47   1.00    1.28  0.00  1.00  2.0  1.00  0.75
## Namorado(a)     5 44  1.57  0.50   2.00    1.58  0.00  1.00  2.0  1.00 -0.27
## Trabalha*       6 44  1.39  0.49   1.00    1.36  0.00  1.00  2.0  1.00  0.45
## Desempenho      7 44  8.50  0.93   8.65    8.63  0.59  5.82  9.7  3.88 -1.27
## Estresse        8 44 28.11  7.16  27.50   28.14  5.93 12.00 44.0 32.00  0.01
## Créditos        9 43 25.37  4.76  24.00   25.03  2.97 17.00 49.0 32.00  2.60
## Horas_estudo   10 44 31.57  8.67  30.00   30.58  7.41 20.00 60.0 40.00  1.42
##              kurtosis   se
## Aluno           -1.31 4.13
## Turma           -1.53 0.13
## Mora_pais*        NaN 0.00
## RJ              -1.46 0.07
## Namorado(a)     -1.97 0.08
## Trabalha*       -1.84 0.07
## Desempenho       1.13 0.14
## Estresse        -0.36 1.08
## Créditos        11.64 0.73
## Horas_estudo     2.53 1.31
## ------------------------------------------------------------ 
## Mora_pais: Sem os pais
##              vars  n  mean    sd median trimmed   mad  min  max range  skew
## Aluno           1 51 47.14 27.95   49.0   47.24 37.06  1.0 93.0  92.0 -0.01
## Turma           2 51  2.00  0.80    2.0    2.00  1.48  1.0  3.0   2.0  0.00
## Mora_pais*      3 51  1.00  0.00    1.0    1.00  0.00  1.0  1.0   0.0   NaN
## RJ              4 51  1.94  0.24    2.0    2.00  0.00  1.0  2.0   1.0 -3.64
## Namorado(a)     5 51  1.45  0.50    1.0    1.44  0.00  1.0  2.0   1.0  0.19
## Trabalha*       6 51  1.37  0.49    1.0    1.34  0.00  1.0  2.0   1.0  0.51
## Desempenho      7 51  8.67  0.61    8.8    8.74  0.44  5.9  9.5   3.6 -2.13
## Estresse        8 51 27.57  7.92   27.0   27.41  8.90 13.0 44.0  31.0  0.13
## Créditos        9 51 24.59  3.41   24.0   24.71  4.45 15.0 32.0  17.0 -0.41
## Horas_estudo   10 51 30.00  5.81   30.0   29.85  7.41 19.0 44.0  25.0  0.22
##              kurtosis   se
## Aluno           -1.25 3.91
## Turma           -1.47 0.11
## Mora_pais*        NaN 0.00
## RJ              11.48 0.03
## Namorado(a)     -2.00 0.07
## Trabalha*       -1.77 0.07
## Desempenho       6.97 0.09
## Estresse        -0.89 1.11
## Créditos        -0.16 0.48
## Horas_estudo    -0.44 0.81

Passo 6 - Interpretação em dois parágrafos

Ao interpretar os gráficos de dispersão, as linhas de tendência e os coeficientes de correlação, é possível observar que a quantidade de créditos cumpridos pelos alunos não influencia diretamente no nível de estresse que apresentam. Da mesma forma, a associação positiva entre o nível de estresse e o desempenho apresentado pelo alunos é muito franca, o que pode significar que o estresse dos alunos não afeta as notas de maneira substancial. Por outro lado, é possível verificar que o número de horas estudadas possui uma correlação maior (0.303917) com o nível de estresse. O mesmo ocorre na relação entre horas de estudo e desempenho, a correlação encontrada foi de 0.2231532, demonstrando que o desempenho é afetado pelas horas de estudo. Através da matriz e do corrplot gerados, é possível visualizar as correlações entre as variáveis: Horas de estudo/Desempenho e Horas de estudo/Nível de estresse, enquanto as demais correlações são inexistentes, excetuando, é claro, correlação de uma variável com ela mesma.

Pela visualização dos boxplots, foi possível analisar a relação entre o Desempenho dos alunos com o fato de morarem ou não com o pais. O grupo de alunos que moram com os pais, apresentou como máximo, um nível de desempenho maior do que o máximo apresentado pelo pelo grupo de alunos que não moram com os pais. Entretanto, a mediana do desempenho do grupo que não mora com os pais é superior ao que mora com eles.Já a respeito da relação entre Nível de estresse e trabalho, o boxplot demonstrou que a mediana do nível de estresse do grupo que não trabalha é superior ao do grupo de alunos que trabalha. Os dois grupos apresentaram máximos semelhantes. Acerca das médias e desvios padrões encontrados, pode-se perceber:

1 - O Grupo de alunos que não trabalha apresentou média de estresse maior do que o grupo que trabalha, entretanto pelo desvio padrão nota-se que as amostras não são muito homogêneas, tendo valores que afastam-se da média.

2- O grupo de alunos que moram com os pais apresentou média de desempenho levemente inferior e, para essa amostra, o desvio padrão baixo mostra que os valores de desempenho aproximam-se da média.

3 - A média de desempenho dos alunos que não trabalham é superior aos que trabalham, apresentando desvio padrão baixo, mostrando distribuição homogênea.

4 - A média do nível de estresse de quem mora com os pais foi superior, entretanto com desvio padrão alto encontrado revela uma distribuição com valores mais distantes da média.