Passo 1 - carregar base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Clara/OneDrive/Documentos/basededados/Questionario_Estresse.xls", 
                                    sheet = "Dados")
View(Questionario_Estresse)

Passo 2 - análise

summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Passo 3 - inspecionar os dados

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

Passo 4 - transformação de dados

Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais==1, "sim", "nao")

Questionario_Estresse$Trabalha = ifelse(Questionario_Estresse$Trabalha==1, "sim", "nao")

Passo 5 - inspecionar transformação de dados

summary(Questionario_Estresse)
##      Aluno          Turma        Mora_pais               RJ       
##  Min.   : 1.0   Min.   :1.000   Length:95          Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   Class :character   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Mode  :character   Median :2.000  
##  Mean   :48.0   Mean   :2.074                      Mean   :1.653  
##  3rd Qu.:71.5   3rd Qu.:3.000                      3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000                      Max.   :2.000  
##                                                                   
##    Namorado_a      Trabalha           Desempenho       Estresse    
##  Min.   :1.000   Length:95          Min.   :5.820   Min.   :12.00  
##  1st Qu.:1.000   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Median :2.000   Mode  :character   Median :8.700   Median :27.00  
##  Mean   :1.505                      Mean   :8.594   Mean   :27.82  
##  3rd Qu.:2.000                      3rd Qu.:9.050   3rd Qu.:33.00  
##  Max.   :2.000                      Max.   :9.700   Max.   :44.00  
##                                                                    
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Passo 6 - gráfico de barras - 1º variável

tabela_mora_pais=table(Questionario_Estresse$Mora_pais)
prop.table(tabela_mora_pais)*100
## 
##      nao      sim 
## 53.68421 46.31579
percentual = prop.table(tabela_mora_pais)*100
percentual
## 
##      nao      sim 
## 53.68421 46.31579
grafico_1 = barplot(tabela_mora_pais, legend= rownames(tabela_mora_pais), main = "Alunos que moram com os pais", horiz = FALSE, beside = TRUE, ylim = c(0,100),
        col = c("pink1", "tomato3"), args.legend = list(x = "topright"))
rotulo=paste0(format(round(percentual,0), nsmall = 0),"%")

text(grafico_1, 55, rotulo,cex = 1, pos = 3, col = "black")

Passo 7 - Gráfico de barras - 2º variável

tabela_trabalho = table(Questionario_Estresse$Trabalha)
prop.table(tabela_trabalho)*100
## 
##      nao      sim 
## 62.10526 37.89474
percentual = prop.table(tabela_trabalho)*100
percentual
## 
##      nao      sim 
## 62.10526 37.89474
grafico_2 = barplot(tabela_trabalho,legend = rownames(tabela_trabalho),
                    main = "Alunos que trabalham", horiz = FALSE, beside = TRUE,
                    ylim = c(0,100),
                    col = c("skyblue", "pink3"),
                    args.legend = list(x = "topright"))
rotulo = paste0(format(round(percentual,0),nsmall = 0),"%")
rotulo
## [1] "62%" "38%"
text(grafico_2, 60, rotulo,cex = 1, pos = 3, col = "black")

Passo 8 - encontro de tabelas

tabela_trabalha_mora = table(Questionario_Estresse$Trabalha, Questionario_Estresse$Mora_pais)
View(tabela_trabalha_mora)

prop.table(tabela_trabalha_mora)*100
##      
##            nao      sim
##   nao 33.68421 28.42105
##   sim 20.00000 17.89474

Passo 9 - tabela com números absolutos

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
tabela_classe2 = Questionario_Estresse %>% select(Mora_pais,Trabalha) %>% table()

tabela_classe2
##          Trabalha
## Mora_pais nao sim
##       nao  32  19
##       sim  27  17

Passo 10 - tabela com proporção

tabela_classe2_prop = Questionario_Estresse %>% select(Mora_pais, Trabalha) %>% table () %>%
  prop.table(1) %>% round(2)

tabela_classe2_prop
##          Trabalha
## Mora_pais  nao  sim
##       nao 0.63 0.37
##       sim 0.61 0.39
tabela_classe2_prop*100
##          Trabalha
## Mora_pais nao sim
##       nao  63  37
##       sim  61  39

Passo 11 - gráfico geral

tabela_classe2 %>% barplot(beside=T,
                           col=c("purple", "blue"),
                           main= "Gráfico geral",
                           legend= rownames(tabela_classe2),
                           ylim=c(0,80),
                           args.legend = list(x= "topright"))

Interpretação dos dados

Iniciei o trabalho carregando a base de dados do Questionário_estresse. Após a análise e inspeção dos dados, pode-se observar que os dados deveriam ser corrigidos para fazer os gráficos e as tabelas. O primeiro gráfico de barras criado foi a partir da variável “mora_pais”, e a princípio indicou que 46% dos alunos moram com os pais e 54% não moram com os pais. O segundo gráfico de barras foi criado a partir da variável “trabalho” e revelou que 62% dos alunos não trabalham e 38% dos alunos trabalham. Após a coleta dessas dados, fiz uma novo gráfico juntando os dados já recolhidos anteriormente. E também foi realizada tabelas com numeros absolutos e proporção.

Terminada a análise completa, pode-se constatar que morar ou não com os pais não é um fator determinante para os alunos trabalharem ou não.