Passo 1- Importação dos dados do Excel

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/cardi/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")

Passo 2- Inspecionar os dados

Inspeção essa feita com o objetivo de verificar se todos os dados desse banco de dados estão correspondendo a sua natureza (qualitativo ou quantitativo)

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Passo 3- Correção dos dados

Após a inspeção foi detectado que alguns dados precisam ser calibrados

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"mora","não mora")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"sim","não")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"namora","solteiro")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"trabalha","desempregado")

Passo 4- Checar os dados novamente

summary(Questionario_Estresse)
##      Aluno          Turma        Mora_pais              RJ           
##  Min.   : 1.0   Min.   :1.000   Length:95          Length:95         
##  1st Qu.:24.5   1st Qu.:1.000   Class :character   Class :character  
##  Median :48.0   Median :2.000   Mode  :character   Mode  :character  
##  Mean   :48.0   Mean   :2.074                                        
##  3rd Qu.:71.5   3rd Qu.:3.000                                        
##  Max.   :95.0   Max.   :3.000                                        
##                                                                      
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Passo 5- Elaboração das tabelas das variáveis qualitativas escolhidas para análise

Análise das variáveis qualitativas feita de forma individual

primeira variável: Namorado_a

tabela_namora <- table(Questionario_Estresse$Namorado_a)
tabela_namora
## 
##   namora solteiro 
##       47       48
porcentagem <- prop.table(tabela_namora)*100
porcentagem
## 
##   namora solteiro 
## 49.47368 50.52632

segunda variável: Mora_pais

tabela_moracompais <- table(Questionario_Estresse$Mora_pais)
tabela_moracompais
## 
##     mora não mora 
##       44       51
porcentagem_2 <- prop.table(tabela_moracompais)*100
porcentagem_2
## 
##     mora não mora 
## 46.31579 53.68421

Passo 6-Gráfico de barras de cada variável

barplot(tabela_namora,main = "Gráfico 1- alunos que namoram",col = c("red","green"),ylim = c(0,80))
legend("topright",fill = c("red","green"),legend = c("49.47%","50.52%"))

barplot(tabela_moracompais,main = "Gráfico 2- alunos que moram com os pais",col = c("black","yellow"),ylim = c(0,80))
legend("topright",fill = c("black","yellow"),legend = c("46.31%","53.68%"))

Passo 7- Análise das duas variáveis em grupo

tabelanamora_etrabalha <- table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Mora_pais)
prop.table(tabelanamora_etrabalha)*100
##           
##                mora não mora
##   namora   20.00000 29.47368
##   solteiro 26.31579 24.21053
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
tabela_geral <- Questionario_Estresse %>% select(Namorado_a,Mora_pais) %>% table()
tabela_geral
##           Mora_pais
## Namorado_a mora não mora
##   namora     19       28
##   solteiro   25       23
tabelanamora_etrabalha <- table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Mora_pais)
tabela_geral_prop <- Questionario_Estresse %>% select(Namorado_a,Mora_pais) %>% table() %>% prop.table(1)%>% round(2)
tabela_geral_prop
##           Mora_pais
## Namorado_a mora não mora
##   namora   0.40     0.60
##   solteiro 0.52     0.48
tabela_geral_prop*100
##           Mora_pais
## Namorado_a mora não mora
##   namora     40       60
##   solteiro   52       48
barplot(tabelanamora_etrabalha,main = "Relação das variáveis analisadas",col = c("red","green"),horiz = FALSE,beside = TRUE,ylim = c(0,50))
legend("topright",fill = c("red","green"),legend = c("namora","solteiro"))

#Considerações finais sobre toda a análise

As duas variáveis analisadas aqui são “Namorado_a” e “Mora_pais”, ou seja, uma diz respeito sobre se determinado aluno namora ou não e outra demonstra se tal aluno mora ou não com os pais.Em um primeiro momento, parecia plausível afirmar que a maiorira dos alunos que namoram já não moram mais com os pais, assim com a análise realizada por meio das ferramentas do Rstudio, ficou possível constatar quase que uma igualdade do número de alunos solteiros e que namoram, porém quando a variável mora_pais entra em ação fica evidente que ela exerce um imporante papel na análise. Já que quando há a relação entre essas duas variáveis, fica constatado que há um maior número de alunos que namoram e já não moram mais com os pais, do que alunos que namoram mas ainda moram com os pais.

Foram analisados dados de 95 alunos, onde 47 namoram (corresponde a 49%) e 48 são solteiros (corresponde a 50%), assim percebe-se quase que uma igualdade realmente. Agora, dos 95 alunos, 44 moram com os pais (sendo 46%) e não moram com os pais 51 (sendo 54%). Portanto, estatisticamente falando, pode-se concluir que que alunos que namoram e não moram com os pais são a maioria,sendo formado por 28 alunos, representando 29%. Já os alunos que são solteiros e moram com os pais vem em seguida com 25 alunos, sendo 26%,23 são solteiros e não moram com os pais, representando 24% e 19 namoram e moram com pais, configurando 20%.