Introdução

Será apresentada uma análise de duas variáveis categóricas com gráfico de barras por grupo, tabela e tabela de proporções.

As variáveis utilizadas serão: “Namorado_a” e “Mora_pais”

Segundo os dados da pesquisa sobre grau de estresse aplicada em duas turmas do curso de psicologia é válida a tese: “Os estudantes que namoram, geralmente não moram com os pais”.

Carregamento da base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/sandr/Desktop/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")

Inspeção dos dados

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

Trasnformação dos dados

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"Mora com os pais","Não mora com os pais")

Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Natural do RJ","Natural de outras cidades")

Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"Namora","Não namora")

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"Trabalha","Não trabalha")

Análise dos dados

summary(Questionario_Estresse)
##      Aluno          Turma        Mora_pais              RJ           
##  Min.   : 1.0   Min.   :1.000   Length:95          Length:95         
##  1st Qu.:24.5   1st Qu.:1.000   Class :character   Class :character  
##  Median :48.0   Median :2.000   Mode  :character   Mode  :character  
##  Mean   :48.0   Mean   :2.074                                        
##  3rd Qu.:71.5   3rd Qu.:3.000                                        
##  Max.   :95.0   Max.   :3.000                                        
##                                                                      
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Tabelas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# tabela em números absolutos
tabela_namora <- Questionario_Estresse %>% select(Namorado_a,Mora_pais) %>% table() 
tabela_namora
##             Mora_pais
## Namorado_a   Mora com os pais Não mora com os pais
##   Namora                   19                   28
##   Não namora               25                   23
# tabela em proporção
tabela_namora_prop <- Questionario_Estresse %>% select(Namorado_a,Mora_pais) %>% table() %>%
  prop.table(1)*100 %>% round(2)
tabela_namora_prop
##             Mora_pais
## Namorado_a   Mora com os pais Não mora com os pais
##   Namora             40.42553             59.57447
##   Não namora         52.08333             47.91667

Gráfico em barras por grupo

COR <- c("#c4c36c","#6caac4" ,"#c4c36c","#6caac4")
gráfico <- barplot(tabela_namora, beside=T,
                          col=COR,
                          main= "Relação entre os alunos que namoram e moram com os pais",
                          legend = rownames(tabela_namora), ylim= c(0,50))
contagem <- (tabela_namora)
rotulo <- paste0(contagem)
text(gráfico, 0, rotulo,cex=1,pos=3, col="white")

Conclusão

Pode-se observar que dos 95 estudantes entrevistados, 28 namoram e não moram com os pais em oposição aos 19 que namoram e vivem com os pais. Já em relação aos estudantes que não namoram, 25 vivem com os pais enquanto os outros 23 não moram com os pais.

Ainda é possível evidenciar que aproximadamente 59,57% dos estudantes que namoram, não moram com os pais. O que nos leva ao questionamento de que morar com os pais possa influenciar na decisão de namorar. Sendo assim, a tese é válida, já que os dados revelam que entre os estudantes que namoram, a maioria não mora com os pais.