Atividade 04 - Duas Variáveis Qualitativas

Banco de dados Questionario_Estresse.xls

Carregamento dos Dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Hearthz Gaming/Desktop/Base_de_dados-master/Questionario_Estresse.xls")

Inspeção dos Dados

summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Correção dos Dados

Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,2007.2,ifelse(Questionario_Estresse$Turma==2,2008.1,2008.2))

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"Mora com os pais","Não mora com os pais")

Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"natural do RJ","natural de outras cidades")

Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"sim","nãoo")

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"Trabalha","Não trabalha")

Nova Inspeção dos Dados

summary(Questionario_Estresse)
##      Aluno          Turma       Mora_pais              RJ           
##  Min.   : 1.0   Min.   :2007   Length:95          Length:95         
##  1st Qu.:24.5   1st Qu.:2007   Class :character   Class :character  
##  Median :48.0   Median :2008   Mode  :character   Mode  :character  
##  Mean   :48.0   Mean   :2008                                        
##  3rd Qu.:71.5   3rd Qu.:2008                                        
##  Max.   :95.0   Max.   :2008                                        
##                                                                     
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Tabela com Números Absolutos

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
tabela_paisrj <- Questionario_Estresse %>% select(Mora_pais,RJ) %>% table()

tabela_paisrj
##                       RJ
## Mora_pais              natural de outras cidades natural do RJ
##   Mora com os pais                            14            30
##   Não mora com os pais                        48             3

Tabela de Proporção na Linha

tabela_paiserjprop <- Questionario_Estresse %>% select(Mora_pais,RJ) %>% table() %>%
  prop.table(1) %>% round(2)*100
tabela_paiserjprop
##                       RJ
## Mora_pais              natural de outras cidades natural do RJ
##   Mora com os pais                            32            68
##   Não mora com os pais                        94             6

Gráfico de Barras com Duas Variáveis

grafico <- tabela_paisrj %>% barplot(beside=T,
                           col=c("#6d568c","#cab3e8"),
                           main= "Mora ou não com os pais sendo natural ou não do RJ",
                           legend = rownames(tabela_paisrj),
                           ylim=c(0,80),
                           args.legend = list(x = "topright"))



percentual <- tabela_paiserjprop
percentual
##                       RJ
## Mora_pais              natural de outras cidades natural do RJ
##   Mora com os pais                            32            68
##   Não mora com os pais                        94             6
rotulo <- paste0(percentual,"%")
rotulo
## [1] "32%" "94%" "68%" "6%"
text(grafico,0,rotulo,cex=1,pos=3,col = "black")

Conclusão/Parecer

Nesse trabalho o gráfico acima mostra duas variáveis, se o aluno de psicologia mora com os pais ou não e se o mesmo é natural da cidade do Rio de Janeiro ou se é natural de outras cidades.

Podemos confirmar a partir disso que a maior parte dos alunos que não moram com os pais, cerca de 94%, é natural de outras cidades.

Já na relação oposta vemos que mais da metade dos alunos naturais do Rio de Janeiro, cerca de 68%, moram com os pais. Com isso vemos a grande relação entre as variáveis,já que a maioria natural do Rio de Janeiro mora com os pais e a maioria dos naturais de outras cidades não mora com os pais.