Cruzamento de Variável Qualitativa e Variável Quantitativa

Carregar a base de dados

library(readxl)
Quest_Estresse <- read_excel("C:/Users/a/Downloads/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")
View(Quest_Estresse)

Resumo

summary(Quest_Estresse$Horas_estudo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   19.00   25.00   30.00   30.73   35.00   60.00
summary(Quest_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Limpeza das variáveis

Quest_Estresse$Mora_pais <- ifelse(Quest_Estresse$Mora_pais== 1,"Sim", "Não")
Quest_Estresse$Trabalha = ifelse(Quest_Estresse$Trabalha == 1,"Sim", "Não")
Quest_Estresse$Namorado_a = ifelse(Quest_Estresse$Namorado_a == 1,"Sim", "Não")
Quest_Estresse$RJ = ifelse(Quest_Estresse$RJ == 1,"Natural do RJ", "Não Natural do RJ")

BOXPLOT: Quantitativa x Qualitativa

Quantitativa = Números de Créditos / Qualitativa = Natural do Rio

boxplot(Quest_Estresse$Créditos ~ Quest_Estresse$RJ,
        main="Gráfico 1 - boxplot do Natural RJ por Trabalha",
        col=c("lightyellow","blue"),
        ylab="Créditos",
        xlab= "Natural e Não Natural do RJ")

Neste Boxplot temos as variáveis Números de Créditos por Naturais e Não Naturas do RJ, com as informações:

  • A mediana nos Naturais do RJ maior e Não Naturais do RJ não próxima, quase nos mesmo pontos;

  • Temos um outlier, sinalizando que uma pessoa que está com maior Números de Créditos;

  • Temos um outlier, sinalizando que uma pessoa está menor Números de Créditos;

  • O Boxplot dos Não Naturais do RJ é Simétrico quanto Os Natirais são assimetrico;

  • Vemos que o mínimo dos Naturais do RJ está assima de 15 créditos quanto os Não Naturais tem abaixo de 15 créditos.

Estatística para relacionamento de variáveis qualitativas e quantitativas

Variável de interesse = Horas de Estudo Preditor linear: Namorando e Mora com os pais

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)


Quest_Estresse %>% select(Horas_estudo, Namorado_a, Mora_pais) %>%
  group_by(Namorado_a, Mora_pais) %>%
  summarise(Média=round(mean(Horas_estudo),1),
            Mediana=median(Horas_estudo),
            `Desvio Padrão` = round(sd(Horas_estudo),1),
            Tamanho=n()) %>% 
  flextable() %>%
  add_header_lines("Tabela 1 - Estatísticas do Horas de Estudos por Namorando e Mora com os pais") %>%
  theme_tron_legacy()
## `summarise()` has grouped output by 'Namorado_a'. You can override using the
## `.groups` argument.