Importando base de dados

#Importar base de dados
library(readxl)
Questionario_Estresse <- read_excel("~/Engenharia Civil- UGB/Base_de_dados-master/Questionario_Estresse.xls")
#Olhando a estrutura de dados
head(Questionario_Estresse)
## # A tibble: 6 x 10
##   Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
##   <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
## 1     1     1         2     2          2        2       8.89       23       27
## 2     2     1         1     1          2        2       8.8        24       28
## 3     3     1         2     2          2        2       8          25       25
## 4     4     1         2     2          1        1       8.8        38       21
## 5     5     1         2     2          2        1       8.9        41       18
## 6     6     1         2     2          1        1       8.1        25       29
## # ... with 1 more variable: Horas_estudo <dbl>
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

#corrigindo as variaveis

#corrigindo as variaveis
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"SIM","NÃO")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"SIM","NÃO")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"SIM","NÃO")
Questionario_Estresse$Mora_pais<- ifelse(Questionario_Estresse$Mora_pais==1,"SIM","NÃO")
Questionario_Estresse$Turma <- as.factor(Questionario_Estresse$Turma)

summary(Questionario_Estresse)
##      Aluno      Turma   Mora_pais              RJ             Namorado_a       
##  Min.   : 1.0   1:28   Length:95          Length:95          Length:95         
##  1st Qu.:24.5   2:32   Class :character   Class :character   Class :character  
##  Median :48.0   3:35   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :48.0                                                                  
##  3rd Qu.:71.5                                                                  
##  Max.   :95.0                                                                  
##                                                                                
##    Trabalha           Desempenho       Estresse        Créditos    
##  Length:95          Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  Class :character   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Mode  :character   Median :8.700   Median :27.00   Median :24.00  
##                     Mean   :8.594   Mean   :27.82   Mean   :24.95  
##                     3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##                     Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                     NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Qualitativa vs qualitativa

# Qualitativa vs qualitativa

# Hipóteses
# Quem não é do Rio, trabalha
# Quem mora com os pais não trabalha
# Quem trabalha não namora
# A turma 1 não trabalha tanto quanto as outras turmas
# Quem namora, se estressa mais

Trabalhar a variável estresse

# Trabalhar a variável estresse
summary(Questionario_Estresse$Estresse)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   12.00   22.50   27.00   27.82   33.00   44.00
quantile(Questionario_Estresse$Estresse, probs = c(0,0.33, 0.66,1))
##   0%  33%  66% 100% 
##   12   25   31   44
# de 12 até 25 - faixa 1  aluno tranquilo 
# de 26 até 31 - faixa 2  aluno mediano
# de 32 até 44 - faixa 3  aluno estressado


Questionario_Estresse$Faixas_Estresse <- ifelse(Questionario_Estresse$Estresse<=25,"Tranquilo",
                             ifelse(Questionario_Estresse$Estresse<=31,"Mediano",
                                    "Muito Estresse"))

summary(Questionario_Estresse$Faixas_Estresse)           
##    Length     Class      Mode 
##        95 character character
table(Questionario_Estresse$Faixas_Estresse)
## 
##        Mediano Muito Estresse      Tranquilo 
##             28             30             37
table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Faixas_Estresse)
##      
##       Mediano Muito Estresse Tranquilo
##   NÃO      15             13        20
##   SIM      13             17        17

Reordenar as categorias

# Reordenar as categorias

Questionario_Estresse$Faixas_Estresse<- factor(Questionario_Estresse$Faixas_Estresse,levels = c("Tranquilo","Mediano","Muito Estresse"))
table(Questionario_Estresse$Faixas_Estresse)
## 
##      Tranquilo        Mediano Muito Estresse 
##             37             28             30
prop.table(table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Faixas_Estresse),1)
##      
##       Tranquilo   Mediano Muito Estresse
##   NÃO 0.4166667 0.3125000      0.2708333
##   SIM 0.3617021 0.2765957      0.3617021
round(prop.table(table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Faixas_Estresse),1),2)           
##      
##       Tranquilo Mediano Muito Estresse
##   NÃO      0.42    0.31           0.27
##   SIM      0.36    0.28           0.36
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)

Criação da tabela

# Criação da tabela
Tabela_final <- Questionario_Estresse %>% select(Namorado_a,Faixas_Estresse) %>% 
  table() %>% 
  prop.table(1) %>% 
  round(4)*100
  
Tabela_final
##           Faixas_Estresse
## Namorado_a Tranquilo Mediano Muito Estresse
##        NÃO     41.67   31.25          27.08
##        SIM     36.17   27.66          36.17

mudança de rótulo

# mudança de rótulo
Tabela_final2<-data.frame(Tabela_final) 
colnames(Tabela_final2)<-c("Namora", "Faixa de Estresse", "Percentual")

Dividindo a tabela

# Dividir a tabela
Tabela_final2 %>% filter(`Faixa de Estresse`=="Tranquilo") %>% flextable() %>% bg(j= ~ Percentual, bg= "green")
Tabela_final2 %>% filter(`Faixa de Estresse`=="Muito Estresse") %>% flextable() %>% bg(j= ~ Percentual, bg= "red")
barplot(Tabela_final, main = "Estresse",
        col = c("red","blue"),beside=TRUE,
        legend.text=TRUE,ylim= c(0,90))

rotulo <- paste0(Tabela_final,"%>%")

GRÁFICO DE BARRAS

# GRÁFICO DE BARRAS
bp<- barplot(Tabela_final, main = "Estresse",
             col=c("red","blue"),
             beside=TRUE,
             legend.text=TRUE,ylim = c(0,90))
text(bp, 0, rotulo,cex=1,pos=3,col = "white")

Gráfico de Mosaico

tabela_p_mosaico<-table(Questionario_Estresse$Faixas_Estresse,Questionario_Estresse$Namorado_a)
mosaicplot(tabela_p_mosaico,las = 1,main = "Gráfico mosaico",
           color=c("#f5f269","red"))

Na aula de hoje, dia 07 de junho, foi importado a base de dados Questionário Estresse e a partir dela criamos hipóteses de variáveis qualitativas, reordenamos as categorias presentes e fizemos gráficos.Os gráficos desnvolvidos foram o de barra e o de mosaico, além da instalação de novos pacotes e criação de legendas para o gráfico de barras