#Importar base de dados
library(readxl)
Questionario_Estresse <- read_excel("~/Engenharia Civil- UGB/Base_de_dados-master/Questionario_Estresse.xls")#Olhando a estrutura de dados
head(Questionario_Estresse)## # A tibble: 6 x 10
## Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23 27
## 2 2 1 1 1 2 2 8.8 24 28
## 3 3 1 2 2 2 2 8 25 25
## 4 4 1 2 2 1 1 8.8 38 21
## 5 5 1 2 2 2 1 8.9 41 18
## 6 6 1 2 2 1 1 8.1 25 29
## # ... with 1 more variable: Horas_estudo <dbl>
str(Questionario_Estresse)## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
#corrigindo as variaveis
#corrigindo as variaveis
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"SIM","NÃO")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"SIM","NÃO")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"SIM","NÃO")
Questionario_Estresse$Mora_pais<- ifelse(Questionario_Estresse$Mora_pais==1,"SIM","NÃO")
Questionario_Estresse$Turma <- as.factor(Questionario_Estresse$Turma)
summary(Questionario_Estresse)## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 1:28 Length:95 Length:95 Length:95
## 1st Qu.:24.5 2:32 Class :character Class :character Class :character
## Median :48.0 3:35 Mode :character Mode :character Mode :character
## Mean :48.0
## 3rd Qu.:71.5
## Max. :95.0
##
## Trabalha Desempenho Estresse Créditos
## Length:95 Min. :5.820 Min. :12.00 Min. :15.00
## Class :character 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Mode :character Median :8.700 Median :27.00 Median :24.00
## Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
# Qualitativa vs qualitativa
# Hipóteses
# Quem não é do Rio, trabalha
# Quem mora com os pais não trabalha
# Quem trabalha não namora
# A turma 1 não trabalha tanto quanto as outras turmas
# Quem namora, se estressa mais# Trabalhar a variável estresse
summary(Questionario_Estresse$Estresse)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 12.00 22.50 27.00 27.82 33.00 44.00
quantile(Questionario_Estresse$Estresse, probs = c(0,0.33, 0.66,1))## 0% 33% 66% 100%
## 12 25 31 44
# de 12 até 25 - faixa 1 aluno tranquilo
# de 26 até 31 - faixa 2 aluno mediano
# de 32 até 44 - faixa 3 aluno estressado
Questionario_Estresse$Faixas_Estresse <- ifelse(Questionario_Estresse$Estresse<=25,"Tranquilo",
ifelse(Questionario_Estresse$Estresse<=31,"Mediano",
"Muito Estresse"))
summary(Questionario_Estresse$Faixas_Estresse) ## Length Class Mode
## 95 character character
table(Questionario_Estresse$Faixas_Estresse)##
## Mediano Muito Estresse Tranquilo
## 28 30 37
table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Faixas_Estresse)##
## Mediano Muito Estresse Tranquilo
## NÃO 15 13 20
## SIM 13 17 17
# Reordenar as categorias
Questionario_Estresse$Faixas_Estresse<- factor(Questionario_Estresse$Faixas_Estresse,levels = c("Tranquilo","Mediano","Muito Estresse"))
table(Questionario_Estresse$Faixas_Estresse)##
## Tranquilo Mediano Muito Estresse
## 37 28 30
prop.table(table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Faixas_Estresse),1)##
## Tranquilo Mediano Muito Estresse
## NÃO 0.4166667 0.3125000 0.2708333
## SIM 0.3617021 0.2765957 0.3617021
round(prop.table(table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Faixas_Estresse),1),2) ##
## Tranquilo Mediano Muito Estresse
## NÃO 0.42 0.31 0.27
## SIM 0.36 0.28 0.36
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)# Criação da tabela
Tabela_final <- Questionario_Estresse %>% select(Namorado_a,Faixas_Estresse) %>%
table() %>%
prop.table(1) %>%
round(4)*100
Tabela_final## Faixas_Estresse
## Namorado_a Tranquilo Mediano Muito Estresse
## NÃO 41.67 31.25 27.08
## SIM 36.17 27.66 36.17
# mudança de rótulo
Tabela_final2<-data.frame(Tabela_final)
colnames(Tabela_final2)<-c("Namora", "Faixa de Estresse", "Percentual")# Dividir a tabela
Tabela_final2 %>% filter(`Faixa de Estresse`=="Tranquilo") %>% flextable() %>% bg(j= ~ Percentual, bg= "green")Namora | Faixa de Estresse | Percentual |
NÃO | Tranquilo | 41.67 |
SIM | Tranquilo | 36.17 |
Tabela_final2 %>% filter(`Faixa de Estresse`=="Muito Estresse") %>% flextable() %>% bg(j= ~ Percentual, bg= "red")Namora | Faixa de Estresse | Percentual |
NÃO | Muito Estresse | 27.08 |
SIM | Muito Estresse | 36.17 |
barplot(Tabela_final, main = "Estresse",
col = c("red","blue"),beside=TRUE,
legend.text=TRUE,ylim= c(0,90))rotulo <- paste0(Tabela_final,"%>%")# GRÁFICO DE BARRAS
bp<- barplot(Tabela_final, main = "Estresse",
col=c("red","blue"),
beside=TRUE,
legend.text=TRUE,ylim = c(0,90))
text(bp, 0, rotulo,cex=1,pos=3,col = "white")tabela_p_mosaico<-table(Questionario_Estresse$Faixas_Estresse,Questionario_Estresse$Namorado_a)
mosaicplot(tabela_p_mosaico,las = 1,main = "Gráfico mosaico",
color=c("#f5f269","red"))Na aula de hoje, dia 07 de junho, foi importado a base de dados Questionário Estresse e a partir dela criamos hipóteses de variáveis qualitativas, reordenamos as categorias presentes e fizemos gráficos.Os gráficos desnvolvidos foram o de barra e o de mosaico, além da instalação de novos pacotes e criação de legendas para o gráfico de barras