Carregar a base de dados
library(readxl)
Quest_Estresse <- read_excel("C:/Users/a/Downloads/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")
View(Quest_Estresse)
Resumo
summary(Quest_Estresse$Horas_estudo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 19.00 25.00 30.00 30.73 35.00 60.00
summary(Quest_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
Limpeza das variáveis
Quest_Estresse$Mora_pais <- ifelse(Quest_Estresse$Mora_pais== 1,"Sim", "Não")
Quest_Estresse$Trabalha = ifelse(Quest_Estresse$Trabalha == 1,"Sim", "Não")
Quest_Estresse$Namorado_a = ifelse(Quest_Estresse$Namorado_a == 1,"Sim", "Não")
Quest_Estresse$RJ = ifelse(Quest_Estresse$RJ == 1,"Natural do RJ", "Não Natural do RJ")
Quantitativa = Números de Créditos / Qualitativa = Natural do Rio
boxplot(Quest_Estresse$Créditos ~ Quest_Estresse$RJ,
main="Gráfico 1 - boxplot do Natural RJ por Trabalha",
col=c("lightyellow","blue"),
ylab="Créditos",
xlab= "Natural e Não Natural do RJ")
Neste Boxplot temos as variáveis Números de Créditos por Naturais e Não Naturas do RJ, com as informações:
A mediana nos Naturais do RJ maior e Não Naturais do RJ não próxima, quase nos mesmo pontos;
Temos um outlier, sinalizando que uma pessoa que está com maior Números de Créditos;
Temos um outlier, sinalizando que uma pessoa está menor Números de Créditos;
O Boxplot dos Não Naturais do RJ é Simétrico quanto Os Natirais são assimetrico;
Vemos que o mínimo dos Naturais do RJ está assima de 15 créditos quanto os Não Naturais tem abaixo de 15 créditos.
Variável de interesse = Horas de Estudo Preditor linear: Namorando e Mora com os pais
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
Quest_Estresse %>% select(Horas_estudo, Namorado_a, Mora_pais) %>%
group_by(Namorado_a, Mora_pais) %>%
summarise(Média=round(mean(Horas_estudo),1),
Mediana=median(Horas_estudo),
`Desvio Padrão` = round(sd(Horas_estudo),1),
Tamanho=n()) %>%
flextable() %>%
add_header_lines("Tabela 1 - Estatísticas do Horas de Estudos por Namorando e Mora com os pais") %>%
theme_tron_legacy()
## `summarise()` has grouped output by 'Namorado_a'. You can override using the
## `.groups` argument.
Tabela 1 - Estatísticas do Horas de Estudos por Namorando e Mora com os pais | |||||
Namorado_a | Mora_pais | Média | Mediana | Desvio Padrão | Tamanho |
Não | Não | 28.9 | 29 | 6.0 | 23 |
Não | Sim | 30.4 | 29 | 8.3 | 25 |
Sim | Não | 30.9 | 30 | 5.6 | 28 |
Sim | Sim | 33.1 | 32 | 9.1 | 19 |