Desenvolvimento da Aula
library(readxl)
QE <- read_excel("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Questionario_Estresse.xls")
Usamos a função Summary para trazer um detalhados dos dados presente na nossa base. Através dela identificamos as variáveis que são qualitativas e transformamos em quantitativas.
summary(QE)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
#Transformando Quali em Quanti
QE$Mora_pais <-ifelse(QE$Mora_pais==1,"Sim","Não") #ifeslse = função SE no excel
QE$RJ <-ifelse(QE$RJ==1,"Sim","Não")
QE$Namorado_a <-ifelse(QE$Namorado_a==1,"Sim","Não")
QE$Trabalha <-ifelse(QE$Trabalha==1,"Sim","Não")
QE$Turma <- as.factor(QE$Turma)
Depois de ajustarmos as conversões, começamos a contruir as tabelas. Para esse passo antes instalamos o pacote Dplyr.
Feito essa instalação, nós usamos uma nova forma de chamar tabela e aprendemos a função piper (%>%).
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.5
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Tese 01, quem não é natural do Rio de Janeiro, precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()
round(prop.table(tabela1,1)*100,1)
## Trabalha
## RJ Não Sim
## Não 64.5 35.5
## Sim 57.6 42.4
#Tabela de proporção, o vírgula 1 indica que dará 100% na linha.
#Round = Arredondar
round(prop.table(tabela1,2)*100,1)
## Trabalha
## RJ Não Sim
## Não 67.8 61.1
## Sim 32.2 38.9
#Tabela de proporção, o vírgula 2 indica que dará 100% na coluna.
#Round = Arredondar
# Tese 02, quem mora com os pais não precisa trabalahr
tabela2 <- QE %>% select(Mora_pais, Trabalha) %>% table()
tabela2
## Trabalha
## Mora_pais Não Sim
## Não 32 19
## Sim 27 17
prop.table(tabela2,1)
## Trabalha
## Mora_pais Não Sim
## Não 0.6274510 0.3725490
## Sim 0.6136364 0.3863636
round(prop.table(tabela2,1)*100,1)
## Trabalha
## Mora_pais Não Sim
## Não 62.7 37.3
## Sim 61.4 38.6
prop.table(tabela2,2)
## Trabalha
## Mora_pais Não Sim
## Não 0.5423729 0.5277778
## Sim 0.4576271 0.4722222
round(prop.table(tabela2,2)*100,1)
## Trabalha
## Mora_pais Não Sim
## Não 54.2 52.8
## Sim 45.8 47.2
Após a contrução das tabelas cehgou a hra se montar os nossos gráficos:
# Tese 01, quem não é natural do Rio de Janeiro, precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()
round(prop.table(tabela1,1)*100,1)
## Trabalha
## RJ Não Sim
## Não 64.5 35.5
## Sim 57.6 42.4
#Tabela de proporção, o vírgula 1 indica que dará 100% na linha.
#Round = Arredondar
round(prop.table(tabela1,2)*100,1)
## Trabalha
## RJ Não Sim
## Não 67.8 61.1
## Sim 32.2 38.9
#Tabela de proporção, o vírgula 2 indica que dará 100% na coluna.
#Round = Arredondar
barplot(tabela1,beside= TRUE,
col=c("purple", "navy"),
main= "Análise Bivariada",
horiz = TRUE,
legend = TRUE)
# Tese 02, quem mora com os pais não precisa trabalahr
tabela2 <- QE %>% select(Mora_pais, Trabalha) %>% table()
tabela2
## Trabalha
## Mora_pais Não Sim
## Não 32 19
## Sim 27 17
prop.table(tabela2,1)
## Trabalha
## Mora_pais Não Sim
## Não 0.6274510 0.3725490
## Sim 0.6136364 0.3863636
round(prop.table(tabela2,1)*100,1)
## Trabalha
## Mora_pais Não Sim
## Não 62.7 37.3
## Sim 61.4 38.6
prop.table(tabela2,2)
## Trabalha
## Mora_pais Não Sim
## Não 0.5423729 0.5277778
## Sim 0.4576271 0.4722222
round(prop.table(tabela2,2)*100,1)
## Trabalha
## Mora_pais Não Sim
## Não 54.2 52.8
## Sim 45.8 47.2
barplot(tabela2,beside= TRUE,
col=c("purple", "navy"),
main= "Análise Bivariada - tabela 2",
legend = TRUE)
QE %>% group_by(Trabalha) %>%
summarise(media=mean(Desempenho),
desvio_padrao=sd(Desempenho),
tamanho=n())
## # A tibble: 2 x 4
## Trabalha media desvio_padrao tamanho
## <chr> <dbl> <dbl> <int>
## 1 Não 8.63 0.698 59
## 2 Sim 8.54 0.896 36
QE %>% group_by(Trabalha) %>%
summarise(media=mean(Horas_estudo),
mediana=median(Horas_estudo),
desvio_padrao=sd(Horas_estudo),
tamanho=n())
## # A tibble: 2 x 5
## Trabalha media mediana desvio_padrao tamanho
## <chr> <dbl> <dbl> <dbl> <int>
## 1 Não 31.6 30 6.93 59
## 2 Sim 29.4 30 7.72 36
Devemos permitri que o aluno trabalhe.
FIM