Na atividade 4 iremos tratar sobre:
# Importar do Excel
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/isabe/Desktop/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")
View(Questionario_Estresse)
#---------------------------
# Passo 2 - Inspecionar
#---------------------------
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
Parâmetro para a tabela estresse: <== 18 nível de estresse baixo, <== 32 nível de estresse médio, >32 então nível de estresse alto
#------------------------------
# Passo 3 - Transformação dos dados
#------------------------------
Questionario_Estresse$Turma<- ifelse(Questionario_Estresse$Turma==1,"2007_2",
ifelse(Questionario_Estresse$Turma==2,"2008_1","2008_2"))
Questionario_Estresse$Trabalha<- ifelse(Questionario_Estresse$Trabalha==1,"Trabalha","Não Trabalha")
Questionario_Estresse$Estresse<- ifelse(Questionario_Estresse$Estresse <=18,"Nível baixo",
ifelse(Questionario_Estresse$Estresse <=32,"Nível médio", "Nível alto"))
#------------------------------------
# Passo 4 - Olhar os dados novamente
#------------------------------------
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Length:95 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 Class :character 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Mode :character Median :2.000 Median :2.000
## Mean :48.0 Mean :1.537 Mean :1.653
## 3rd Qu.:71.5 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :2.000 Max. :2.000
##
## Namorado_a Trabalha Desempenho Estresse
## Min. :1.000 Length:95 Min. :5.820 Length:95
## 1st Qu.:1.000 Class :character 1st Qu.:8.500 Class :character
## Median :2.000 Mode :character Median :8.700 Mode :character
## Mean :1.505 Mean :8.594
## 3rd Qu.:2.000 3rd Qu.:9.050
## Max. :2.000 Max. :9.700
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : chr [1:95] "2007_2" "2007_2" "2007_2" "2007_2" ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : chr [1:95] "Não Trabalha" "Não Trabalha" "Não Trabalha" "Trabalha" ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : chr [1:95] "Nível médio" "Nível médio" "Nível médio" "Nível alto" ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
View(Questionario_Estresse)
#-----------------------------------
# Passo 5 - Tabela
#----------------------------------
tabela_quem_trabalha <- table(Questionario_Estresse$Trabalha, Questionario_Estresse$Estresse)
tabela_quem_trabalha
##
## Nível alto Nível baixo Nível médio
## Não Trabalha 16 6 37
## Trabalha 10 5 21
#------------------------------
# Passo 6 - Tabela em proporção
#-------------------------------
prop.table(tabela_quem_trabalha,1)*100
##
## Nível alto Nível baixo Nível médio
## Não Trabalha 27.11864 10.16949 62.71186
## Trabalha 27.77778 13.88889 58.33333
prop.table(tabela_quem_trabalha,2)*100
##
## Nível alto Nível baixo Nível médio
## Não Trabalha 61.53846 54.54545 63.79310
## Trabalha 38.46154 45.45455 36.20690
#--------------------------------------
# Passo 6 - Gráfico de barras em grupo
#--------------------------------------
barplot(tabela_quem_trabalha, main=" Gráfico - Relação Estresse e Trabalho", col= c("#f5071f", "#f76116","#f5071f", "#f76116")
,horiz=FALSE,beside=TRUE,legend = rownames(tabela_quem_trabalha), ylim=c(0,50),
args.legend = list(x = "topright"))
Depois de ter organizado os pontos da tabela de estresse em níveis, baixo, médio e alto, facilitou a nossa interpretação de alunos que trabalham e o grau de estresse. A tabela de números absolutos nos mostra que o número de aulunos que não trabalham e são até mais estressados, ao mesmo tempo que esses que não trabalham também marcam mais pontos no nível de estresse baixo e médio. O que quer dizer que o resultado é distribuido, ao mesmo tempo que os estudantes que não trabalham seriam em hipótese mais estressados são também os menos.
A tabela proporção nos mostra a mesma coisa, a relação de alunos que só estudam e são estressados é igual, da mesma forma obtendo um número favorável a níveis baixos de estresse. Podemos afirmar então, que nesse estudo não existe relação do trabalho com o estresse, essa variável não traz números expressivos que apontam alterações relacionadas ao fato de alunos trabalharem ou não. Como as variações são bem sutis, seria interessante utilizar o histograma.