library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Clara/OneDrive/Documentos/basededados/Questionario_Estresse.xls",
sheet = "Dados")
View(Questionario_Estresse)
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais==1, "sim", "nao")
Questionario_Estresse$Trabalha = ifelse(Questionario_Estresse$Trabalha==1, "sim", "nao")
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Length:95 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 Class :character 1st Qu.:1.000
## Median :48.0 Median :2.000 Mode :character Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.653
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000
##
## Namorado_a Trabalha Desempenho Estresse
## Min. :1.000 Length:95 Min. :5.820 Min. :12.00
## 1st Qu.:1.000 Class :character 1st Qu.:8.500 1st Qu.:22.50
## Median :2.000 Mode :character Median :8.700 Median :27.00
## Mean :1.505 Mean :8.594 Mean :27.82
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :2.000 Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
tabela_mora_pais=table(Questionario_Estresse$Mora_pais)
prop.table(tabela_mora_pais)*100
##
## nao sim
## 53.68421 46.31579
percentual = prop.table(tabela_mora_pais)*100
percentual
##
## nao sim
## 53.68421 46.31579
grafico_1 = barplot(tabela_mora_pais, legend= rownames(tabela_mora_pais), main = "Alunos que moram com os pais", horiz = FALSE, beside = TRUE, ylim = c(0,100),
col = c("pink1", "tomato3"), args.legend = list(x = "topright"))
rotulo=paste0(format(round(percentual,0), nsmall = 0),"%")
text(grafico_1, 55, rotulo,cex = 1, pos = 3, col = "black")
tabela_trabalho = table(Questionario_Estresse$Trabalha)
prop.table(tabela_trabalho)*100
##
## nao sim
## 62.10526 37.89474
percentual = prop.table(tabela_trabalho)*100
percentual
##
## nao sim
## 62.10526 37.89474
grafico_2 = barplot(tabela_trabalho,legend = rownames(tabela_trabalho),
main = "Alunos que trabalham", horiz = FALSE, beside = TRUE,
ylim = c(0,100),
col = c("skyblue", "pink3"),
args.legend = list(x = "topright"))
rotulo = paste0(format(round(percentual,0),nsmall = 0),"%")
rotulo
## [1] "62%" "38%"
text(grafico_2, 60, rotulo,cex = 1, pos = 3, col = "black")
tabela_trabalha_mora = table(Questionario_Estresse$Trabalha, Questionario_Estresse$Mora_pais)
View(tabela_trabalha_mora)
prop.table(tabela_trabalha_mora)*100
##
## nao sim
## nao 33.68421 28.42105
## sim 20.00000 17.89474
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tabela_classe2 = Questionario_Estresse %>% select(Mora_pais,Trabalha) %>% table()
tabela_classe2
## Trabalha
## Mora_pais nao sim
## nao 32 19
## sim 27 17
tabela_classe2_prop = Questionario_Estresse %>% select(Mora_pais, Trabalha) %>% table () %>%
prop.table(1) %>% round(2)
tabela_classe2_prop
## Trabalha
## Mora_pais nao sim
## nao 0.63 0.37
## sim 0.61 0.39
tabela_classe2_prop*100
## Trabalha
## Mora_pais nao sim
## nao 63 37
## sim 61 39
tabela_classe2 %>% barplot(beside=T,
col=c("purple", "blue"),
main= "Gráfico geral",
legend= rownames(tabela_classe2),
ylim=c(0,80),
args.legend = list(x= "topright"))
Iniciei o trabalho carregando a base de dados do Questionário_estresse. Após a análise e inspeção dos dados, pode-se observar que os dados deveriam ser corrigidos para fazer os gráficos e as tabelas. O primeiro gráfico de barras criado foi a partir da variável “mora_pais”, e a princípio indicou que 46% dos alunos moram com os pais e 54% não moram com os pais. O segundo gráfico de barras foi criado a partir da variável “trabalho” e revelou que 62% dos alunos não trabalham e 38% dos alunos trabalham. Após a coleta dessas dados, fiz uma novo gráfico juntando os dados já recolhidos anteriormente. E também foi realizada tabelas com numeros absolutos e proporção.
Terminada a análise completa, pode-se constatar que morar ou não com os pais não é um fator determinante para os alunos trabalharem ou não.