library(readxl)
Questionario_Estresse <- read_excel("C:/Users/cardi/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")
Inspeção essa feita com o objetivo de verificar se todos os dados desse banco de dados estão correspondendo a sua natureza (qualitativo ou quantitativo)
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
Após a inspeção foi detectado que alguns dados precisam ser calibrados
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"mora","não mora")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"sim","não")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"namora","solteiro")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"trabalha","desempregado")
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Length:95 Length:95
## 1st Qu.:24.5 1st Qu.:1.000 Class :character Class :character
## Median :48.0 Median :2.000 Mode :character Mode :character
## Mean :48.0 Mean :2.074
## 3rd Qu.:71.5 3rd Qu.:3.000
## Max. :95.0 Max. :3.000
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
primeira variável: Namorado_a
tabela_namora <- table(Questionario_Estresse$Namorado_a)
tabela_namora
##
## namora solteiro
## 47 48
porcentagem <- prop.table(tabela_namora)*100
porcentagem
##
## namora solteiro
## 49.47368 50.52632
segunda variável: Mora_pais
tabela_moracompais <- table(Questionario_Estresse$Mora_pais)
tabela_moracompais
##
## mora não mora
## 44 51
porcentagem_2 <- prop.table(tabela_moracompais)*100
porcentagem_2
##
## mora não mora
## 46.31579 53.68421
barplot(tabela_namora,main = "Gráfico 1- alunos que namoram",col = c("red","green"),ylim = c(0,80))
legend("topright",fill = c("red","green"),legend = c("49.47%","50.52%"))
barplot(tabela_moracompais,main = "Gráfico 2- alunos que moram com os pais",col = c("black","yellow"),ylim = c(0,80))
legend("topright",fill = c("black","yellow"),legend = c("46.31%","53.68%"))
tabelanamora_etrabalha <- table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Mora_pais)
prop.table(tabelanamora_etrabalha)*100
##
## mora não mora
## namora 20.00000 29.47368
## solteiro 26.31579 24.21053
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tabela_geral <- Questionario_Estresse %>% select(Namorado_a,Mora_pais) %>% table()
tabela_geral
## Mora_pais
## Namorado_a mora não mora
## namora 19 28
## solteiro 25 23
tabelanamora_etrabalha <- table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Mora_pais)
tabela_geral_prop <- Questionario_Estresse %>% select(Namorado_a,Mora_pais) %>% table() %>% prop.table(1)%>% round(2)
tabela_geral_prop
## Mora_pais
## Namorado_a mora não mora
## namora 0.40 0.60
## solteiro 0.52 0.48
tabela_geral_prop*100
## Mora_pais
## Namorado_a mora não mora
## namora 40 60
## solteiro 52 48
barplot(tabelanamora_etrabalha,main = "Relação das variáveis analisadas",col = c("red","green"),horiz = FALSE,beside = TRUE,ylim = c(0,50))
legend("topright",fill = c("red","green"),legend = c("namora","solteiro"))
#Considerações finais sobre toda a análise
As duas variáveis analisadas aqui são “Namorado_a” e “Mora_pais”, ou seja, uma diz respeito sobre se determinado aluno namora ou não e outra demonstra se tal aluno mora ou não com os pais.Em um primeiro momento, parecia plausível afirmar que a maiorira dos alunos que namoram já não moram mais com os pais, assim com a análise realizada por meio das ferramentas do Rstudio, ficou possível constatar quase que uma igualdade do número de alunos solteiros e que namoram, porém quando a variável mora_pais entra em ação fica evidente que ela exerce um imporante papel na análise. Já que quando há a relação entre essas duas variáveis, fica constatado que há um maior número de alunos que namoram e já não moram mais com os pais, do que alunos que namoram mas ainda moram com os pais.
Foram analisados dados de 95 alunos, onde 47 namoram (corresponde a 49%) e 48 são solteiros (corresponde a 50%), assim percebe-se quase que uma igualdade realmente. Agora, dos 95 alunos, 44 moram com os pais (sendo 46%) e não moram com os pais 51 (sendo 54%). Portanto, estatisticamente falando, pode-se concluir que que alunos que namoram e não moram com os pais são a maioria,sendo formado por 28 alunos, representando 29%. Já os alunos que são solteiros e moram com os pais vem em seguida com 25 alunos, sendo 26%,23 são solteiros e não moram com os pais, representando 24% e 19 namoram e moram com pais, configurando 20%.