library(readxl)
Questionario_Estresse <- read_excel("C:/Users/User/Desktop/Faculdade/Adm P/8 Periodo/Estatistica/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")
Opa! Os dados estão todos númericos e isso pode gerar problemas na hora de analisar os dados então para evitar futuros problemas precisamos adaptar os dados no próximo passo
str(Questionario_Estresse)
tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
$ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
$ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
$ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
$ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
$ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
$ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
$ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
$ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
$ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
$ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
Existem 10 dados e desses 10, 6 são dados quantitativos, desses 6 dados, 5 são dados quantitativos discretos e 1 dado quantitativo contínuo. Os 4 dados restantes são dados qualitativos, sendo todos nominais
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==2,"Namora", "Solteiro")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==2, "Trabalha", "Desempregado")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==2, "RJ", "Não RJ")
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==2, "Pais", "Sozinho")
Neste passo irei fazer as tabelas com as informações pedidas na primeira parte da tarefa. Usei algumas variavéis como exemplo.
library(flextable)
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
Questionario_Estresse %>% select(Estresse, RJ) %>%
group_by(RJ) %>%
summarise(
Mínimo=min(Estresse),
Mediana=median(Estresse),
Média=round(mean(Estresse),2),
Desvio_Padrão=round(sd(Estresse),2),
Máximo=max((Estresse))
) %>% flextable() %>% theme_tron_legacy()
RJ | Mínimo | Mediana | Média | Desvio_Padrão | Máximo |
Não RJ | 12 | 26 | 27.45 | 7.29 | 44 |
RJ | 13 | 29 | 28.02 | 7.72 | 44 |
Questionario_Estresse %>% select(Estresse, Namorado_a) %>%
group_by(Namorado_a) %>%
summarise(
Mínimo=min(Estresse),
Mediana=median(Estresse),
Média=round(mean(Estresse),2),
Desvio_Padrão=round(sd(Estresse),2),
Máximo=max((Estresse))
) %>% flextable() %>% theme_tron_legacy()
Namorado_a | Mínimo | Mediana | Média | Desvio_Padrão | Máximo |
Namora | 12 | 26 | 27.25 | 7.79 | 44 |
Solteiro | 15 | 29 | 28.40 | 7.31 | 44 |
Questionario_Estresse %>% select(Estresse, Trabalha) %>%
group_by(Trabalha) %>%
summarise(
Mínimo=min(Estresse),
Mediana=median(Estresse),
Média=round(mean(Estresse),2),
Desvio_Padrão=round(sd(Estresse),2),
Máximo=max((Estresse))
) %>% flextable() %>% theme_tron_legacy()
Trabalha | Mínimo | Mediana | Média | Desvio_Padrão | Máximo |
Desempregado | 13 | 26 | 27.64 | 7.90 | 44 |
Trabalha | 12 | 29 | 27.93 | 7.38 | 44 |
Questionario_Estresse %>% select(Estresse, Mora_pais) %>%
group_by(Mora_pais) %>%
summarise(
Mínimo=min(Estresse),
Mediana=median(Estresse),
Média=round(mean(Estresse),2),
Desvio_Padrão=round(sd(Estresse),2),
Máximo=max((Estresse))
) %>% flextable() %>% theme_tron_legacy()
Mora_pais | Mínimo | Mediana | Média | Desvio_Padrão | Máximo |
Pais | 13 | 27.0 | 27.57 | 7.92 | 44 |
Sozinho | 12 | 27.5 | 28.11 | 7.16 | 44 |
Nesse Passo irei mudar os paramêtros gráficos e farei os gráficos
par(bg="#FFBF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")
boxplot(Estresse ~ RJ, data=Questionario_Estresse,
col=c("#301934","#FFC0CB"), main="Gráfico 1 - RJ",
xlab = "RJ",
ylab = "Estresse")
boxplot(Estresse ~ Namorado_a, data=Questionario_Estresse,
col=c("#301934","#FFC0CB"), main="Gráfico 2 - Estado Civil",
xlab = "RJ",
ylab = "Estresse")
boxplot(Estresse ~ Trabalha, data=Questionario_Estresse,
col=c("#301934","#FFC0CB"), main="Gráfico 3 - Trabalho",
xlab = "RJ",
ylab = "Estresse")
boxplot(Estresse ~ Mora_pais, data=Questionario_Estresse,
col=c("#301934","#FFC0CB"), main="Gráfico 4 - Mora Pais",
xlab = "RJ",
ylab = "Estresse")
Em primeiro lugar vamos discorrer sobre as tabelas. Em relação as mínimas a menor das mínimas é 12, com todos as variavéis tendo 12 e a maior das mínimas sendo das variavéis: Solteiro com 15. Quanto a mediana a menor é 26 com as variaveís: Não RJ, Namora, Desempregado e a maior mediana é de 27 com os que moram com os pais. A menor média foi da variavél Namora e a maior Média é da variavél Solteiro. Quanto a desvio-padrão, o menor desvio-padrão foi da variavél Sozinho e o maior desvio foi da variavél Desempregado. A Máxima de todas as variavéis foi de 44.
Em segundo lugar temos os boxplots que servem para nos auxiliar na analise dos quartis de cada variavél. Quanto ao Gráfico 1 - RJ é possivél inferir que a maior média e 1º Quartil de fato é de quem mora no RJ, e o maior 3º quartil é de quem não mora no RJ. Quanto ao Gráfico 2 - Estado Civil a maior média é de fato a de Solteiros e os maiores quartis são de quem namora. Quanto ao Gráfico 3 é perceptível que o 3º quartil dos desempregados é o maior de todos os gráficos, a maior média é de quem trabalha e o maior 1º quartil, entre os desempregados e quem trabalha, é de quem trabalha. No Gráfico 4 as médias são quase idênticas, mas a maior média delas ainda é de quem mora sozinho e quem mora com os pai detêm os dois maiores quartis.
Em terceiro lugar é possível concluir também que estes gráficos não possuem nenhum outlier, o que nos mostra que não existe uma observação muito fora da curva dentro desta amostra de variavéis de alunos x estresse. Além disso em uma visão com essas informações em conta surpreendentemente temos maiores valores de estresse de pessoas que Moram no RJ, Solteiro, Trabalha, e de quem mora com os pais.