Passo 1 - Introdução

Comandos utilizados - read_excel

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/User/Desktop/Faculdade/Adm P/8 Periodo/Estatistica/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")

Passo 2 - Verificar os dados existentes

Comandos utilizados - str

Opa! Os dados estão todos númericos e isso pode gerar problemas na hora de analisar os dados então para evitar futuros problemas precisamos adaptar os dados no próximo passo

str(Questionario_Estresse)
tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
 $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
 $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
 $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
 $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
 $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
 $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
 $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
 $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
 $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
 $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

Passo 3 - Transformar os dados

Existem 10 dados e desses 10, 6 são dados quantitativos, desses 6 dados, 5 são dados quantitativos discretos e 1 dado quantitativo contínuo. Os 4 dados restantes são dados qualitativos, sendo todos nominais

Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==2,"Namora", "Solteiro")

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==2, "Trabalha", "Desempregado")


Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==2, "RJ", "Não RJ")


Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==2, "Pais", "Sozinho")

Passo 4 - Realizar as médias, medianas e desvios-padrão

Comandos utilizados - dplyr, summarise e flextable

Neste passo irei fazer as tabelas com as informações pedidas na primeira parte da tarefa. Usei algumas variavéis como exemplo.

library(flextable)
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
Questionario_Estresse %>% select(Estresse, RJ) %>% 
  group_by(RJ) %>% 
  summarise(
    Mínimo=min(Estresse),
    Mediana=median(Estresse),
    Média=round(mean(Estresse),2), 
    Desvio_Padrão=round(sd(Estresse),2), 
    Máximo=max((Estresse))
    ) %>% flextable() %>% theme_tron_legacy()
Questionario_Estresse %>% select(Estresse, Namorado_a) %>% 
  group_by(Namorado_a) %>% 
  summarise(
    Mínimo=min(Estresse),
    Mediana=median(Estresse),
    Média=round(mean(Estresse),2), 
    Desvio_Padrão=round(sd(Estresse),2), 
    Máximo=max((Estresse))
  ) %>% flextable() %>% theme_tron_legacy()
Questionario_Estresse %>% select(Estresse, Trabalha) %>% 
  group_by(Trabalha) %>% 
  summarise(
    Mínimo=min(Estresse),
    Mediana=median(Estresse),
    Média=round(mean(Estresse),2), 
    Desvio_Padrão=round(sd(Estresse),2), 
    Máximo=max((Estresse))
  ) %>% flextable() %>% theme_tron_legacy()
Questionario_Estresse %>% select(Estresse, Mora_pais) %>% 
  group_by(Mora_pais) %>% 
  summarise(
    Mínimo=min(Estresse),
    Mediana=median(Estresse),
    Média=round(mean(Estresse),2), 
    Desvio_Padrão=round(sd(Estresse),2), 
    Máximo=max((Estresse))
  ) %>% flextable() %>% theme_tron_legacy()

Passo 5 - Paramêtros Gráficos e Realização dos Boxplots

Comandos utilizados - par e boxplot

Nesse Passo irei mudar os paramêtros gráficos e farei os gráficos

par(bg="#FFBF00")
par(col.lab="#301934")
par(col.main= "#301934")
par(col.axis= "#301934")


boxplot(Estresse ~ RJ, data=Questionario_Estresse,
        col=c("#301934","#FFC0CB"), main="Gráfico 1 - RJ",
        xlab = "RJ",
        ylab = "Estresse")

boxplot(Estresse ~ Namorado_a, data=Questionario_Estresse,
        col=c("#301934","#FFC0CB"), main="Gráfico 2 - Estado Civil",
        xlab = "RJ",
        ylab = "Estresse")

boxplot(Estresse ~ Trabalha, data=Questionario_Estresse,
        col=c("#301934","#FFC0CB"), main="Gráfico 3 - Trabalho",
        xlab = "RJ",
        ylab = "Estresse")

boxplot(Estresse ~ Mora_pais, data=Questionario_Estresse,
        col=c("#301934","#FFC0CB"), main="Gráfico 4 - Mora Pais",
        xlab = "RJ",
        ylab = "Estresse")

Passo Final - Conclusão

Em primeiro lugar vamos discorrer sobre as tabelas. Em relação as mínimas a menor das mínimas é 12, com todos as variavéis tendo 12 e a maior das mínimas sendo das variavéis: Solteiro com 15. Quanto a mediana a menor é 26 com as variaveís: Não RJ, Namora, Desempregado e a maior mediana é de 27 com os que moram com os pais. A menor média foi da variavél Namora e a maior Média é da variavél Solteiro. Quanto a desvio-padrão, o menor desvio-padrão foi da variavél Sozinho e o maior desvio foi da variavél Desempregado. A Máxima de todas as variavéis foi de 44.

Em segundo lugar temos os boxplots que servem para nos auxiliar na analise dos quartis de cada variavél. Quanto ao Gráfico 1 - RJ é possivél inferir que a maior média e 1º Quartil de fato é de quem mora no RJ, e o maior 3º quartil é de quem não mora no RJ. Quanto ao Gráfico 2 - Estado Civil a maior média é de fato a de Solteiros e os maiores quartis são de quem namora. Quanto ao Gráfico 3 é perceptível que o 3º quartil dos desempregados é o maior de todos os gráficos, a maior média é de quem trabalha e o maior 1º quartil, entre os desempregados e quem trabalha, é de quem trabalha. No Gráfico 4 as médias são quase idênticas, mas a maior média delas ainda é de quem mora sozinho e quem mora com os pai detêm os dois maiores quartis.

Em terceiro lugar é possível concluir também que estes gráficos não possuem nenhum outlier, o que nos mostra que não existe uma observação muito fora da curva dentro desta amostra de variavéis de alunos x estresse. Além disso em uma visão com essas informações em conta surpreendentemente temos maiores valores de estresse de pessoas que Moram no RJ, Solteiro, Trabalha, e de quem mora com os pais.