Fazer uma publicação no RPUBS com:

1 - para duas variáveis qualitativas - uma tabela cruzada, uma tabela de proporção e um gráfico de barras; 2 - para uma variável qualitativa e uma variável quantitativa - um boxplot e uma análise descritiva [pelo menos a média e o desvio-padrão]; 3 - atividade opcional - fazer uma análise sobre os outliers dessa base de dados.

Esses resultados devem ser construidos a partir da base de dados chamada “Questionario_Estresse.xls”.

OBS - Obrigatória a interpretação dos seus resultados em pelo menos três parágrafos.

Análise Base de Dados, Questionario Estresse

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/carol/OneDrive/Documentos/Estatistica1/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

Verificando a Base de Dados

head(Questionario_Estresse)
# A tibble: 6 x 10
  Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
  <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
1     1     1         2     2          2        2       8.89       23       27
2     2     1         1     1          2        2       8.8        24       28
3     3     1         2     2          2        2       8          25       25
4     4     1         2     2          1        1       8.8        38       21
5     5     1         2     2          2        1       8.9        41       18
6     6     1         2     2          1        1       8.1        25       29
# ... with 1 more variable: Horas_estudo <dbl>

Consertando Dados Errados

Questionario_Estresse$Mora_pais = factor(Questionario_Estresse$Mora_pais, levels = c("1","2"), labels = c("Mora","Não Mora"))
Questionario_Estresse$Namorado_a = factor(Questionario_Estresse$Namorado_a, levels = c("1","2"), labels = c("Namora","Não Namora"))
Questionario_Estresse$Trabalha = factor(Questionario_Estresse$Trabalha, levels = c("1","2"), labels = c("Trabalha","Não Trabalha"))

head(Questionario_Estresse)
# A tibble: 6 x 10
  Aluno Turma Mora_pais    RJ Namorado_a Trabalha   Desempenho Estresse Créditos
  <dbl> <dbl> <fct>     <dbl> <fct>      <fct>           <dbl>    <dbl>    <dbl>
1     1     1 Não Mora      2 Não Namora Não Traba~       8.89       23       27
2     2     1 Mora          1 Não Namora Não Traba~       8.8        24       28
3     3     1 Não Mora      2 Não Namora Não Traba~       8          25       25
4     4     1 Não Mora      2 Namora     Trabalha         8.8        38       21
5     5     1 Não Mora      2 Não Namora Trabalha         8.9        41       18
6     6     1 Não Mora      2 Namora     Trabalha         8.1        25       29
# ... with 1 more variable: Horas_estudo <dbl>

Variaveis Qualitativas x Quantitativas

Qualitativas: Namora, Trabalha, Mora com Pais; Quantitativas: Estresse, Crédito, Desempenho;

Mora com Pais x Trabalha

Tabela1 <- table (Questionario_Estresse$Mora_pais,Questionario_Estresse$Trabalha)
Tabela1
          
           Trabalha Não Trabalha
  Mora           17           27
  Não Mora       19           32

Trabalha x Namora

Tabela2 <- table (Questionario_Estresse$Trabalha,Questionario_Estresse$Namorado_a)
Tabela2
              
               Namora Não Namora
  Trabalha         18         18
  Não Trabalha     29         30

Comparando as Três Variáveis Qualitativas

Tabela3 <- table(Questionario_Estresse$Mora_pais,Questionario_Estresse$Namorado_a,Questionario_Estresse$Trabalha)
Tabela3
, ,  = Trabalha

          
           Namora Não Namora
  Mora          8          9
  Não Mora     10          9

, ,  = Não Trabalha

          
           Namora Não Namora
  Mora         11         16
  Não Mora     18         14

Tabelas de Proporção

round(prop.table(Tabela1,1)*100,1)
          
           Trabalha Não Trabalha
  Mora         38.6         61.4
  Não Mora     37.3         62.7
round(prop.table(Tabela2,1)*100,1)
              
               Namora Não Namora
  Trabalha       50.0       50.0
  Não Trabalha   49.2       50.8

Gráficos Qualitativas

barplot(Tabela1, main = "Mora com pais X Trabalha",
        beside = TRUE,col = c("pink","yellow"), density = 55, angle = 55,
        ylim = c(0,30), 
        legend = rownames(Tabela1))

barplot(Tabela2, main = "Trabalha X Namora",
        beside = TRUE,col = c("blue","green"), density = 55, angle = 55,
        ylim = c(0,30), 
        legend = rownames(Tabela2))

Análise Nivel de Estresse de Quem Trabalha

library(flextable) 
summary(Questionario_Estresse)
     Aluno          Turma          Mora_pais        RJ             Namorado_a
 Min.   : 1.0   Min.   :1.000   Mora    :44   Min.   :1.000   Namora    :47  
 1st Qu.:24.5   1st Qu.:1.000   Não Mora:51   1st Qu.:1.000   Não Namora:48  
 Median :48.0   Median :2.000                 Median :2.000                  
 Mean   :48.0   Mean   :2.074                 Mean   :1.653                  
 3rd Qu.:71.5   3rd Qu.:3.000                 3rd Qu.:2.000                  
 Max.   :95.0   Max.   :3.000                 Max.   :2.000                  
                                                                             
         Trabalha    Desempenho       Estresse        Créditos    
 Trabalha    :36   Min.   :5.820   Min.   :12.00   Min.   :15.00  
 Não Trabalha:59   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
                   Median :8.700   Median :27.00   Median :24.00  
                   Mean   :8.594   Mean   :27.82   Mean   :24.95  
                   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
                   Max.   :9.700   Max.   :44.00   Max.   :49.00  
                                                   NA's   :1      
  Horas_estudo  
 Min.   :19.00  
 1st Qu.:25.00  
 Median :30.00  
 Mean   :30.73  
 3rd Qu.:35.00  
 Max.   :60.00  
                

Gráfico Qualitativa x Quantitativa

Estresse x Trabalho

boxplot(Estresse~Trabalha,
        data = Questionario_Estresse,main="Relação Estresse x Trabalho",
        col=c("red","gray"), horizontal = T,
        xlab = "Estresse", ylab = "Trabalha")

Estresse x Mora com Pais

boxplot(Estresse~Mora_pais,
        data = Questionario_Estresse,main="Estresse x Mora com Pais",
        col=c("pink","yellow"), horizontal = T,
        xlab = "Estresse", ylab = "Mora com pais")

Estresse x Namoro

boxplot(Estresse~Namorado_a,
        data = Questionario_Estresse,main="Estresse x Namoro",
        col=c("orange","lightgray"), horizontal = T,
        xlab = "Estresse", ylab = "Namoro")

Dados de Estresse

Média Estresse

A média de Estresse no total das pessoas estudadas no banco de dados é de 27.82 Sendo menor dado 12 e maior dado 44.

media = mean(Questionario_Estresse$Estresse)
media
[1] 27.82105

Mediana Estresse

mediana=median(Questionario_Estresse$Estresse)
mediana
[1] 27

Variância Estresse

variancia=var(Questionario_Estresse$Estresse)
variancia
[1] 56.85062

Desvio Padrão Estresse

O desvio padrão é uma medida que expressa o grau de dispersão de um conjunto de dados. Ou seja, o desvio padrão indica o quanto um conjunto de dados é uniforme. Quanto mais próximo de 0 for o desvio padrão, mais homogêneo são os dados. Sendo o desvio padrão neste estudo de 7,53, um pouco acima do 0, sendo dados pouco homogêneos.

desvio=variancia^(0.5)
desvio
[1] 7.539935

Conclusão

O banco de dados proposto possui 10 variáveis.
As variáveis são divididas em quantitativas e qualitativas.
Tivemos que corrigir alguns erros no banco de dados para melhor definir estas variáveis.
Podemos concluir, após análise dos dados disponibilizados em banco de dados que por exemplo, o nível de estresse é maior nas pessoas que não namoravam e que trabalhavam e não moravam com os pais.
Fizemos também calculo de média, mediana, variância e desvio padrão dos níveis de estresse dos dados informados no banco de dados. Sendo média 27.82105, Mediana 27, Variância 56.85062 e Desvio Padrão 7.539935.