Introdução

Nesse trabalho irei colocar meus aprendizados da segunda aula de estatística. A base de dados a ser utilizada e analisada é o “Questionário Estresse”, na seguinte ordem:

1.Tabela em valores absolutos
2.Tabela de proporção
3.Gráfico de pizza*
4.Gráfico de barras*
5. Conclusão

*Em ambos os gráficos será utilizada uma variável qualitativa nominal.

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Maria Clara Queiroz/Downloads/Questionario_Estresse.xls", 
    sheet = "Dados")
View(Questionario_Estresse)

Introdução

Nesse trabalho irei colocar meus aprendizados da segunda aula de estatística. A base de dados a ser utilizada e analisada é o “Questionário Estresse”, na seguinte ordem:

1.Tabela em valores absolutos
2.Tabela de proporção
3.Gráfico de pizza*
4.Gráfico de barras*

*Em ambos os gráficos será utilizada uma variável qualitativa nominal.

Transformação de dados:

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"Sim","Não")

Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Natural do RJ","Natural de outras cidades")

Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"Sim","Não")

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"Sim","Não")

summary(Questionario_Estresse)
##      Aluno          Turma        Mora_pais              RJ           
##  Min.   : 1.0   Min.   :1.000   Length:95          Length:95         
##  1st Qu.:24.5   1st Qu.:1.000   Class :character   Class :character  
##  Median :48.0   Median :2.000   Mode  :character   Mode  :character  
##  Mean   :48.0   Mean   :2.074                                        
##  3rd Qu.:71.5   3rd Qu.:3.000                                        
##  Max.   :95.0   Max.   :3.000                                        
##                                                                      
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

1.Tabela em valores absolutos

Quantidade de alunos em cada turma

tabela_turma <- table(Questionario_Estresse$Turma)
tabela_turma
## 
##  1  2  3 
## 28 32 35

Os alunos moram com os pais?

tabela_pais <- table(Questionario_Estresse$Mora_pais)
tabela_pais
## 
## Não Sim 
##  51  44

Quantos alunos são naturais do Rio de Janeiro e quantos são naturais de outras cidades

tabela_RJ <- table(Questionario_Estresse$RJ)
tabela_RJ
## 
## Natural de outras cidades             Natural do RJ 
##                        62                        33

Quantos alunos namoram?

tabela_nam <- table(Questionario_Estresse$Namorado_a)
tabela_nam
## 
## Não Sim 
##  48  47

Quantos alunos trabalham?

tabela_trab <- table(Questionario_Estresse$Trabalha)
tabela_trab
## 
## Não Sim 
##  59  36

Tabela de desempenho:

tabela_desemp <- table(Questionario_Estresse$Desempenho)
tabela_desemp
## 
## 5.82  5.9    6  6.5  6.6    7  7.5  7.7  7.8    8  8.1  8.2  8.3  8.4 8.48  8.5 
##    1    1    1    1    1    2    1    1    1    5    2    1    2    2    1   14 
## 8.53 8.55  8.6 8.64  8.7 8.79  8.8 8.82 8.89  8.9 8.94 8.96    9 9.03 9.07 9.08 
##    1    1    4    1    4    1    8    1    2    3    1    1    5    1    1    1 
## 9.09  9.1 9.12  9.2 9.29  9.3 9.33 9.36 9.39  9.4 9.44 9.45  9.5  9.6  9.7 
##    1    1    1    2    2    2    1    2    1    3    1    1    1    2    1

Tabela dos níveis de estresse

tabela_estresse <- table(Questionario_Estresse$Estresse)
tabela_estresse
## 
## 12 13 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 
##  1  2  1  3  3  1  1  5  5  2  3  4  6  8  3  2  4  6  5  4  5  3  3  1  3  3 
## 39 40 41 42 44 
##  1  1  2  2  2

Tabela da quantidade de créditos

tabela_creditos <- table(Questionario_Estresse$Créditos)
tabela_creditos
## 
## 15 17 18 19 20 21 23 24 25 26 27 28 29 30 32 49 
##  1  1  1  1 11  2  9 24  2 10 10 14  2  4  1  1

Tabela da quantidade de horas de estudo

tabela_horas <- table(Questionario_Estresse$Horas_estudo)
tabela_horas
## 
## 19 20 21 23 24 25 26 27 28 29 30 32 33 34 35 36 40 44 59 60 
##  1  6  1  2  6  9  4  1  6  4 18  5  6  1  6  6  8  3  1  1

2. Tabela de proporção

# Proporção da quantidade de alunos na turma
prop.table(tabela_turma)*100
## 
##        1        2        3 
## 29.47368 33.68421 36.84211
# Proporção da quantidade de alunos que moram com os pais

prop.table(tabela_pais)*100
## 
##      Não      Sim 
## 53.68421 46.31579
# Proporção da quantidade de alunos que são naturais do Rio de Janeiro ou de outras cidades

prop.table(tabela_RJ)*100
## 
## Natural de outras cidades             Natural do RJ 
##                  65.26316                  34.73684
# Proporção da quantidade de alunos que namoram

prop.table(tabela_nam)*100
## 
##      Não      Sim 
## 50.52632 49.47368
# Proporção da quantidade de alunos que trabalham

prop.table(tabela_trab)*100
## 
##      Não      Sim 
## 62.10526 37.89474
# Proporção do desempenho

prop.table(tabela_desemp)*100
## 
##      5.82       5.9         6       6.5       6.6         7       7.5       7.7 
##  1.052632  1.052632  1.052632  1.052632  1.052632  2.105263  1.052632  1.052632 
##       7.8         8       8.1       8.2       8.3       8.4      8.48       8.5 
##  1.052632  5.263158  2.105263  1.052632  2.105263  2.105263  1.052632 14.736842 
##      8.53      8.55       8.6      8.64       8.7      8.79       8.8      8.82 
##  1.052632  1.052632  4.210526  1.052632  4.210526  1.052632  8.421053  1.052632 
##      8.89       8.9      8.94      8.96         9      9.03      9.07      9.08 
##  2.105263  3.157895  1.052632  1.052632  5.263158  1.052632  1.052632  1.052632 
##      9.09       9.1      9.12       9.2      9.29       9.3      9.33      9.36 
##  1.052632  1.052632  1.052632  2.105263  2.105263  2.105263  1.052632  2.105263 
##      9.39       9.4      9.44      9.45       9.5       9.6       9.7 
##  1.052632  3.157895  1.052632  1.052632  1.052632  2.105263  1.052632
# Proporção dos níveis de estresse

prop.table(tabela_estresse)*100
## 
##       12       13       15       16       17       18       19       20 
## 1.052632 2.105263 1.052632 3.157895 3.157895 1.052632 1.052632 5.263158 
##       21       22       23       24       25       26       27       28 
## 5.263158 2.105263 3.157895 4.210526 6.315789 8.421053 3.157895 2.105263 
##       29       30       31       32       33       34       35       36 
## 4.210526 6.315789 5.263158 4.210526 5.263158 3.157895 3.157895 1.052632 
##       37       38       39       40       41       42       44 
## 3.157895 3.157895 1.052632 1.052632 2.105263 2.105263 2.105263
# Proporção da quantidade de créditos

prop.table(tabela_creditos)*100
## 
##        15        17        18        19        20        21        23        24 
##  1.063830  1.063830  1.063830  1.063830 11.702128  2.127660  9.574468 25.531915 
##        25        26        27        28        29        30        32        49 
##  2.127660 10.638298 10.638298 14.893617  2.127660  4.255319  1.063830  1.063830
# Proporção de horas de estudo

prop.table(tabela_horas)*100
## 
##        19        20        21        23        24        25        26        27 
##  1.052632  6.315789  1.052632  2.105263  6.315789  9.473684  4.210526  1.052632 
##        28        29        30        32        33        34        35        36 
##  6.315789  4.210526 18.947368  5.263158  6.315789  1.052632  6.315789  6.315789 
##        40        44        59        60 
##  8.421053  3.157895  1.052632  1.052632

3. Gráfico de pizza

Gráfico de turmas

#### Gráfico das turmas  
  
pie(tabela_turma, col=c("lightpink", "violet", "lightblue"))

Quantidade de alunos que moram com os pais

pie(tabela_pais, col = c("salmon", "lightgreen"))

Quantidade de alunos que são ou não naturais do Rio de Janeiro

pie(tabela_RJ, col = c("lightcoral", "cyan2"))

Quantidade de alunos que namoram

pie(tabela_nam, col=c("grey50", "red2"))

Quantidade de alunos que trabalham

pie(tabela_trab, col = c("steelblue2", "springgreen3"))

As variáveis “Desempenho”, “Estresse”, “Créditos” e “Horas de Estudo”

não foram utulizadas no gráfico pizza, devido à quantidade de dados que deixavam a leitura confusa.

4. Gráfico de barras

O gráfico de barras é mais adequado para demonstrar as variáveis: “Desempenho”, “Estresse”, “Créditos” e “Horas de Estudo”.

#### Desempenho

barplot(tabela_desemp, main = "Desempenho", ylab = "Número de alunos", xlab = "Notas", col = c("violetred2"))

help("barplot")
## starting httpd help server ... done
#### Estresse

barplot(tabela_estresse, main = "Níveis de estresse", ylab = "Número de alunos", xlab = "Níveis de estresse", col = c("tomato2"))

#### Créditos

barplot(tabela_creditos, main = "Créditos", ylab = "Número de alunos", xlab = "Número de créditos", col = c("mistyrose"))

#### Horas de estudo semanais

barplot(tabela_horas, main = "Horas de estudo semanais", ylab = "Número de alunos", xlab = "Horas por semana", col = c("yellow"))

Mas também é possível utilizar o gráfico em barras com as variáveis que usamos no gráfico de pizza anteriormente:

#### Turmas
  
barplot(tabela_turma, main = "Quantidade de alunos em cada turma", ylab = "Número de alunos", col = c("turquoise"))

#### Alunos que moram com os pais

barplot(tabela_pais, main = "Alunos que moram com os pais", ylab = "Número de alunos", col = c("tan"))

#### Onde foram naturalizados

barplot(tabela_RJ, main = "Em qual cidade os alunos foram naturalizados?", ylab = "Número de alunos", col = c("plum1", "plum3"))

#### Namoram

barplot(tabela_nam, main = "Quantidade de alunos que namoram", ylab = "Número de alunos", col = c("rosybrown2", "red2"))

#### Trabalham

barplot(tabela_trab, main = "Quantidade de alunos que trabalham", ylab = "Número de alunos", col = c("khaki4", "lightgreen"))

5. Conclusão

A partir da observação e análise das tabelas foi possível perceber que os 95 alunos da pesquisa foram divididos entre três turmas, a 1, 2 e 3, cada uma com aproximadamente 29%, 33% e 36% respectivamente, e mais da metade dos alunos não mora com os pais.

A maior diferença identificada entre os alunos é que quase ⅔ do total de alunos é natural de outras cidades que não são o Rio de Janeiro. E os números mais aproximados encontrados foram em relação ao namoro, que não empatou apenas por uma pessoa, vencendo em quantidade as pessoas que não namoram.

Já no tópico do desempenho, apenas 10 dos 95 alunos obtiveram uma nota menor que 8,0, a nota mais recorrente foi 8,5, a menor foi 5,8 e a maior 9,7. As horas gastas por semana dedicadas ao estudo vão de 19 a 60, e a quantidade de horas mais recorrente para a dedicação aos estudos é de 30 horas semanais, os quais aproximadamente 18% dos alunos responderam essa carga, que dá por volta de 4 horas por dia. E a partir desses dados é possível deduzir que a maioria dos alunos são dedicados, devido às suas notas e às horas de estudo semanais.

Sobre o número de créditos, a menor quantidade registrada foram de 15 e a maior de 49, e o mais comum - que é ainda mais perceptível no gráfico de barras - foi pegar mais de 20 créditos, sendo 24 créditos o número mais frequente. E dos níveis de estresse o mais baixo foi de 12 e o mais alto de 44, sendo o mais recorrente o nível 26, que está acima da média obtida (27).

Em relação às análises, as variáveis com poucos resultados são preferíveis de serem observadas utilizando o gráfico de pizza. Já as variáveis com muitos resultados tanto a tabela quanto o gráfico de barras são uma excelente opção (a tabela é melhor quando se é necessário analisar os valores exatos, como os de desempenho).