Análise de duas Variáveis Qualitativas

Importação de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/manue/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

Verificação dos dados

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

Correção dos dados

Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,"2007_2",
                                      ifelse(Questionario_Estresse$Turma==2,"2008_1", "2008_2"))
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"namora","solteiro")

Checagem dos dados

summary(Questionario_Estresse)
##      Aluno         Turma             Mora_pais           RJ       
##  Min.   : 1.0   Length:95          Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   Class :character   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Mode  :character   Median :2.000   Median :2.000  
##  Mean   :48.0                      Mean   :1.537   Mean   :1.653  
##  3rd Qu.:71.5                      3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0                      Max.   :2.000   Max.   :2.000  
##                                                                   
##   Namorado_a           Trabalha       Desempenho       Estresse    
##  Length:95          Min.   :1.000   Min.   :5.820   Min.   :12.00  
##  Class :character   1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Median :2.000   Median :8.700   Median :27.00  
##                     Mean   :1.621   Mean   :8.594   Mean   :27.82  
##                     3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00  
##                     Max.   :2.000   Max.   :9.700   Max.   :44.00  
##                                                                    
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Criação da tabelas

Tabela entre as variáveis turma e namorado. A segunda tabela é com prporções.

tabela_Namoradoa = table(Questionario_Estresse$Turma, Questionario_Estresse$Namorado_a)

tabela_Namoradoa
##         
##          namora solteiro
##   2007_2     11       17
##   2008_1     18       14
##   2008_2     18       17
prop.table(tabela_Namoradoa)*100
##         
##            namora solteiro
##   2007_2 11.57895 17.89474
##   2008_1 18.94737 14.73684
##   2008_2 18.94737 17.89474

Importação de cores

library(RColorBrewer)

brewer.pal(4, "Purples")
## [1] "#F2F0F7" "#CBC9E2" "#9E9AC8" "#6A51A3"
COR = c("#F2F0F7", "#CBC9E2", "#9E9AC8")

Criação do gráfico

grafico = barplot(tabela_Namoradoa, main =  "Status de Relacionamento por Turmas",
        col = COR, horiz = FALSE, beside = TRUE,
        args.legend = list(x = "topright"),
        ylim = c(0, 25), legend.text = rownames (tabela_Namoradoa))

O gráfico acima analisa duas variáveis entre sí, a de Namorados e de Turmas. A ideia era fazeer um estudo a respeito da proporção entre quem está solteiro e quem está namorando, avaliando em cada turma.

Pudemos concluir que a turma de 2007.2 é a que menos namora, porém, tem tanto solteiro quanto a de 2008.2, que coincidentemente tem o mesmo número de pessoas namorando, número esse igual ao de 2008.1, que tem a menor quantidade de solteiros entre as 3 turmas.

OBS: tentei adicionar a porcentagem dentro das barras mas ficou muito grande e não sabia como diminuir os números de dentro então optei por não colocar