#Analise de variaveis qualitativas
Aqui vamos trabalhar com variáveis qualitativas. Devemos fazer: 1. Importat arquivos do excel e csv; 2. Olhar e tratar os dados; 3. Construir tabelas; 4. Fazer gráficos; 5. Escrever um parecer.
##Importação dos dados
Aqui vamos colocar os dados do excel, csv e RData.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/manue/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
##Inspecionar os dados
Aqui vamos ver se o R classificou as variáveis corretamente
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
##Tratamento de dados
Correção dos problemas.
Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,"2007_2",
ifelse(Questionario_Estresse$Turma==2,"2008_1", "2008_2"))
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"sim","nao")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"natural","forasteiro")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"namora","solteiro")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"sim","nao")
##Revisão dos dados
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Length:95 Length:95 Length:95
## 1st Qu.:24.5 Class :character Class :character Class :character
## Median :48.0 Mode :character Mode :character Mode :character
## Mean :48.0
## 3rd Qu.:71.5
## Max. :95.0
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
##Tabela
tabela_Namorado_a <- table(Questionario_Estresse$Namorado_a)
tabela_Namorado_a
##
## namora solteiro
## 47 48
##Probabilidade
prop.table(tabela_Namorado_a)*100
##
## namora solteiro
## 49.47368 50.52632
##Gráfico de pizza
pie(tabela_Namorado_a,main = "NAMORADO_A",labels = c("49.47368","50.52632"), col = c("#85175c","#191785"))
legend("topleft", fill =c("#85175c","#191785"), legend =c("namora","solteiro"))
Com o gráfico de pizza podemos perceber mais nitidamente a proporção entre as variaveis “namora” e “solteiro” de 49.47368 e 50.52632, nas cores roxa e azul, respectivamente. Com isso conseguimos analisar de forma mais clara a comparação entre os alunos sobre tal variável.