MANIPULAÇÃO BANCO DE DADOS: SEPARANDO AS VARIAVEIS QUALITATIVAS DE QUANTITATIVAS.

library(readxl)
questionario_estresse <- read_excel("D:/Arquitetura/Estudos/Mestrado Engenharia UFF/Mestrado  A01S01/Estatistica/questionario_estresse.xls", 
                           sheet = "Dados")
questionario_estresse$Mora_pais <- ifelse(questionario_estresse$Mora_pais==1,"Sim", "Nao")
questionario_estresse$RJ <- ifelse(questionario_estresse$RJ==1,"Sim", "Nao")
questionario_estresse$`Namorado(a)` <- ifelse(questionario_estresse$`Namorado(a)`==1,"Sim", "Nao")
questionario_estresse$Trabalha <- ifelse(questionario_estresse$Trabalha==1,"Sim", "Nao")

AJUSTE DE CORES

library(RColorBrewer)
brewer.pal(7,"Spectral")
## [1] "#D53E4F" "#FC8D59" "#FEE08B" "#FFFFBF" "#E6F598" "#99D594" "#3288BD"
SPECTRAL <- brewer.pal(7,"Spectral")
brewer.pal(7,"Blues")
## [1] "#EFF3FF" "#C6DBEF" "#9ECAE1" "#6BAED6" "#4292C6" "#2171B5" "#084594"
AZUL <- brewer.pal(7,"Blues")
brewer.pal(7,"Reds")
## [1] "#FEE5D9" "#FCBBA1" "#FC9272" "#FB6A4A" "#EF3B2C" "#CB181D" "#99000D"
VERMELHO <- brewer.pal(7,"Reds")

BOXPLOT PARA ANÁLISE DE ALGUMAS VARIÁVEIS QUANTITATIVAS

boxplot(questionario_estresse$Horas_estudo ~ questionario_estresse$Estresse, 
        col=AZUL, main="Boxplot: Horas de Estudo x Estresse",
        ylab = "Horas de Estudo",
        xlab = "Estresse")

boxplot(questionario_estresse$Desempenho ~ questionario_estresse$Horas_estudo,
        col=SPECTRAL, main="Boxplot: Horas de Estudo x Estresse",
        ylab = "Horas de Estudo",
        xlab = "Desempenho")

INTERPRETAÇÃO BOXPLOT HORAS DE ESTUDO X ESTRESSE

O grafico apresenta cada boxplor representando um dos alunos do questionário. Fica claro que, ao analisar o posicionamento da média de cada aluno, a correlação entre estresse x horas de estudo não é sempre crescente, o que mostra que o Estresse causado pelas horas de estudo atinge seu ponto máximo aos 30 pontos, aproximadamente. Após isso outros fatores são causadores de estresse que não as horas que Estudo.

DIAGRAMA DE DISPERSÃO PARA VARIAVEIS QUANTITATIVAS

DESEMPENHO X ESTRESSE

graf_1<-plot(questionario_estresse$Desempenho, questionario_estresse$Estresse)
abline(lsfit(questionario_estresse$Desempenho,questionario_estresse$Estresse),col="darkred")

DESEMPENHO X HORAS DE ESTUDO

graf_2<-plot(questionario_estresse$Desempenho, questionario_estresse$Horas_estudo)
abline(lsfit(questionario_estresse$Desempenho, questionario_estresse$Horas_estudo),col = "darkblue")

DESEMPENHO X CREDITOS

graf_3<-plot(questionario_estresse$Desempenho, questionario_estresse$Créditos)
abline(lsfit(questionario_estresse$Desempenho, questionario_estresse$Créditos),col = "darkgreen")
## Warning in lsfit(questionario_estresse$Desempenho,
## questionario_estresse$Créditos): 1 missing value deleted

INTERPRETAÇÃO

Os diagramas de dispersão acima, foram feito tendo como variavel principal o “Desempenho”, sendo este avaliado na sua correção com as variáveis “Estresse”, “Horas de Estudo” e “Creditos”. Há, em todos os três casos uma correlação positiva. Mostrando que a medida que o Desempenho do aluno aumenta, as variáveis “Estresse, Horas de Estudo” e “Creditos” tendem a crescer também, mesmo no caso “Desempenho x Creditos” seja um acrscimo bem tímido.

Esta correlação positiva já era esperada, porém de forma mais intensa. O que nos evidencia que existem outros fatores, qualitativos, inclusive, que interferem no desempenho do aluno e que, podemos concluir, não só horas de estudo que contam, para que seja bem sucedido.

ANÁLISE DO COEFICIENTE DE CORRELAÇÃO

cor(questionario_estresse$Horas_estudo, questionario_estresse$Desempenho)
## [1] 0.2231532

INTERPRETAÇÃO

Este coeficiente positivo de correlação entre as duas variáveis apenas confirma o já demonstrado no diagrama de dispersão: a baixa correlação positiva entre as duas variáveis.

ANÁLISE DA MATRIZ DE CORRELAÇÃO

library(corrplot)
## corrplot 0.84 loaded
names(questionario_estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado(a)" 
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
var_quanti<-c("Desempenho","Estresse","Horas_estudo")

questionario_estresse[,var_quanti]
## # A tibble: 95 x 3
##    Desempenho Estresse Horas_estudo
##         <dbl>    <dbl>        <dbl>
##  1       8.89       23           27
##  2       8.8        24           28
##  3       8          25           25
##  4       8.8        38           30
##  5       8.9        41           20
##  6       8.1        25           32
##  7       9.2        41           25
##  8       8.5        20           25
##  9       8.7        26           25
## 10       8.3        36           59
## # ... with 85 more rows
cor(questionario_estresse[,var_quanti])
##              Desempenho   Estresse Horas_estudo
## Desempenho   1.00000000 0.08257246    0.2231532
## Estresse     0.08257246 1.00000000    0.3039170
## Horas_estudo 0.22315316 0.30391699    1.0000000
corrplot(cor(questionario_estresse[,var_quanti]), col = VERMELHO)