Relatório Aula 3 de Estatística

Uma analise básica do desvio padrão

Aqui vamos comparar os desvios de dois conjuntos de dado.

rua_vermelha = c(40,55,95,80,65)
rua_azul = c(70,55,65,70,75)

#Caculando a Média
media_vermelha = mean(rua_vermelha)
media_azul = mean(rua_azul)

media_vermelha
## [1] 67
media_azul
## [1] 67
#Calculando a variância 
var_vermelha = var(rua_vermelha)
var_azul = var(rua_azul)

var_vermelha
## [1] 457.5
var_azul
## [1] 57.5
desvio_padrao_vermelho = sd(rua_vermelha)
desvio_padrao_azul = sd(rua_azul)

desvio_padrao_azul
## [1] 7.582875
desvio_padrao_vermelho
## [1] 21.38925

apesar de ter a mesma média, o desvio padrão da rua vermelha é muito maior que o desvio da rua azul.

Importando do Execel

library(readxl)
Questionario_Estresse <- read_excel("C:\\Users\\06179351732\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(Questionario_Estresse)

Perguntas de Pesquisa

Qual é a nota média desses alunos?

Quantas horas eles estudam

Qual é o nível de estresse deles?

Nota média vai ser avaliada pela variavel desempenho

Horas?? ficou um pouco vago, nas para operacionalizar isso, vamos usar o Horas Estudo na semana

mean(Questionario_Estresse$Desempenho)
## [1] 8.593789
sd(Questionario_Estresse$Desempenho)
## [1] 0.775319
A media é 8,6 com o desvio padrão de 0,77 indicando uma nota alta com pouca dispersão.

o QUE É MEDIANA

conjunto1 = c(8,9,10,11,12,13,14)  
mean(conjunto1)
## [1] 11
median(conjunto1)
## [1] 11
conjunto2 = c(8,9,10,11,12,13,140000)
mean(conjunto2)
## [1] 20009
median(conjunto2)
## [1] 11

OBSERVAÇÃO: # 140000 é um outlier OBS2: a mediana é robusta ao outlier (ter outliers ou não, não muda a mediana) OBS1:a média é sensivel a presença de outlier

HORA DO GRÁFICO ;)

#boxplot

summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 
boxplot(Questionario_Estresse$Desempenho)

boxplot(Questionario_Estresse$Horas_estudo,col= "Yellow")

boxplot(Questionario_Estresse$Horas_estudo, col= "Blue",horizontal=TRUE)

boxplot(Questionario_Estresse$Horas_estudo, col= "Yellow",horizontal=TRUE, main="Gráfico - boxplot das horas de estudo")

Histograma

load("C:/Users/06179351732/Desktop/Base_de_dados-master/CARROS.RData")

hist(CARROS$Kmporlitro, col= "YELLOW", main = "MEU PRIMEIRO HISTOGRAMA", ylab = "Frequência", xlab = "Km/L")

hist(CARROS$Preco, col= "YELLOW", main = "HISTOGRAMA- Preço do Carro", ylab = "Frequência", xlab = "Peso do Carro")

hist(CARROS$Peso, col= "YELLOW", main = "HISTOGRAMA- Peso do Carro", ylab = "Frequência", xlab = "Peso do Carro")

Qual a diferença entre Histograma e Grafico de Barras

tabela = table(Questionario_Estresse$Trabalha)
par(nfrow=c(1,2))
## Warning in par(nfrow = c(1, 2)): "nfrow" não é um parâmetro gráfico
barplot(tabela,col="yellow")

hist(CARROS$Preco,col="green")