Relatório Aula 3 de Estatística
Aqui vamos comparar os desvios de dois conjuntos de dado.
rua_vermelha = c(40,55,95,80,65)
rua_azul = c(70,55,65,70,75)
#Caculando a Média
media_vermelha = mean(rua_vermelha)
media_azul = mean(rua_azul)
media_vermelha
## [1] 67
media_azul
## [1] 67
#Calculando a variância
var_vermelha = var(rua_vermelha)
var_azul = var(rua_azul)
var_vermelha
## [1] 457.5
var_azul
## [1] 57.5
desvio_padrao_vermelho = sd(rua_vermelha)
desvio_padrao_azul = sd(rua_azul)
desvio_padrao_azul
## [1] 7.582875
desvio_padrao_vermelho
## [1] 21.38925
apesar de ter a mesma média, o desvio padrão da rua vermelha é muito maior que o desvio da rua azul.
library(readxl)
Questionario_Estresse <- read_excel("C:\\Users\\06179351732\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(Questionario_Estresse)
mean(Questionario_Estresse$Desempenho)
## [1] 8.593789
sd(Questionario_Estresse$Desempenho)
## [1] 0.775319
conjunto1 = c(8,9,10,11,12,13,14)
mean(conjunto1)
## [1] 11
median(conjunto1)
## [1] 11
conjunto2 = c(8,9,10,11,12,13,140000)
mean(conjunto2)
## [1] 20009
median(conjunto2)
## [1] 11
OBSERVAÇÃO: # 140000 é um outlier OBS2: a mediana é robusta ao outlier (ter outliers ou não, não muda a mediana) OBS1:a média é sensivel a presença de outlier
#boxplot
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
boxplot(Questionario_Estresse$Desempenho)
boxplot(Questionario_Estresse$Horas_estudo,col= "Yellow")
boxplot(Questionario_Estresse$Horas_estudo, col= "Blue",horizontal=TRUE)
boxplot(Questionario_Estresse$Horas_estudo, col= "Yellow",horizontal=TRUE, main="Gráfico - boxplot das horas de estudo")
load("C:/Users/06179351732/Desktop/Base_de_dados-master/CARROS.RData")
hist(CARROS$Kmporlitro, col= "YELLOW", main = "MEU PRIMEIRO HISTOGRAMA", ylab = "Frequência", xlab = "Km/L")
hist(CARROS$Preco, col= "YELLOW", main = "HISTOGRAMA- Preço do Carro", ylab = "Frequência", xlab = "Peso do Carro")
hist(CARROS$Peso, col= "YELLOW", main = "HISTOGRAMA- Peso do Carro", ylab = "Frequência", xlab = "Peso do Carro")
tabela = table(Questionario_Estresse$Trabalha)
par(nfrow=c(1,2))
## Warning in par(nfrow = c(1, 2)): "nfrow" não é um parâmetro gráfico
barplot(tabela,col="yellow")
hist(CARROS$Preco,col="green")