RUA_VERMELHA = c(40,95,55,80,65)
rua_azul = c(55,70,70,65,75)
mean(RUA_VERMELHA)
## [1] 67
mean(rua_azul)
## [1] 67
media_vermelha = mean(RUA_VERMELHA)
media_azul = mean(rua_azul)
var_vermelha = var(RUA_VERMELHA)
var_azul = var (rua_azul)
var_vermelha
## [1] 457.5
var_azul
## [1] 57.5
desvio_padrao_vermelho = sd(RUA_VERMELHA)
desvio_padrao_azul = sd(rua_azul)
round(desvio_padrao_azul,2)
## [1] 7.58
round(desvio_padrao_vermelho,2)
## [1] 21.39
library(readxl)
Questionario_Estresse <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(Questionario_Estresse)
Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais==1, "Sim","Não")
Questionario_Estresse$RJ = ifelse (Questionario_Estresse$RJ == 1, "Sim", "Não")
Questionario_Estresse$Namorado_a = ifelse (Questionario_Estresse$Namorado_a == 1, "Sim", "Não")
Questionario_Estresse$Trabalha = ifelse (Questionario_Estresse$Trabalha == 1, "Sim", "Não")
Qual é a nota média desses alunos?
Quantas horas eles estudam?
mean(Questionario_Estresse$Desempenho)
## [1] 8.593789
sd(Questionario_Estresse$Desempenho)
## [1] 0.775319
A média é 8,6, com desvio-padrão de 0,77. Uma nota alta com pouca dispersão.
conjunto1 = c(8,9,10,11,12,13,14)
median(conjunto1)
## [1] 11
mean(conjunto1)
## [1] 11
conjunto2 = c(8,9,10,11,12,13,140000)
mean(conjunto2)
## [1] 20009
median(conjunto2)
## [1] 11
sd (conjunto2)
## [1] 52911.06
140.000 é um outlier(observação atipica ou discrepante) no conjunto dois. A mediana é robusta a outliers. A média é sensível a outliers.
O uso da mediana ou da média depende se a base de dados tem outliers ou não.
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Length:95 Length:95
## 1st Qu.:24.5 1st Qu.:1.000 Class :character Class :character
## Median :48.0 Median :2.000 Mode :character Mode :character
## Mean :48.0 Mean :2.074
## 3rd Qu.:71.5 3rd Qu.:3.000
## Max. :95.0 Max. :3.000
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
boxplot(Questionario_Estresse$Desempenho)
boxplot(Questionario_Estresse$Horas_estudo, col = "royalblue", horizontal = TRUE, main = "Gráfico - Horas de estudo")
load("C:/Users/15781634711/Desktop/Base_de_dados-master/CARROS.RData")
Histograma é um gráfico de frequência.
hist(CARROS$Kmporlitro, col = c("skyblue"), main = "Histograma de Km/Litro", ylab = "Frequência", xlab = "Km/L")
hist(CARROS$Preco, col = c ("green"), main = "Histograma de preço", ylab = "Frequência", xlab = "Preço do carro (em mil reais)")
hist(CARROS$Peso, col = ("brown"), main = "Histograma de peso", ylab = "Frequência", xlab = "Peso do carro (em TON)")
Podemos concluir que a eficiência e o preço são assimétricos e bimodais, enquanto o peso é assimétrico e apresenta outliers.
Tabela_trabalha = table(Questionario_Estresse$Trabalha)
par(mfrow = c(1,2))
barplot(Tabela_trabalha, col = c("turquoise"), main = "Tabela de trabalho")
hist(CARROS$Preco, col = c ("green"), main = "Histograma de preço", ylab = "Frequência", xlab = "Preço do carro (em mil reais)")
Gráfico de barras é para variáveis qualitativas ordinais e o histograma é para variáveis quantitativas.