Criando conjunto de dados:

RUA_VERMELHA = c(40,95,55,80,65)
rua_azul = c(55,70,70,65,75)

Calculando a média:

mean(RUA_VERMELHA)
## [1] 67
mean(rua_azul)
## [1] 67
media_vermelha = mean(RUA_VERMELHA)
media_azul = mean(rua_azul)

Calculando a variância:

var_vermelha = var(RUA_VERMELHA)
var_azul = var (rua_azul)
var_vermelha
## [1] 457.5
var_azul
## [1] 57.5

Calculando desvio-padrão:

desvio_padrao_vermelho = sd(RUA_VERMELHA)
desvio_padrao_azul = sd(rua_azul)
round(desvio_padrao_azul,2)
## [1] 7.58
round(desvio_padrao_vermelho,2)
## [1] 21.39

Importando e ajeitando a base de dados.

library(readxl)
Questionario_Estresse <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(Questionario_Estresse)

Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais==1, "Sim","Não")
Questionario_Estresse$RJ = ifelse (Questionario_Estresse$RJ == 1, "Sim", "Não")
Questionario_Estresse$Namorado_a = ifelse (Questionario_Estresse$Namorado_a == 1, "Sim", "Não")
Questionario_Estresse$Trabalha = ifelse (Questionario_Estresse$Trabalha == 1, "Sim", "Não")

Qual é a nota média desses alunos?

Quantas horas eles estudam?

mean(Questionario_Estresse$Desempenho)
## [1] 8.593789
sd(Questionario_Estresse$Desempenho)
## [1] 0.775319

A média é 8,6, com desvio-padrão de 0,77. Uma nota alta com pouca dispersão.


Calculando a mediana.

conjunto1 = c(8,9,10,11,12,13,14)
median(conjunto1)
## [1] 11
mean(conjunto1)
## [1] 11
conjunto2 = c(8,9,10,11,12,13,140000)
mean(conjunto2)
## [1] 20009
median(conjunto2)
## [1] 11
sd (conjunto2)
## [1] 52911.06

Análise dos conjuntos.

140.000 é um outlier(observação atipica ou discrepante) no conjunto dois. A mediana é robusta a outliers. A média é sensível a outliers.

O uso da mediana ou da média depende se a base de dados tem outliers ou não.

summary(Questionario_Estresse)
##      Aluno          Turma        Mora_pais              RJ           
##  Min.   : 1.0   Min.   :1.000   Length:95          Length:95         
##  1st Qu.:24.5   1st Qu.:1.000   Class :character   Class :character  
##  Median :48.0   Median :2.000   Mode  :character   Mode  :character  
##  Mean   :48.0   Mean   :2.074                                        
##  3rd Qu.:71.5   3rd Qu.:3.000                                        
##  Max.   :95.0   Max.   :3.000                                        
##                                                                      
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Gráfico de box.

boxplot(Questionario_Estresse$Desempenho)

boxplot(Questionario_Estresse$Horas_estudo, col = "royalblue", horizontal = TRUE, main = "Gráfico - Horas de estudo")


Carregando a base de dados carros

load("C:/Users/15781634711/Desktop/Base_de_dados-master/CARROS.RData")

O que é um histograma

Histograma é um gráfico de frequência.

Criando histogramas de eficiência, de preço e de peso dos carros.

hist(CARROS$Kmporlitro, col = c("skyblue"), main = "Histograma de Km/Litro", ylab = "Frequência", xlab = "Km/L")

hist(CARROS$Preco, col = c ("green"), main = "Histograma de preço", ylab = "Frequência", xlab = "Preço do carro (em mil reais)")

hist(CARROS$Peso, col = ("brown"), main = "Histograma de peso", ylab = "Frequência", xlab = "Peso do carro (em TON)")

Análise dos histogramas

Podemos concluir que a eficiência e o preço são assimétricos e bimodais, enquanto o peso é assimétrico e apresenta outliers.


Qual a diferença entre um gráfico de barras e um histograma?

Tabela_trabalha = table(Questionario_Estresse$Trabalha)

par(mfrow = c(1,2))
barplot(Tabela_trabalha, col = c("turquoise"), main = "Tabela de trabalho")
hist(CARROS$Preco, col = c ("green"), main = "Histograma de preço", ylab = "Frequência", xlab = "Preço do carro (em mil reais)")

Gráfico de barras é para variáveis qualitativas ordinais e o histograma é para variáveis quantitativas.