Introdução

Hoje, estudamos estatísticas de posição e dispersão.

A média e a mediana são estatísticas de posição.

c1 = c(10,10,10,10,10)
c2 = c(8,9,10,11,12)
c3 = c(6,8,10,12,14)

mean(c1)
## [1] 10
mean(c2)
## [1] 10
mean(c3)
## [1] 10
median(c1)
## [1] 10
median(c2)
## [1] 10
median(c3)
## [1] 10

A amplitude, variância e desvio padrão são medidas de dispersão, direcionadas a demonstrar a variabilidade ou disparidade dos dados analisados.

var(c1)
## [1] 0
var(c2)
## [1] 2.5
var(c3)
## [1] 10
sd(c1)
## [1] 0
sd(c2)
## [1] 1.581139
sd(c3)
## [1] 3.162278

Em seguida, discutimos que em um grupo c1(1,2,3,4,50000), o 50000 é considerado um OUTLIER, que representa um valor dissonante dos outros, ou seja, um número atípico ao resto do grupo.

dados2 = c(1,2,3,4,50000)
mean(dados2)
## [1] 10002

Concluímos que na presença de OUTLIERS, a mediana, que é robusta a OUTLIERS, prova ser melhor que a média, já que esta é sensível a presença destes.

median(dados2)
## [1] 3

Além de que o desvio padrão é SEMPRE melhor que a amplitude para mensurar a dispersão.

load("C:/Users/18744968701/Desktop/Base_de_dados-master/CARROS.RData")

sd(CARROS$Preco)
## [1] 123.9387
max(CARROS$Preco)-min(CARROS$Preco)
## [1] 400.9

Gráficos

Histogramas

  1. O histrograma é para variáveis quantitativas contínuas, enquanto o gráfico de barras é utilizado para variáveis qualitativas nominais e ordinais.

  2. O histograma pode ser simétrico ou assimétrico.

  3. O histograma pode mostrar a presença de outliers.

  4. O histograma pode ser unimodal ou bi-modal.

load("C:/Users/18744968701/Desktop/Base_de_dados-master/CARROS.RData")
hist(CARROS$Kmporlitro, col = "violetred4", main = "Gráfico 1 - Meu Primeiro Histograma", xlab = "Km/l", ylab = "Frequência")

O histograma acima é assimétrico e unimodal.

Outros exemplos de histograma

hist(CARROS$Preco, col = "steelblue4", main = "Gráfico 2 - Histograma do preço de carros", xlab = "Preço", ylab = "Frequência")

hist(CARROS$Peso, col = "tomato3", main = "Gráfico 3 - Histograma de peso(em toneladas)", xlab = "Peso", ylab = "Frequência")

hist(CARROS$RPM, col = "green4", main = "Gráfico 4 - Histograma de RPM", xlab = "RPM", ylab = "Frequência")

Dotchart

stripchart(CARROS$NumdeValvulas, method = "stack", at = .15, pch = 19, col = "yellow2", main = "Gráfico 5 - Dotchart do número de válvulas", xlab = "Número de válvulas")