O conjunto de dados mtcars é um conjunto incorporado no R e oferece informações detalhadas sobre diferentes modelos de carros, abrangendo características relacionadas ao desempenho, eficiência e design. Este conjunto de dados é frequentemente utilizado em análises exploratórias e estudos estatísticos devido à sua simplicidade e relevância para questões automotivas.
O conjunto de dados mtcars contém 32 observações (linhas) e 11 variáveis (colunas), fornecendo uma amostra diversificada de veículos. Cada linha representa um modelo específico de carro, enquanto as colunas representam diferentes atributos associados a esses modelos.
# Carregar o conjunto de dados mtcars
data(mtcars)
# Remover linhas com valores ausentes
mtcars <- na.omit(mtcars)
# Verificar e remover duplicatas
mtcars <- unique(mtcars)
# Padronizar nomes de colunas (exemplo: converter para minúsculas)
colnames(mtcars) <- tolower(colnames(mtcars))
summary(mtcars)
## mpg cyl disp hp
## Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
## 1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
## Median :19.20 Median :6.000 Median :196.3 Median :123.0
## Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
## Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
## drat wt qsec vs
## Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
## 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
## Median :3.695 Median :3.325 Median :17.71 Median :0.0000
## Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
## 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
## Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
## am gear carb
## Min. :0.0000 Min. :3.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
## Median :0.0000 Median :4.000 Median :2.000
## Mean :0.4062 Mean :3.688 Mean :2.812
## 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :1.0000 Max. :5.000 Max. :8.000
datatable(mtcars, options = list(pageLength = 10))
\[ y = \beta_0 + \beta_1x + \epsilon \]
A equação descreve a relação linear entre uma variável dependente (y), uma variável independente (x), e um termo de erro (ϵ) em uma análise de regressão linear simples.
\[ f(x|\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]
A equação representa a função de densidade de probabilidade de uma distribuição normal. Ela descreve a probabilidade de observar um valor específico (x) dado a média (μ) e a variância (σ2).
\[ P(Y=1) = \frac{1}{1 + e^{-(\beta_0 + \beta_1x)}} \]
A equação é a função logística usada em modelos de regressão logística binária. Ela modela a probabilidade de um evento binário (Y=1) em termos de uma variável independente (x), intercepto (β0), e coeficiente (β1).
\[ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} \]
O teorema descreve a probabilidade condicional de uma hipótese (A) dado um evento (B). É calculado em termos da probabilidade inversa condicional (P(B∣A)), da probabilidade da hipótese (P(A)), e da probabilidade marginal do evento (P(B)).
\[ \bar{x} = \frac{\sum_{i=1}^{n} w_i \cdot x_i}{\sum_{i=1}^{n} w_i} \]
A equação calcula a média ponderada de um conjunto de valores (xi) usando pesos correspondentes (wi). É útil quando algumas observações têm mais influência do que outras na média final (x).
Rezende Francisco (2017)
Gouveia (2015)
Morettin and Singer (2020)
Kaufman (2019)
Gomes (2010)