Este relatório apresenta a análise de um conjunto de dados mtcars.
# Carregando pacotes necessários
library(dplyr)
library(DT)
library(kableExtra)
# Carregando o conjunto de dados mtcars
dados <- mtcars
# Renomeando as colunas para português
colnames(dados) <- c("milhas_por_galao", "cilindros", "deslocamento", "potencia_bruta",
"peso", "tempo_1_4_milha", "motor_v", "marchas_automaticas",
"marchas", "carburadores", "engrenagens")
# Manipulação simples: Ordenação dos dados por milhas_por_galao e criação de uma nova variável (eficiência)
dados <- dados %>%
arrange(desc(milhas_por_galao)) %>%
mutate(eficiencia = ifelse(milhas_por_galao > 20, "Alta", "Baixa"))
# Visualizando os primeiros registros em uma tabela formatada
dados %>%
head() %>%
kable(caption = "Conjunto de Dados Formatado") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive", "underline"))
| milhas_por_galao | cilindros | deslocamento | potencia_bruta | peso | tempo_1_4_milha | motor_v | marchas_automaticas | marchas | carburadores | engrenagens | eficiencia | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Toyota Corolla | 33.9 | 4 | 71.1 | 65 | 4.22 | 1.835 | 19.90 | 1 | 1 | 4 | 1 | Alta |
| Fiat 128 | 32.4 | 4 | 78.7 | 66 | 4.08 | 2.200 | 19.47 | 1 | 1 | 4 | 1 | Alta |
| Honda Civic | 30.4 | 4 | 75.7 | 52 | 4.93 | 1.615 | 18.52 | 1 | 1 | 4 | 2 | Alta |
| Lotus Europa | 30.4 | 4 | 95.1 | 113 | 3.77 | 1.513 | 16.90 | 1 | 1 | 5 | 2 | Alta |
| Fiat X1-9 | 27.3 | 4 | 79.0 | 66 | 4.08 | 1.935 | 18.90 | 1 | 1 | 4 | 1 | Alta |
| Porsche 914-2 | 26.0 | 4 | 120.3 | 91 | 4.43 | 2.140 | 16.70 | 0 | 1 | 5 | 2 | Alta |
# Criando uma tabela interativa
datatable(dados, options = list(pageLength = 10, searchHighlight = TRUE))
A média aritmética de um conjunto de valores é dada por: \[\begin{equation} \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \end{equation}\]
Mede a dispersão dos dados em relação à média: \[\begin{equation} \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2} \end{equation}\]
Mede a força da associação linear entre duas variáveis \[\begin{equation} r = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \bar{x})^2 \sum_{i=1}^{n} (y_i - \bar{y})^2}} \end{equation}\]
Na regressão linear simples, a inclinação é dada por: \[\begin{equation} \beta_1 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n} (x_i - \bar{x})^2} \end{equation}\]
Uma métrica de avaliação de modelos de regressão: \[\begin{equation} \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \end{equation}\]
knitr::include_graphics("./img/cover.jpg")
knitr::include_graphics("./img/3_pasted-image-0-11.png")