Este relatório está dividido em abas, cada uma correspondendo a um item da atividade.
Vamos utilizar o dataset já presente no R mtcars, vamos
carregá-los, filtrar pelo número de cinlindros (> 6), criar uma nova
variável kg_por_hp e ordenar pela mesma.
dados_processados <- mtcars %>%
filter(cyl >= 6) %>%
mutate(
# "wt" está em "1000 lbs", vamos converter para kg
peso_kg = wt * 1000 * 0.453592,
# Vamos criar uma Relação de quilos por cavalo (hp)
kg_por_hp = round(peso_kg / hp, 2)
) %>%
# Ordenar pela nova variável (do mais eficiente para o menos)
arrange(kg_por_hp)
Aqui temos a tabela com os dados processados anteriormente, com opções de pesquisa e ordenação, além de paginação da tabela.
Abaixo estão cinco equações complexas formatadas usando LaTeX, com seus significados.
\[J_\text{ridge} = \sum^n_{i=1}(y_i-\hat{y}_i)^2+\lambda\sum^P_{j=1}\beta^2_j\]
Esta é a função de custo da Regressão Ridge. O objetivo do modelo é encontrar os coeficientes (\(\beta\)) que minimizam esse custo. Ela é composta por duas partes:
Variáveis
\[J_\text{lasso} = \sum^n_{i=1}(y_i-\hat{y}_i)^2+\lambda\sum^P_{j=1}|\beta_j|\] Esta é a função de custo da Regressão Lasso (Least Absolute Shrinkage and Selection Operator). Assim como a Ridge, ela busca minimizar o erro mais uma penalidade:
Variáveis
\[ J*\text{E-Net} = \sum^n*{i=1}(y*i-\hat{y}\_i)^2+\lambda\left[ (1-\alpha)\sum^P*{j=1}\beta^2*j+\alpha\sum^P*{j=1}|\beta_j| \right] \]
Esta é a função de custo do Elastic Net. Ele é simplesmente uma combinação das regressões Ridge e Lasso, pegando o melhor dos dois mundos. Sua função de custo inclui o erro e uma penalidade que é uma mistura ponderada das penalidades L1 e L2.
Variáveis
\[ f(x) = \begin{cases} \frac{1}{t\sqrt{\rho}}e^{-(\lambda+\mu)^t}I_1(2t\sqrt{\lambda\mu}) & t > 0 \\ 0 & \text{caso contrário} \end{cases} \]
Esta é a Função de Densidade de Probabilidade (PDF) para a duração de um “período ocupado” em um sistema de fila M/M/1.
Variáveis
\[ f(x) = \begin{cases} (\mu-\lambda)e^{-(\mu-\lambda)t} & t > 0 \\ 0 & \text{caso contrário} \end{cases} \]
Esta é a Função de Densidade de Probabilidade (PDF) para o tempo total que um cliente passa no sistema (ou seja, o tempo gasto na fila + o tempo gasto sendo atendido).
Variáveis
Aqui temos as citações dos pacotes que que usamos (Wickham et al. 2023; Xie, Cheng, and Tan 2023) e livros clássicos da área (Hastie, Tibshirani, and Friedman 2009; Goodfellow, Bengio, and Courville 2016; R Core Team 2023).