Nesta seção, realizamos a carga e a manipulação de um conjunto de
dados utilizando o pacote dplyr.
# 1. Carregar bibliotecas
library(dplyr)
# 2. Carregar um conjunto de dados (Exemplo: mtcars)
df <- mtcars %>%
select(mpg, cyl, disp, hp, wt)
# 3. Manipulação com quebras de linha para melhor leitura
df_final <- df %>%
filter(cyl > 4) %>% # Filtra carros com mais de 4 cilindros
mutate(peso_kg = wt * 453.59) %>% # Cria nova variável (conversão para kg)
arrange(desc(mpg)) # Ordena por eficiência de consumo
# Exibir os primeiros resultados no console do relatório
head(df_final)
## mpg cyl disp hp wt peso_kg
## Hornet 4 Drive 21.4 6 258.0 110 3.215 1458.292
## Mazda RX4 21.0 6 160.0 110 2.620 1188.406
## Mazda RX4 Wag 21.0 6 160.0 110 2.875 1304.071
## Ferrari Dino 19.7 6 145.0 175 2.770 1256.444
## Merc 280 19.2 6 167.6 123 3.440 1560.350
## Pontiac Firebird 19.2 8 400.0 175 3.845 1744.054
# 1. Carregar a biblioteca para tabelas interativas
library(DT)
# 2. Criar a tabela com busca, ordenação e paginação
datatable(
df_final,
filter = 'top', # Adiciona filtros específicos por coluna
options = list(
pageLength = 5, # Quantidade de linhas por página
language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese-Brasil.json')
),
caption = 'Tabela 1: Visualização Interativa dos Veículos Selecionados'
)
Nesta seção, apresentamos cinco equações fundamentais utilizadas em estatística, física e ciência de dados.
A função de densidade de probabilidade da distribuição normal é definida por: \[\phi(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\] Significado: Descreve como os dados se distribuem em torno de uma média (\(\mu\)) com uma determinada dispersão ou desvio padrão (\(\sigma\)).
Considerada uma das equações mais belas da matemática: \[e^{i\pi} + 1 = 0\] Significado: Estabelece uma relação profunda entre cinco números fundamentais: \(e\), \(i\), \(\pi\), \(1\) e \(0\).
A base para muitos modelos de análise de dados: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k + \epsilon\] Significado: Modela a relação entre uma variável dependente (\(Y\)) e múltiplas variáveis independentes (\(X\)), incluindo um termo de erro (\(\epsilon\)).
Fundamental para o processamento de sinais e áudio: \[\hat{f}(\xi) = \int_{-\infty}^{\infty} f(t) e^{-2\pi i t \xi} dt\] Significado: Decompõe uma função temporal (como um som) em suas frequências constituintes.
Muito utilizada em Machine Learning para comparar distribuições: \[D_{KL}(P || Q) = \sum_{i} P(i) \log \left( \frac{P(i)}{Q(i)} \right)\] Significado: Mede a diferença ou a “perda de informação” entre uma distribuição de probabilidade real (\(P\)) e uma distribuição aproximada (\(Q\)).
Nesta aba, listamos as principais obras e documentações que fundamentam o uso do R Markdown e as técnicas de manipulação de dados apresentadas neste relatório.