Relatório Principal

1) Manipulação de Dados

Nesta seção, realizamos a carga e a manipulação de um conjunto de dados utilizando o pacote dplyr.

Código e Explicações

# 1. Carregar bibliotecas
library(dplyr)

# 2. Carregar um conjunto de dados (Exemplo: mtcars)
df <- mtcars %>% 
  select(mpg, cyl, disp, hp, wt)

# 3. Manipulação com quebras de linha para melhor leitura
df_final <- df %>%
  filter(cyl > 4) %>%                  # Filtra carros com mais de 4 cilindros
  mutate(peso_kg = wt * 453.59) %>%    # Cria nova variável (conversão para kg)
  arrange(desc(mpg))                   # Ordena por eficiência de consumo

# Exibir os primeiros resultados no console do relatório
head(df_final)

##                   mpg cyl  disp  hp    wt  peso_kg
## Hornet 4 Drive   21.4   6 258.0 110 3.215 1458.292
## Mazda RX4        21.0   6 160.0 110 2.620 1188.406
## Mazda RX4 Wag    21.0   6 160.0 110 2.875 1304.071
## Ferrari Dino     19.7   6 145.0 175 2.770 1256.444
## Merc 280         19.2   6 167.6 123 3.440 1560.350
## Pontiac Firebird 19.2   8 400.0 175 3.845 1744.054

2) pacote DT para criar uma tabela interativa

# 1. Carregar a biblioteca para tabelas interativas
library(DT)

# 2. Criar a tabela com busca, ordenação e paginação
datatable(
  df_final, 
  filter = 'top',      # Adiciona filtros específicos por coluna
  options = list(
    pageLength = 5,    # Quantidade de linhas por página
    language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese-Brasil.json')
  ),
  caption = 'Tabela 1: Visualização Interativa dos Veículos Selecionados'
)

3) Equações em LaTeX

Nesta seção, apresentamos cinco equações fundamentais utilizadas em estatística, física e ciência de dados.

1. Distribuição Normal (Gaussiana)

A função de densidade de probabilidade da distribuição normal é definida por: \[\phi(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\] Significado: Descreve como os dados se distribuem em torno de uma média (\(\mu\)) com uma determinada dispersão ou desvio padrão (\(\sigma\)).

2. Identidade de Euler

Considerada uma das equações mais belas da matemática: \[e^{i\pi} + 1 = 0\] Significado: Estabelece uma relação profunda entre cinco números fundamentais: \(e\), \(i\), \(\pi\), \(1\) e \(0\).

3. Equação de Regressão Linear Múltipla

A base para muitos modelos de análise de dados: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k + \epsilon\] Significado: Modela a relação entre uma variável dependente (\(Y\)) e múltiplas variáveis independentes (\(X\)), incluindo um termo de erro (\(\epsilon\)).

4. Transformada de Fourier

Fundamental para o processamento de sinais e áudio: \[\hat{f}(\xi) = \int_{-\infty}^{\infty} f(t) e^{-2\pi i t \xi} dt\] Significado: Decompõe uma função temporal (como um som) em suas frequências constituintes.

5. Divergência de Kullback-Leibler

Muito utilizada em Machine Learning para comparar distribuições: \[D_{KL}(P || Q) = \sum_{i} P(i) \log \left( \frac{P(i)}{Q(i)} \right)\] Significado: Mede a diferença ou a “perda de informação” entre uma distribuição de probabilidade real (\(P\)) e uma distribuição aproximada (\(Q\)).

5) Referências Bibliográficas

Nesta aba, listamos as principais obras e documentações que fundamentam o uso do R Markdown e as técnicas de manipulação de dados apresentadas neste relatório.

Wickham, H., & Grolemund, G. (2017). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media[cite: 1].
Xie, Y., Allaire, J. J., & Grolemund, G. (2018). R Markdown: The Definitive Guide. Chapman and Hall/CRC[cite: 1].
Xie, Y., Dervieux, C., & Riemer, E. (2020). R Markdown Cookbook. Chapman and Hall/CRC[cite: 1].
Silge, J., & Robinson, D. (2017). Text Mining with R: A Tidy Approach. O’Reilly Media[cite: 1].
RStudio Team (2024). DT: An R interface to the DataTables library. Disponível em: https://rstudio.github.io/DT/[cite: 1].

Relatório de Manipulação de Dados

Luis Felipe

2026-05-12