Introdução

Este relatório foi desenvolvido como parte da atividade prática de Ciência de Dados com o objetivo de demonstrar o uso de R Markdown para integrar código, equações matemáticas (LaTeX), tabelas interativas, imagens e referências bibliográficas.


Seções do Relatório


Manipulação de Dados

Carregando o dataset

data("mtcars")
head(mtcars)

O dataset mtcars contém 32 observações e 11 variáveis sobre automóveis, incluindo medidas de desempenho e eficiência.

Manipulação dos dados

Aqui aplicamos três transformações simples:

  1. Filtramos carros com hp > 100
  2. Criamos a variável eficiencia = mpg / wt
  3. Ordenamos os resultados por eficiência (decrescente)
mtcars_mod <- mtcars %>%
  filter(hp > 100) %>%
  mutate(eficiencia = mpg / wt) %>%
  arrange(desc(eficiencia))

head(mtcars_mod)

Análise dos resultados

Os carros mais eficientes são mais leves e com bom consumo (milhas por galão).
O uso de dplyr facilita a manipulação e análise dos dados com clareza e reprodutibilidade.


Tabela Interativa com DT

Agora apresentamos o mesmo dataset manipulado, mas de forma interativa usando o pacote DT.
É possível ordenar, filtrar e navegar pelas páginas.

datatable(
  mtcars_mod,
  options = list(pageLength = 5, autoWidth = TRUE),
  caption = "Tabela 1: Conjunto de dados mtcars após manipulação."
)

Equações Matemáticas em LaTeX

(1) Regressão Linear

\[ y = \beta_0 + \beta_1x + \varepsilon \] Modela a relação linear entre uma variável dependente \(y\) e uma variável independente \(x\).

(2) Função Sigmoide

\[ \sigma(x) = \frac{1}{1 + e^{-x}} \] Utilizada em classificadores binários para limitar a saída ao intervalo [0,1].

(3) Entropia de Shannon

\[ H(X) = -\sum_{i=1}^n p(x_i)\log_2 p(x_i) \] Mede a incerteza ou desordem de uma variável aleatória discreta \(X\).

(4) Erro Quadrático Médio (MSE)

\[ J(\theta) = \frac{1}{2m}\sum_{i=1}^m (\hat{y}_i - y_i)^2 \] Função de custo usada em regressão para minimizar o erro entre previsão e valor real.

(5) Gradiente Descendente

\[ \theta_j := \theta_j - \alpha \frac{\partial J(\theta)}{\partial \theta_j} \] Equação de atualização usada para otimizar os parâmetros do modelo.

Figuras Relacionadas à Ciência de Dados

Figura 1 – Passos do Machine Learning

Figura 2 – Áreas da Ciência de Dados

Essas figuras representam asáreas que englobam a ciência de dados e o fluxo de trabalho do aprendizado de máquina.


Referências Bibliográficas

  1. VENTURA, Thiago M.; GOMES, Raphael S. R.; PEDROSO, Gabriel S. G.; VECCHIATO, Daniel A.; REZENDE, Rebeca L.. Estimativa da Ocupação de Leitos para Tratamento da COVID-19 Usando Dados Temporais. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 25. , 2025, Porto Alegre/RS. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 24-31. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2025.6909.\

  2. FOPPA, Alexandre Augusto; BARBOSA, Jorge Luis Vitória. Um Modelo Computacional para Análise de Depressão em Dados de Redes Sociais. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 25. , 2025, Porto Alegre/RS. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 92-103. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2025.6939.\

  3. SILVA, Bruno Pires M.; BERTON, Lilian. Analyzing the Trade-off Between Fairness and Model Performance in Supervised Learning: A Case Study in the MIMIC dataset. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 25. , 2025, Porto Alegre/RS. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 212-223. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2025.6994.\

  4. SILVA, Carla Estefany Caetano; TREVISAN, Daniela Gorski; SAADE, Débora Christina Muchaluat. Análise de Sinais Cerebrais para Detecção de Níveis de Atenção em Jogos Digitais. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 25. , 2025, Porto Alegre/RS. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 557-568. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2025.7576.\

  5. DIAS, Felipe M.; RIBEIRO, Estela; SOARES, Quenaz B.; KRIEGER, Jose E.; GUTIERREZ, Marco A.. Predicting Age and Sex from Reduced Lead Electrocardiograms using Deep Learning. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 25. , 2025, Porto Alegre/RS. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 653-664. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2025.7705.


Conclusão

Este relatório demonstrou o uso integrado de manipulação de dados, visualização interativa, equações matemáticas e formatação profissional no R Markdown, pronto para publicação no RPubs.