Neste relatório, utilizamos técnicas de ciência de dados (Skiena 2017) e Python (VanderPlas 2017).


1. Carregando o conjunto de dados

Vamos utilizar o conjunto de dados embutido no R chamado mtcars, que contém informações sobre consumo de combustível e características de diferentes modelos de carros.

# Carregando o dataset
data("mtcars")

# Exibindo as primeiras linhas
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

2. Manipulando os dados

Filtra os carros com mais de 100 cavalos de potência (hp), calcula o consumo em km por litro a partir de mpg, e organiza os resultados do mais econômico para o menos econômico.
dados_filtrados <- mtcars %>%
  filter(hp > 100) %>%
  mutate(km_por_litro = mpg * 0.425144) %>%
  arrange(desc(km_por_litro))

# Visualizando resultado
head(dados_filtrados)
##                 mpg cyl  disp  hp drat    wt  qsec vs am gear carb km_por_litro
## Lotus Europa   30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2    12.924378
## Hornet 4 Drive 21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1     9.098082
## Volvo 142E     21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2     9.098082
## Mazda RX4      21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4     8.928024
## Mazda RX4 Wag  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4     8.928024
## Ferrari Dino   19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6     8.375337
Estatísticas da nova variável
summary(dados_filtrados$km_por_litro)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   4.421   6.420   7.355   7.420   8.269  12.924

3. Plot do gráfico da relação entre potência e consumo

plot(dados_filtrados$hp, dados_filtrados$km_por_litro,
     main = "Relação entre Potência e Consumo",
     xlab = "Potência (hp)",
     ylab = "Consumo (km/l)",
     pch = 19, col = "darkblue")

4. Tabela Interativa

# Criando uma tabela interativa com DT

datatable(
  dados_filtrados,       # dataset a ser exibido
  options = list(
  pageLength = 5,      # número de linhas por página
  searchHighlight = TRUE,  # destaque na busca  
  autoWidth = TRUE
  ),
  caption = "Tabela Interativa de Carros Filtrados"
)

5. Equações Complexas

5.1 Fórmula de Euler

\[ e^{i\pi} + 1 = 0 \]

Significado:
Relaciona os cinco números mais importantes da matemática: \(e\), \(i\), \(\pi\), 1 e 0. É fundamental em análise complexa.


5.2 Equação de Schrödinger (dependente do tempo)

\[ i \hbar \frac{\partial}{\partial t} \Psi(\mathbf{r},t) = \hat{H} \Psi(\mathbf{r},t) \]

Significado:
Equação central da mecânica quântica, descreve a evolução temporal da função de onda \(\Psi\).


5.3 Transformada de Fourier

\[ \hat{f}(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i \omega t} dt \]

Significado:
Converte uma função do domínio do tempo para o domínio da frequência, muito usada em engenharia e física.


5.4 Equação de Navier-Stokes (fluido incompressível)

\[ \rho \left( \frac{\partial \mathbf{v}}{\partial t} + (\mathbf{v} \cdot \nabla) \mathbf{v} \right) = -\nabla p + \mu \nabla^2 \mathbf{v} + \mathbf{f} \]

Significado:
Descreve o movimento de fluidos viscosos. \(\mathbf{v}\) é a velocidade, \(p\) é pressão, \(\mu\) viscosidade, \(\rho\) densidade.


5.5 Equação de onda (1D)

\[ \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2} \]

Significado:
Modela a propagação de ondas (como som ou vibrações) em uma dimensão. \(c\) é a velocidade da onda.

6. Figuras em Ciência de Dados

Figura 1: Ciclo de vida de Data Science

Ciclo de vida de Data Science
Ciclo de vida de Data Science

Figura 2: 3 pilares de Data Science

3 pilares de Data Science
3 pilares de Data Science
Skiena, Steven S. 2017. The Data Science Design Manual. Springer Cham. https://link.springer.com/book/10.1007/978-3-319-55444-0.
VanderPlas, Jake. 2017. Python Data Science Handbook: Essential Tools for Working with Data. O’Reilly Media. https://www.oreilly.com/library/view/python-data-science/9781098121211/.