1. Dados e manipulação

#Exibindo sumário de conjunto mtcars
summary(mtcars)
##       mpg             cyl             disp             hp       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##       drat             wt             qsec             vs        
##  Min.   :2.760   Min.   :1.513   Min.   :14.50   Min.   :0.0000  
##  1st Qu.:3.080   1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000  
##  Median :3.695   Median :3.325   Median :17.71   Median :0.0000  
##  Mean   :3.597   Mean   :3.217   Mean   :17.85   Mean   :0.4375  
##  3rd Qu.:3.920   3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000  
##  Max.   :4.930   Max.   :5.424   Max.   :22.90   Max.   :1.0000  
##        am              gear            carb      
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

Carregando o conjunto de dados mtcars

# Carregando um conjunto mtcars
data <- mtcars

Manipulação de Dados

I. Ordenação dos dados por mpg (milhas por galão)

# Carregando pacote dplyr
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#Ordenando os dados de acordo com a coluna "mpg" em ordem descendente
data_sorted <- data %>% arrange(desc(mpg))

#Exibindo dataframe antes da ordenação
head(data)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
#Exibindo dataframe após ordenação
head(data_sorted)
##                 mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Toyota Corolla 33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Fiat 128       32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic    30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Lotus Europa   30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Fiat X1-9      27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2  26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2

II. Filtragem dos dados para selecionar apenas carros com 6 cilindros

#Filtrando carros com motores de 6 cilindros
data_filtered <- data_sorted %>% filter(cyl == 6)

#Exibindo dataframe filtrado
head(data_filtered)
##                 mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Hornet 4 Drive 21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Mazda RX4      21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Ferrari Dino   19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Merc 280       19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Valiant        18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1

2. Gráfico

library(DT)

datatable(data, options = list(pageLength = 5, autoWidth = TRUE))

3. Fórmulas

Transformada de Fourier

\[F(\epsilon) = \int_{-\infty}^{\infty} f(x) e^{-i 2 \pi \epsilon x} \, dx\]

A fórmula acima é a transformada de fourier, que possui aplicações em diversas áreas. Ela é utilizada para decompor um sinal analógico em suas frequências constituintes.

Fórmula Quadrática

\[ x= \frac{-b \pm \sqrt-4ac}{2a}\]

A fórmula acima é a fórmula quadrática ou fórmula de Bhaskara. Ela é utilizada para encontrar as soluções de uma equação quadrática.

Equação de momentum de Cauchy

\[ \frac{D \textbf{u}}{D t} = \frac{1}{\rho} \nabla \cdot \sigma + \textbf{f}\]

A equação acima é a versão escrita em forma convectiva utilizada para descrever o transporte de momentum em um meio contínuo (continuum).

Distância de dois pontos em sistema de coordenadas esférico

\[ \textbf{D} = \sqrt {r^2 + r'^2 - 2rr'(\sin\theta \sin \theta' \cos(\varphi - \varphi')+\cos\theta\cos\theta')}\]

A equação acima é utilizada para calcular a distância entre dois pontos r e r’ em um sistema de cordenadas esférico.

Fórmula do Desvio Padrão

\[ \sigma = \sqrt{\frac{\sum(x_i - \mu)^2}{N}}\]

A equação acima é utilizada para calcular o desvio padrão de uma amostra populacional.

4. Figuras relacionadas a ciência de dados

Primeira Figura. Segunda Figura.

5. Referências

Goodfellow, Ian. 2016. Deep Learning. MIT Press.
Hastie, T., R. Tibshirani, and J. H. Friedman. 2009. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Series in Statistics. Springer.
James, Gareth, Daniela Witten, Trevor Hastie, Robert Tibshirani, et al. 2013. An Introduction to Statistical Learning. Vol. 112. Springer.
Peng, Roger D. 2016. R Programming for Data Science. Leanpub Victoria, BC, Canada.
Wickham, H., and G. Grolemund. 2016. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media. https://books.google.com.br/books?id=vfi3DQAAQBAJ.