1 Manipulação de Dados

1.1 Carregamento e Visualização Inicial

Foi utilizado o conjunto de dados mtcars, que já está disponível por padrão no R.

data("mtcars")
head(mtcars)

1.2 Criação de Novas Variáveis

Cria uma nova variável chamada km_litro, convertendo milhas por galão (mpg) para quilômetros por litro.

mtcars$km_litro <- mtcars$mpg * 0.425144

1.3 Filtragem

Filtra apenas os carros que fazem mais de 20 milhas por galão.

mtcars_filtro <- subset(mtcars, mpg > 20)

1.4 Ordenação

Ordena os carros filtrados de acordo com o consumo (km/litro), em ordem decrescente.

mtcars_ordem <- mtcars_filtro[order(-mtcars_filtro$km_litro), ]
head(mtcars_ordem)

2 Tabela Interativa com DT

library(DT)

datatable(mtcars_ordem,
          options = list(pageLength = 5),
          caption = "Tabela interativa com os carros mais econômicos (mais de 20 mpg)")

3 Equações com LaTeX

3.1 Equação 1: Média

Representa a média aritmética de um conjunto de valores. \[ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

3.2 Equação 2: Variância

Mede a dispersão dos dados em relação à média. \[ \sigma^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]

3.3 Equação 3: Regressão Linear Simples

Modelo de regressão linear onde y é a variável dependente e x a independente. \[ y = \beta_0 + \beta_1 x + \epsilon \]

3.4 Equação 4: Entropia (Teoria da Informação)

Quantifica a incerteza de uma variável aleatória discreta. \[ H(X) = - \sum_{i=1}^{n} p(x_i) \log_2 p(x_i) \]

3.5 Equação 5: Função de Ativação Sigmóide

Muito usada em redes neurais para mapear saídas entre 0 e 1. \[ \sigma(x) = \frac{1}{1 + e^{-x}} \]

4 Figuras Relacionadas à Ciência de Dados

Ciclo de vida de ciência de dados.

Rede neural profunda.

5 Referências Bibliográficas

(James et al. 2013) (Wickham and Grolemund 2017) (Fang and Lin 2008) (Eberhart and Dobbins 1990) (Getoor 2019)

Eberhart, R. C., and R. W. Dobbins. 1990. “Early Neural Network Development History: The Age of Camelot.” IEEE Engineering in Medicine and Biology Magazine 9 (3): 15–18. https://doi.org/10.1109/51.59207.
Fang, Shih-Hau, and Tsung-Nan Lin. 2008. “Indoor Location System Based on Discriminant-Adaptive Neural Network in IEEE 802.11 Environments.” IEEE Transactions on Neural Networks 19 (11): 1973–78. https://doi.org/10.1109/TNN.2008.2005494.
Getoor, Lise. 2019. “Responsible Data Science.” In 2019 IEEE International Conference on Big Data (Big Data), 1–1. https://doi.org/10.1109/BigData47090.2019.9006129.
James, Gareth, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2013. An Introduction to Statistical Learning. Springer.
Wickham, Hadley, and Garrett Grolemund. 2017. R for Data Science. O’Reilly Media.