Seções

1. Carregamento e Manipulação de Dados

Importando as bibliotecas necessárias:

library(dplyr)
library(ggplot2)
library(DT)

Utilizamos o dataset mtcars, adicionamos uma nova variável kmpl (milhas por galão para km/L) e ordenamos os carros pelo consumo.

data <- mtcars %>%
  mutate(kmpl = mpg * 0.425144) %>%
  arrange(desc(kmpl))

data
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
##                          kmpl
## Toyota Corolla      14.412382
## Fiat 128            13.774666
## Honda Civic         12.924378
## Lotus Europa        12.924378
## Fiat X1-9           11.606431
## Porsche 914-2       11.053744
## Merc 240D           10.373514
## Datsun 710           9.693283
## Merc 230             9.693283
## Toyota Corona        9.140596
## Hornet 4 Drive       9.098082
## Volvo 142E           9.098082
## Mazda RX4            8.928024
## Mazda RX4 Wag        8.928024
## Ferrari Dino         8.375337
## Merc 280             8.162765
## Pontiac Firebird     8.162765
## Hornet Sportabout    7.950193
## Valiant              7.695106
## Merc 280C            7.567563
## Merc 450SL           7.354991
## Merc 450SE           6.972362
## Ford Pantera L       6.717275
## Dodge Challenger     6.589732
## Merc 450SLC          6.462189
## AMC Javelin          6.462189
## Maserati Bora        6.377160
## Chrysler Imperial    6.249617
## Duster 360           6.079559
## Camaro Z28           5.654415
## Cadillac Fleetwood   4.421498
## Lincoln Continental  4.421498
summary(data)
##       mpg             cyl             disp             hp       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##       drat             wt             qsec             vs        
##  Min.   :2.760   Min.   :1.513   Min.   :14.50   Min.   :0.0000  
##  1st Qu.:3.080   1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000  
##  Median :3.695   Median :3.325   Median :17.71   Median :0.0000  
##  Mean   :3.597   Mean   :3.217   Mean   :17.85   Mean   :0.4375  
##  3rd Qu.:3.920   3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000  
##  Max.   :4.930   Max.   :5.424   Max.   :22.90   Max.   :1.0000  
##        am              gear            carb            kmpl       
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000   Min.   : 4.421  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000   1st Qu.: 6.558  
##  Median :0.0000   Median :4.000   Median :2.000   Median : 8.163  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812   Mean   : 8.541  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000   3rd Qu.: 9.693  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000   Max.   :14.412

2. Tabela Interativa

datatable(data, options = list(pageLength = 5, autoWidth = TRUE))

3. Equações Matemáticas (LaTeX)

Cinco equações e seus significados:

  1. Fórmula da regressão linear: \[ y = \beta_0 + \beta_1 x + \epsilon \] Explicação: Modelo básico de regressão linear.

  2. Fórmula da entropia em teoria da informação: \[ H(X) = - \sum_{i=1}^{n} p(x_i) \log_2 p(x_i) \] Explicação: Mede a incerteza de uma distribuição.

  3. Média e desvio padrão: \[ \mu = \frac{1}{N} \sum_{i=1}^{N} x_i \] \[ \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2} \] Explicação: Representam tendência central e dispersão.

  4. Distribuição Normal: \[ f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \] Explicação: Modelo estatístico de dados contínuos.

  5. Cálculo da correlação de Pearson: \[ r = \frac{\sum (x_i - \mu_x)(y_i - \mu_y)}{\sqrt{\sum (x_i - \mu_x)^2 \sum (y_i - \mu_y)^2}} \] Explicação: Mede a relação entre duas variáveis.

4. Figuras Relacionadas à Ciência de Dados

Representação de uma rede neural artificial, um modelo amplamente utilizado em aprendizado de máquina:

Figura 1: Exemplo de funcionamento de um tipo de Rede Neural Artificial.
Figura 1: Exemplo de funcionamento de um tipo de Rede Neural Artificial.

Exemplo de árvore de decisão, um algoritmo usado para classificação e regressão:

Figura 2: Exemplo de funcionamento de uma árvore de decisão no contexto de decisão de escolha de carro
Figura 2: Exemplo de funcionamento de uma árvore de decisão no contexto de decisão de escolha de carro

5. Referências Bibliográficas

Sant, Sant, and Sant (2023)

James et al. (2013)

Wickham (2016)

McKinney (2012)

Hastie, Tibshirani, and Friedman (2009)

Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. 2009. The Elements of Statistical Learning. Springer.
James, Gareth, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2013. An Introduction to Statistical Learning. Springer.
McKinney, Wes. 2012. Python for Data Analysis. O’Reilly Media.
Sant, Fabiano Parolin, Irani Parolin Sant, and Claudinei de Camargo Sant. 2023. “Uma Utilização Do Chat GPT No Ensino.” Com a Palavra, O Professor 8 (20): 74–86.
Wickham, Hadley. 2016. Ggplot2: Elegant Graphics for Data Analysis. Springer.