Introdução

Relatório usando várias funcionalidades em R Markdown

Trabalhando em R Markdown

1. Fazendo manipulações simples

## Carregamento dos dados
mr_robot_data <- data.frame(
  episode_number = 1:10,
  title = c("eps1.0_hellofriend.mov", "eps1.1_ones-and-zer0es.mpeg", 
            "eps1.2_d3bug.mkv", "eps1.3_da3m0ns.mp4", "eps1.4_3xpl0its.wmv", 
            "eps1.5_br4ve-trave1er.asf", "eps1.6_v1ew-s0urce.flv", 
            "eps1.7_wh1ter0se.m4v", "eps1.8_m1rr0r1ng.qt", "eps1.9_zer0-day.avi"),
  imdb_rating = c(9.2, 8.5, 8.8, 8.9, 8.7, 8.6, 9.0, 9.1, 8.9, 9.4),
  viewers_millions = c(1.75, 1.53, 1.57, 1.65, 1.60, 1.58, 1.63, 1.70, 1.68, 1.85),
  runtime_minutes = c(64, 47, 48, 49, 45, 46, 47, 50, 49, 51)
)

head(mr_robot_data)
##   episode_number                       title imdb_rating viewers_millions
## 1              1      eps1.0_hellofriend.mov         9.2             1.75
## 2              2 eps1.1_ones-and-zer0es.mpeg         8.5             1.53
## 3              3            eps1.2_d3bug.mkv         8.8             1.57
## 4              4          eps1.3_da3m0ns.mp4         8.9             1.65
## 5              5         eps1.4_3xpl0its.wmv         8.7             1.60
## 6              6   eps1.5_br4ve-trave1er.asf         8.6             1.58
##   runtime_minutes
## 1              64
## 2              47
## 3              48
## 4              49
## 5              45
## 6              46
# Filtrar episódios com rating acima de 9.0
high_rated_episodes <- mr_robot_data[mr_robot_data$imdb_rating > 9.0, ]

# Ordenar por número de visualizações em milhões de forma decrescente
high_rated_episodes <- high_rated_episodes[order(high_rated_episodes$viewers_millions, decreasing = TRUE), ]

# Criar uma nova variável: duração em horas
high_rated_episodes$duration_hours <- high_rated_episodes$runtime_minutes / 60

# Visualizar os dados manipulados
high_rated_episodes
##    episode_number                  title imdb_rating viewers_millions
## 10             10    eps1.9_zer0-day.avi         9.4             1.85
## 1               1 eps1.0_hellofriend.mov         9.2             1.75
## 8               8   eps1.7_wh1ter0se.m4v         9.1             1.70
##    runtime_minutes duration_hours
## 10              51      0.8500000
## 1               64      1.0666667
## 8               50      0.8333333

2. Tabela iterativa

3. Equações Complexas usando Rmd

1. Equação do Segundo Grau

\(x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}\)

Esta fórmula é usada para encontrar as soluções de uma equação do segundo grau. Ajuda a determinar os valores de x onde a equação atinge zero.

2. Série de Fourier

\(f(x) = a_0 + \sum_{n=1}^{\infty} \left( a_n \cos \frac{2\pi nx}{T} + b_n \sin \frac{2\pi nx}{T} \right)\)

Esta equação decompõe qualquer função periódica em uma soma de ondas senoidais e cossenoidais. Ela é útil para analisar sinais repetitivos, como ondas sonoras.

3. Equação da Onda

\(\frac{\partial^2 u}{\partial t^2} = c^2 \nabla^2 u\)

Esta equação descreve como as ondas, como som ou luz, se movem através de um espaço. Basicamente, ajuda a entender o comportamento das ondas em diferentes meios.

4. Teorema de Bayes

\(P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\)

O teorema de Bayes ajuda a atualizar a probabilidade de algo acontecer com base em novas informações. É muito usado em estatísticas, como para prever resultados a partir de evidência

5. Transformada de Laplace

\(\mathcal{L}\{f(t)\} = F(s) = \int_{0}^{\infty} e^{-st} f(t) \, dt\)

Esta equação transforma uma função do tempo em uma função no domínio da frequência. É muito útil para resolver equações diferenciais, especialmente em engenharia elétrica.

4. Figuras sobre Ciência de dados

US Auto Sales Data Science vs Data engineer

5. Referências

  • (Wickham and Grolemund 2016)
  • (Gelman et al. 2014)
  • (Hastie, Tibshirani, and Friedman 2009)
  • (Manning, Raghavan, and Schütze 2008)
  • (Van Der Walt, Colbert, and Varoquaux 2011)
Gelman, Andrew, John B Carlin, Hal S Stern, David B Dunson, Aki Vehtari, and Donald B Rubin. 2014. “Bayesian Data Analysis.” CRC Press.
Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. 2009. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Science & Business Media.
Manning, Christopher D, Prabhakar Raghavan, and Hinrich Schütze. 2008. Introduction to Information Retrieval. Cambridge University Press.
Van Der Walt, Stefan, S Chris Colbert, and Gael Varoquaux. 2011. “The NumPy Array: A Structure for Efficient Numerical Computation.” Computing in Science & Engineering 13 (2): 22–30.
Wickham, Hadley, and Garrett Grolemund. 2016. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media, Inc.