Introdução

Relatório usando várias funcionalidades em R Markdown

Trabalhando em R Markdown

1. Fazendo manipulações simples

## Carregamento dos dados
mr_robot_data <- data.frame(
  episode_number = 1:10,
  title = c("eps1.0_hellofriend.mov", "eps1.1_ones-and-zer0es.mpeg", 
            "eps1.2_d3bug.mkv", "eps1.3_da3m0ns.mp4", "eps1.4_3xpl0its.wmv", 
            "eps1.5_br4ve-trave1er.asf", "eps1.6_v1ew-s0urce.flv", 
            "eps1.7_wh1ter0se.m4v", "eps1.8_m1rr0r1ng.qt", "eps1.9_zer0-day.avi"),
  imdb_rating = c(9.2, 8.5, 8.8, 8.9, 8.7, 8.6, 9.0, 9.1, 8.9, 9.4),
  viewers_millions = c(1.75, 1.53, 1.57, 1.65, 1.60, 1.58, 1.63, 1.70, 1.68, 1.85),
  runtime_minutes = c(64, 47, 48, 49, 45, 46, 47, 50, 49, 51)
)

head(mr_robot_data)

##   episode_number                       title imdb_rating viewers_millions
## 1              1      eps1.0_hellofriend.mov         9.2             1.75
## 2              2 eps1.1_ones-and-zer0es.mpeg         8.5             1.53
## 3              3            eps1.2_d3bug.mkv         8.8             1.57
## 4              4          eps1.3_da3m0ns.mp4         8.9             1.65
## 5              5         eps1.4_3xpl0its.wmv         8.7             1.60
## 6              6   eps1.5_br4ve-trave1er.asf         8.6             1.58
##   runtime_minutes
## 1              64
## 2              47
## 3              48
## 4              49
## 5              45
## 6              46

# Filtrar episódios com rating acima de 9.0
high_rated_episodes <- mr_robot_data[mr_robot_data$imdb_rating > 9.0, ]

# Ordenar por número de visualizações em milhões de forma decrescente
high_rated_episodes <- high_rated_episodes[order(high_rated_episodes$viewers_millions, decreasing = TRUE), ]

# Criar uma nova variável: duração em horas
high_rated_episodes$duration_hours <- high_rated_episodes$runtime_minutes / 60

# Visualizar os dados manipulados
high_rated_episodes

##    episode_number                  title imdb_rating viewers_millions
## 10             10    eps1.9_zer0-day.avi         9.4             1.85
## 1               1 eps1.0_hellofriend.mov         9.2             1.75
## 8               8   eps1.7_wh1ter0se.m4v         9.1             1.70
##    runtime_minutes duration_hours
## 10              51      0.8500000
## 1               64      1.0666667
## 8               50      0.8333333

2. Tabela iterativa

3. Equações Complexas usando Rmd

1. Equação do Segundo Grau

\(x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}\)

Esta fórmula é usada para encontrar as soluções de uma equação do segundo grau. Ajuda a determinar os valores de x onde a equação atinge zero.

2. Série de Fourier

\(f(x) = a_0 + \sum_{n=1}^{\infty} \left( a_n \cos \frac{2\pi nx}{T} + b_n \sin \frac{2\pi nx}{T} \right)\)

Esta equação decompõe qualquer função periódica em uma soma de ondas senoidais e cossenoidais. Ela é útil para analisar sinais repetitivos, como ondas sonoras.

3. Equação da Onda

\(\frac{\partial^2 u}{\partial t^2} = c^2 \nabla^2 u\)

Esta equação descreve como as ondas, como som ou luz, se movem através de um espaço. Basicamente, ajuda a entender o comportamento das ondas em diferentes meios.

4. Teorema de Bayes

\(P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\)

O teorema de Bayes ajuda a atualizar a probabilidade de algo acontecer com base em novas informações. É muito usado em estatísticas, como para prever resultados a partir de evidência

5. Transformada de Laplace

\(\mathcal{L}\{f(t)\} = F(s) = \int_{0}^{\infty} e^{-st} f(t) \, dt\)

Esta equação transforma uma função do tempo em uma função no domínio da frequência. É muito útil para resolver equações diferenciais, especialmente em engenharia elétrica.

4. Figuras sobre Ciência de dados

US Auto Sales Data Science vs Data engineer

5. Referências

(Wickham and Grolemund 2016)
(Gelman et al. 2014)
(Hastie, Tibshirani, and Friedman 2009)
(Manning, Raghavan, and Schütze 2008)
(Van Der Walt, Colbert, and Varoquaux 2011)

Gelman, Andrew, John B Carlin, Hal S Stern, David B Dunson, Aki Vehtari, and Donald B Rubin. 2014. “Bayesian Data Analysis.” CRC Press.

Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. 2009. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Science & Business Media.

Manning, Christopher D, Prabhakar Raghavan, and Hinrich Schütze. 2008. Introduction to Information Retrieval. Cambridge University Press.

Van Der Walt, Stefan, S Chris Colbert, and Gael Varoquaux. 2011. “The NumPy Array: A Structure for Efficient Numerical Computation.” Computing in Science & Engineering 13 (2): 22–30.

Wickham, Hadley, and Garrett Grolemund. 2016. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media, Inc.

Relatório de Análise de Dados