CPAD - Atividade Rmarkdown

Atividades

Dataset cars com desaceleração

Aqui modificaremos o dataset “cars” que já vem por padrão no Rstudio, o “cars” vem com os valores de velocidade (speed) e distância (dist). Iremos começar por adicionar uma nova coluna chamada “carros” em que serão distribuídas algumas marcas de carros aos valores arbitrariamente.

library(dplyr) # pacote dplyr para melhor orgaização
data <- cars
data <- data %>%
  mutate(
    carros = sample(c("Gol", "Fiat", "Ford", "Jeep", "Toyota"), size = n(), replace = TRUE)
  )
##   speed dist carros
## 1     4    2   Fiat
## 2     4   10   Fiat
## 3     7    4 Toyota
## 4     7   22 Toyota
## 5     8   16 Toyota
## 6     9   10   Jeep


Ao olhar os detalhes do dataset (?cars) podemos ver que a velocidade está em milhas por hora (mph) e a distância (dada em pés) é a distância para parar o carro de acordo com a velocidade. Com esses valores podemos calcular a desaceleração do carro, mas para isso precisamos converter a velocidade para metros por segundo e a distância para metros.

mph_para_ms <- 0.44704  # 1 milha por hora = 0.44704 metros por segundo
pes_para_m <- 0.3048    # 1 pé = 0.3048 metros

data <- data %>%
  mutate(
    velocidade_ms = speed * mph_para_ms, # convertendo para metros por segundo
    distancia_m = dist * pes_para_m,     # convertendo para metros
    desaceleracao_ms2 = (-velocidade_ms^2) / (2 * distancia_m) # utilizando a formula de desaceleração
  )
##   speed dist carros velocidade_ms distancia_m desaceleracao_ms2
## 1     4    2   Fiat       1.78816      0.6096        -2.6226347
## 2     4   10   Fiat       1.78816      3.0480        -0.5245269
## 3     7    4 Toyota       3.12928      1.2192        -4.0159093
## 4     7   22 Toyota       3.12928      6.7056        -0.7301653
## 5     8   16 Toyota       3.57632      4.8768        -1.3113173
## 6     9   10   Jeep       4.02336      3.0480        -2.6554176


Agora para finalizar precisamos apenas limpar nossa tabela! Iremos mover a coluna de carros para o começo (para ficar mais fácil de visualizar) e remover as colunas de speed e dist, pois já temos as mesmas convertidas para medidadas que utilizamos.

data <- data %>% select(3, everything())
data <- data %>% select(-speed, -dist)
##   carros velocidade_ms distancia_m desaceleracao_ms2
## 1   Fiat       1.78816      0.6096        -2.6226347
## 2   Fiat       1.78816      3.0480        -0.5245269
## 3 Toyota       3.12928      1.2192        -4.0159093
## 4 Toyota       3.12928      6.7056        -0.7301653
## 5 Toyota       3.57632      4.8768        -1.3113173
## 6   Jeep       4.02336      3.0480        -2.6554176


Com isso temos um dataset com a desaceleração dos carros! Para verificá-lo melhor veja a tabela na outra aba.

Tabela cars

Aqui temos o dataset completo após ser modificado.

Equações LaTex

Aqui vemos algumas equações matemáticas complexas, vamos dar uma olhada!

Definição Limite da Derivada



\[f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h}\]
Essa é a definição de uma derivada em cálculo. Ela representa a taxa de variação instantânea de uma função \(f(x)\) em um ponto \(x\).

\(f'(x)\) é a derivada.

\(\lim_{h \to 0}\) significa “o limite quando \(h\) se aproxima de zero”.

A fração \(\frac{f(x+h) - f(x)}{h}\) representa a inclinação da reta secante que passa por dois pontos da curva. Ao tomar o limite, encontramos a inclinação da reta tangente à curva naquele ponto.

Desvio Padrão Populacional



\[\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}\]

Esta fórmula calcula o desvio padrão (sigma, \(\sigma\)) de uma população inteira. É a medida mais comum de dispersão ou “espalhamento” dos dados em relação à média.

\(N\) é o tamanho total da população.

\(\mu\) (mu) é a média da população.

\(x_i\) é cada valor individual.

\(\sum\) é o símbolo de somatório.

A fórmula calcula a média dos quadrados das distâncias de cada ponto até a média, e então tira a raiz quadrada para retornar à unidade original dos dados.

Lei da Gravitação Universal de Newton



\[F = G \frac{m_1 m_2}{r^2}\]

A seguinte lei descreve a força de atração gravitacional (\(F\)) entre duas massas (\(m_1\) e \(m_2\)).

\(G\) é a constante gravitacional universal.

\(r\) é a distância entre os centros das duas massas.

A equação mostra que a força é diretamente proporcional ao produto das massas (quanto mais massa, mais força) e inversamente proporcional ao quadrado da distância (a força diminui rapidamente com o aumento da distância).

Fórmula Quadrática



\[x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}\]

A classica fórmula (que vive de graça na cabeça de todo mundo) fornece as soluções (raízes) para qualquer equação quadrática na forma \(ax^2 + bx + c = 0\). O termo dentro da raiz quadrada, \(b^2 - 4ac\), é chamado de discriminante (Delta, \(\Delta\)), que determina a natureza das raízes (reais ou complexas).

Equações de Campo de Einstein (Relatividade Geral)



\[R_{\mu\nu} - \frac{1}{2}R g_{\mu\nu} = \frac{8\pi G}{c^4} T_{\mu\nu}\]

Essa aqui é a equação central da Teoria da Relatividade Geral de Albert Einstein. Ela descreve a interação fundamental da gravitação como resultado da curvatura do espaço-tempo causada pela matéria e energia.

O lado esquerdo representa a geometria do espaço-tempo (o tensor de curvatura de Ricci \(R_{\mu\nu}\), o escalar de curvatura \(R\), e o tensor métrico \(g_{\mu\nu}\)).

O lado direito representa o conteúdo de matéria e energia do espaço-tempo (o tensor de energia-momento \(T_{\mu\nu}\)), com as constantes \(G\) (gravitacional) e \(c\) (velocidade da luz).

Em suma, a equação diz: “A matéria diz ao espaço-tempo como se curvar, e o espaço-tempo diz à matéria como se mover.”

Imagens da ciência de dados

Aqui estão algumas curiosidades sobre ciência de dados!


Trilha da ciência de dados
Trilha da ciência de dados
Informações sobre o ciêntista de dados
Informações sobre o ciêntista de dados

Bibliografias

Aqui temos algumas bibliografias interessates

Artigo: Vaswani et al. (2017)

Livro: Fudenberg and Tirole (1991)

Incollection: Wickham (2016)

Livro: Zhou (2021)

Artigo: Allcott and Gentzkow (2017)

Allcott, Hunt, and Matthew Gentzkow. 2017. “Social Media and Fake News in the 2016 Election.” Journal of Economic Perspectives 31 (2): 211–36.
Fudenberg, Drew, and Jean Tirole. 1991. Game Theory. MIT press.
Vaswani, Ashish, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser, and Illia Polosukhin. 2017. “Attention Is All You Need.” Advances in Neural Information Processing Systems 30.
Wickham, Hadley. 2016. “Data Analysis.” In Ggplot2: Elegant Graphics for Data Analysis, 189–201. Springer.
Zhou, Zhi-Hua. 2021. Machine Learning. Springer nature.