Aqui modificaremos o dataset “cars” que já vem por padrão no Rstudio,
o “cars” vem com os valores de velocidade (speed) e distância (dist).
Iremos começar por adicionar uma nova coluna chamada “carros” em que
serão distribuídas algumas marcas de carros aos valores arbitrariamente.
library(dplyr) # pacote dplyr para melhor orgaização
data <- cars
data <- data %>%
mutate(
carros = sample(c("Gol", "Fiat", "Ford", "Jeep", "Toyota"), size = n(), replace = TRUE)
)
## speed dist carros
## 1 4 2 Fiat
## 2 4 10 Fiat
## 3 7 4 Toyota
## 4 7 22 Toyota
## 5 8 16 Toyota
## 6 9 10 Jeep
Ao olhar os detalhes do dataset (?cars) podemos ver que a velocidade
está em milhas por hora (mph) e a distância (dada em pés) é a distância
para parar o carro de acordo com a velocidade. Com esses valores podemos
calcular a desaceleração do carro, mas para isso precisamos converter a
velocidade para metros por segundo e a distância para metros.
mph_para_ms <- 0.44704 # 1 milha por hora = 0.44704 metros por segundo
pes_para_m <- 0.3048 # 1 pé = 0.3048 metros
data <- data %>%
mutate(
velocidade_ms = speed * mph_para_ms, # convertendo para metros por segundo
distancia_m = dist * pes_para_m, # convertendo para metros
desaceleracao_ms2 = (-velocidade_ms^2) / (2 * distancia_m) # utilizando a formula de desaceleração
)
## speed dist carros velocidade_ms distancia_m desaceleracao_ms2
## 1 4 2 Fiat 1.78816 0.6096 -2.6226347
## 2 4 10 Fiat 1.78816 3.0480 -0.5245269
## 3 7 4 Toyota 3.12928 1.2192 -4.0159093
## 4 7 22 Toyota 3.12928 6.7056 -0.7301653
## 5 8 16 Toyota 3.57632 4.8768 -1.3113173
## 6 9 10 Jeep 4.02336 3.0480 -2.6554176
Agora para finalizar precisamos apenas limpar nossa tabela! Iremos
mover a coluna de carros para o começo (para ficar mais fácil de
visualizar) e remover as colunas de speed e dist, pois já temos as
mesmas convertidas para medidadas que utilizamos.
data <- data %>% select(3, everything())
data <- data %>% select(-speed, -dist)
## carros velocidade_ms distancia_m desaceleracao_ms2
## 1 Fiat 1.78816 0.6096 -2.6226347
## 2 Fiat 1.78816 3.0480 -0.5245269
## 3 Toyota 3.12928 1.2192 -4.0159093
## 4 Toyota 3.12928 6.7056 -0.7301653
## 5 Toyota 3.57632 4.8768 -1.3113173
## 6 Jeep 4.02336 3.0480 -2.6554176
Com isso temos um dataset com a desaceleração dos carros! Para
verificá-lo melhor veja a tabela na outra aba.
Aqui temos o dataset completo após ser modificado.
Aqui vemos algumas equações matemáticas complexas, vamos dar uma
olhada!
\[f'(x) = \lim_{h \to 0} \frac{f(x+h)
- f(x)}{h}\]
Essa é a definição de uma derivada em cálculo.
Ela representa a taxa de variação instantânea de uma função \(f(x)\) em um ponto \(x\).
\(f'(x)\) é a derivada.
\(\lim_{h \to 0}\) significa “o
limite quando \(h\) se aproxima de
zero”.
A fração \(\frac{f(x+h) - f(x)}{h}\)
representa a inclinação da reta secante que passa por dois pontos da
curva. Ao tomar o limite, encontramos a inclinação da reta tangente à
curva naquele ponto.
\[\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N
(x_i - \mu)^2}\]
Esta fórmula calcula o desvio padrão (sigma, \(\sigma\)) de uma população inteira. É a
medida mais comum de dispersão ou “espalhamento” dos dados em relação à
média.
\(N\) é o tamanho total da
população.
\(\mu\) (mu) é a média da população.
\(x_i\) é cada valor individual.
\(\sum\) é o símbolo de somatório.
A fórmula calcula a média dos quadrados das distâncias de cada ponto
até a média, e então tira a raiz quadrada para retornar à unidade
original dos dados.
\[F = G \frac{m_1 m_2}{r^2}\]
A seguinte lei descreve a força de atração gravitacional (\(F\)) entre duas massas (\(m_1\) e \(m_2\)).
\(G\) é a constante gravitacional
universal.
\(r\) é a distância entre os centros
das duas massas.
A equação mostra que a força é diretamente proporcional ao produto
das massas (quanto mais massa, mais força) e inversamente proporcional
ao quadrado da distância (a força diminui rapidamente com o aumento da
distância).
\[x = \frac{-b \pm \sqrt{b^2 -
4ac}}{2a}\]
A classica fórmula (que vive de graça na cabeça de todo mundo)
fornece as soluções (raízes) para qualquer equação quadrática na forma
\(ax^2 + bx + c = 0\). O termo dentro
da raiz quadrada, \(b^2 - 4ac\), é
chamado de discriminante (Delta, \(\Delta\)), que determina a natureza das
raízes (reais ou complexas).
\[R_{\mu\nu} - \frac{1}{2}R g_{\mu\nu} =
\frac{8\pi G}{c^4} T_{\mu\nu}\]
Essa aqui é a equação central da Teoria da Relatividade Geral de
Albert Einstein. Ela descreve a interação fundamental da gravitação como
resultado da curvatura do espaço-tempo causada pela matéria e energia.
O lado esquerdo representa a geometria do espaço-tempo (o tensor de
curvatura de Ricci \(R_{\mu\nu}\), o
escalar de curvatura \(R\), e o tensor
métrico \(g_{\mu\nu}\)).
O lado direito representa o conteúdo de matéria e energia do
espaço-tempo (o tensor de energia-momento \(T_{\mu\nu}\)), com as constantes \(G\) (gravitacional) e \(c\) (velocidade da luz).
Em suma, a equação diz: “A matéria diz ao espaço-tempo como se curvar, e o espaço-tempo diz à matéria como se mover.”
Aqui estão algumas curiosidades sobre ciência de dados!
Aqui temos algumas bibliografias interessates
Artigo: Vaswani et al. (2017)
Livro: Fudenberg and Tirole (1991)
Incollection: Wickham (2016)
Livro: Zhou (2021)
Artigo: Allcott and Gentzkow (2017)