Carregando o dataset ‘USArrests’

Carrega o dataset “USArrests”

data("USArrests")

Exibe a estrutura do dataset

str(USArrests)
## 'data.frame':    50 obs. of  4 variables:
##  $ Murder  : num  13.2 10 8.1 8.8 9 7.9 3.3 5.9 15.4 17.4 ...
##  $ Assault : int  236 263 294 190 276 204 110 238 335 211 ...
##  $ UrbanPop: int  58 48 80 50 91 78 77 72 80 60 ...
##  $ Rape    : num  21.2 44.5 31 19.5 40.6 38.7 11.1 15.8 31.9 25.8 ...
head(USArrests)
##            Murder Assault UrbanPop Rape
## Alabama      13.2     236       58 21.2
## Alaska       10.0     263       48 44.5
## Arizona       8.1     294       80 31.0
## Arkansas      8.8     190       50 19.5
## California    9.0     276       91 40.6
## Colorado      7.9     204       78 38.7

Manipulação básica:

1.) Adição de uma nova coluna: Média de crimes

USArrests$Media_Crimes <- rowMeans(USArrests[, c("Murder", "Assault", "Rape")])

head(USArrests)
##            Murder Assault UrbanPop Rape Media_Crimes
## Alabama      13.2     236       58 21.2     90.13333
## Alaska       10.0     263       48 44.5    105.83333
## Arizona       8.1     294       80 31.0    111.03333
## Arkansas      8.8     190       50 19.5     72.76667
## California    9.0     276       91 40.6    108.53333
## Colorado      7.9     204       78 38.7     83.53333

Tabela iterativa:

library(DT)

# Cria uma tabela interativa com o dataset manipulado
datatable(USArrests, 
          options = list(pageLength = 10, autoWidth = TRUE),
          caption = "Tabela interativa do dataset USArrests")

Equações em LaTeX

Equação 1: Intervalo de confiança para a média (σ conhecido)

\[ IC = \left( \, \bar{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \; \bar{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \, \right) \]


Equação 2: Força elétrica (Lei de Coulomb)

\[ F = k_e \, \frac{|q_1 q_2|}{r^2} \] onde: - \(k_e = 8{,}99 \times 10^9 \, \text{N·m}^2/\text{C}^2\) - \(q_1, q_2\): cargas elétricas - \(r\): distância entre as cargas


Equação 3: Campo elétrico gerado por uma carga puntiforme

\[ \vec{E} = k_e \, \frac{q}{r^2} \, \hat{r} \]


Equação 4: Equação da reta

\[ y - y_1 = m(x - x_1) \] ou, de forma geral: \[ Ax + By + C = 0 \]


Equação 5: Variância amostral

\[ s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2 \]

Exibindo imagens

Imagem 1: Ciclo de vida da Ciência de Dados

Ciclo de vida da Ciência de Dados
Ciclo de vida da Ciência de Dados

Descrição:
O ciclo de vida da ciência de dados representa as principais etapas de um projeto analítico — desde a coleta e preparação dos dados, passando pela modelagem e análise, até a comunicação dos resultados e a implementação das soluções. Esse processo é iterativo e visa transformar dados brutos em insights úteis para tomada de decisão.


Imagem 2: Salário médio de cientistas de dados nos EUA

Salário médio de cientistas de dados nos EUA
Salário médio de cientistas de dados nos EUA

Descrição:
O gráfico ilustra o salário médio de cientistas de dados nos Estados Unidos, destacando a alta demanda e valorização desses profissionais no mercado. Os salários podem variar conforme a experiência, localização e setor de atuação, mas é importante para refletir sobre o impacto e a demanda desse setor nas empresas.

Referências bibliográficas

  • Grus (2016)
  • Kelleher and Tierney (2018)
  • Sciences et al. (2018)
  • Cao (2017)
  • Wickham, Grolemund, et al. (2017)
Cao, Longbing. 2017. “Data Science: A Comprehensive Overview.” ACM Computing Surveys (CSUR) 50 (3): 1–42.
Grus, Joel. 2016. Data Science Do Zero. Vol. 1. Alta books Rio d Janeiro.
Kelleher, John D, and Brendan Tierney. 2018. Data Science. MIT press.
Sciences, National Academies of, Medicine, Division of Behavioral, Social Sciences, Board on Science Education, Division on Engineering, Physical Sciences, et al. 2018. Data Science for Undergraduates: Opportunities and Options. National Academies Press.
Wickham, Hadley, Garrett Grolemund, et al. 2017. R for Data Science. Vol. 2. O’Reilly Sebastopol.