library(dplyr)
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
# Visualiza as primeiras linhas do conjunto
head(ChickWeight)
## weight Time Chick Diet
## 1 42 0 1 1
## 2 51 2 1 1
## 3 59 4 1 1
## 4 64 6 1 1
## 5 76 8 1 1
## 6 93 10 1 1
summary(ChickWeight)
## weight Time Chick Diet
## Min. : 35.0 Min. : 0.00 13 : 12 1:220
## 1st Qu.: 63.0 1st Qu.: 4.00 9 : 12 2:120
## Median :103.0 Median :10.00 20 : 12 3:120
## Mean :121.8 Mean :10.72 10 : 12 4:118
## 3rd Qu.:163.8 3rd Qu.:16.00 17 : 12
## Max. :373.0 Max. :21.00 19 : 12
## (Other):506
library(dplyr)
# Ordena os dados pelos maiores pesos
chick_ordenado <- ChickWeight %>% arrange(desc(weight))
head(chick_ordenado)
## weight Time Chick Diet
## 1 373 21 35 3
## 2 361 20 35 3
## 3 341 21 34 3
## 4 332 18 35 3
## 5 331 21 21 2
## 6 327 20 34 3
# Filtra apenas os registros após o 15º dia
chick_filtragem <- ChickWeight %>% filter(Time>15)
head(chick_filtragem)
## weight Time Chick Diet
## 1 149 16 1 1
## 2 171 18 1 1
## 3 199 20 1 1
## 4 205 21 1 1
## 5 162 16 2 1
## 6 187 18 2 1
library(dplyr)
# Cria uma nova coluna com o peso em quilogramas
chick_com_Kg <- ChickWeight %>% mutate(weight_kg = weight/1000)
head(chick_com_Kg)
## weight Time Chick Diet weight_kg
## 1 42 0 1 1 0.042
## 2 51 2 1 1 0.051
## 3 59 4 1 1 0.059
## 4 64 6 1 1 0.064
## 5 76 8 1 1 0.076
## 6 93 10 1 1 0.093
library(dplyr)
library(dplyr)
# Calcula o peso médio por tipo de dieta
peso_medio_dieta <- ChickWeight %>% group_by(Diet)%>% summarise(media_peso = mean(weight))
peso_medio_dieta
## # A tibble: 4 × 2
## Diet media_peso
## <fct> <dbl>
## 1 1 103.
## 2 2 123.
## 3 3 143.
## 4 4 135.
library(DT)
datatable(chick_com_Kg,options = list(pageLength = 5),caption = "Tabela interativa dos dados de ChickWeight com peso em quilogramas")
\[ \hat{y} = \beta_0 + \beta_1 x \]
Esta equação representa a linha de regressão, onde \(\hat{y}\) é o valor estimado, \(\beta_0\) é o intercepto e \(\beta_1\) o coeficiente da variável explicativa \(x\).
\[ L(\mu, \sigma^2) = \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x_i - \mu)^2}{2\sigma^2}} \]
Define a probabilidade de observar um conjunto de dados dado que seguem uma distribuição normal com média \(\mu\) e variância \(\sigma^2\).
\[ \theta := \theta - \alpha \nabla_\theta J(\theta) \]
Algoritmo usado em machine learning para ajustar os parâmetros \(\theta\) minimizando a função de custo \(J(\theta)\) com uma taxa de aprendizado \(\alpha\).
\[ H(X) = - \sum_{i=1}^{n} p(x_i) \log_2 p(x_i) \]
Medida da incerteza (ou informação média) de uma variável aleatória \(X\), usada em teoria da informação e aprendizado de máquina.
\[ \Sigma = \frac{1}{n - 1} \sum_{i=1}^{n} (x_i - \bar{x})(x_i - \bar{x})^T \]
Expressa a variabilidade conjunta entre duas ou mais variáveis em forma matricial, importante em estatística multivariada.
Citando referências
Mudanças Climáticas (2014)
Silva et al. (2006)
Vismari (2007)
Correia (2024)
Krebs (2016)
Citando referências