data(iris)
df <- as_tibble(iris)
df <- df %>%
mutate(
Sepal.Ratio = Sepal.Length / Sepal.Width,
Sepal.Area = Sepal.Length * Sepal.Width
) %>%
arrange(desc(Sepal.Ratio))
df_filtered <- df %>% filter(Species == "setosa", Sepal.Ratio > 3)
head_df <- head(df, 8)
summary_ratio <- summary(df$Sepal.Ratio)
count_filtered <- nrow(df_filtered)
knitr::kable(head_df, caption = "Primeiras 8 observações do dataset manipulado")
| Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | Sepal.Ratio | Sepal.Area |
|---|---|---|---|---|---|---|
| 7.7 | 2.6 | 6.9 | 2.3 | virginica | 2.961539 | 20.02 |
| 6.2 | 2.2 | 4.5 | 1.5 | versicolor | 2.818182 | 13.64 |
| 7.7 | 2.8 | 6.7 | 2.0 | virginica | 2.750000 | 21.56 |
| 6.3 | 2.3 | 4.4 | 1.3 | versicolor | 2.739130 | 14.49 |
| 6.0 | 2.2 | 4.0 | 1.0 | versicolor | 2.727273 | 13.20 |
| 6.0 | 2.2 | 5.0 | 1.5 | virginica | 2.727273 | 13.20 |
| 6.7 | 2.5 | 5.8 | 1.8 | virginica | 2.680000 | 16.75 |
| 7.4 | 2.8 | 6.1 | 1.9 | virginica | 2.642857 | 20.72 |
cat("\nNúmero de observações após filtro (setosa e Sepal.Ratio > 3):", count_filtered, "\n\n")
##
## Número de observações após filtro (setosa e Sepal.Ratio > 3): 0
print(summary_ratio)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.268 1.546 2.032 1.954 2.225 2.962
datatable(
df,
options = list(
pageLength = 10,
lengthMenu = c(5, 10, 15),
search = list(regex = TRUE, caseInsensitive = TRUE)
),
filter = 'top',
rownames = FALSE
)
\(L(\beta ;x)=\sum _{i=1}^{n}[y_{i}\ln (p_{i})+(1-y_{i})\ln (1-p_{i})]\).
Significado: função objetivo usada na regressão logística.
\(\Sigma =V\Lambda V^{T}\)
Significado: decomposição da matriz de covariância em autovalores e autovetores.
\(p(\theta |D)=\frac{p(D|\theta )p(\theta )}{p(D)}\)
Significado: atualização de crenças em inferência bayesiana.
\(L(\mathbf{y},\^{\mathbf{y}})=-\sum _{i=1}^{C}y_{i}\log (\^{y}_{i})\)
Significado: função de perda usada em modelos de classificação multi-classe.
\(\min _{\mathbf{w},b,\mathbf{\xi }}\frac{1}{2}\|\mathbf{w}\|^{2}+C\sum _{i=1}^{m}\xi _{i}\)
Significado: formulação que busca um hiperplano com margem máxima penalizando erros.
Wickham, H., & Grolemund, G. (2017). R for Data Science. O’Reilly Media.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. Springer.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer.
Provost, F., & Fawcett, T. (2013). Data Science for Business. O’Reilly Media.
Xie, Y., Allaire, J., & Grolemund, G. (2018). R Markdown: The Definitive Guide. Chapman and Hall/CRC.