Primeira questão:

  data(iris)
df <- as_tibble(iris)


df <- df %>%
mutate(
Sepal.Ratio = Sepal.Length / Sepal.Width,
Sepal.Area = Sepal.Length * Sepal.Width
) %>%
arrange(desc(Sepal.Ratio))


df_filtered <- df %>% filter(Species == "setosa", Sepal.Ratio > 3)


head_df <- head(df, 8)
summary_ratio <- summary(df$Sepal.Ratio)
count_filtered <- nrow(df_filtered)


knitr::kable(head_df, caption = "Primeiras 8 observações do dataset manipulado")
Primeiras 8 observações do dataset manipulado
Sepal.Length Sepal.Width Petal.Length Petal.Width Species Sepal.Ratio Sepal.Area
7.7 2.6 6.9 2.3 virginica 2.961539 20.02
6.2 2.2 4.5 1.5 versicolor 2.818182 13.64
7.7 2.8 6.7 2.0 virginica 2.750000 21.56
6.3 2.3 4.4 1.3 versicolor 2.739130 14.49
6.0 2.2 4.0 1.0 versicolor 2.727273 13.20
6.0 2.2 5.0 1.5 virginica 2.727273 13.20
6.7 2.5 5.8 1.8 virginica 2.680000 16.75
7.4 2.8 6.1 1.9 virginica 2.642857 20.72
cat("\nNúmero de observações após filtro (setosa e Sepal.Ratio > 3):", count_filtered, "\n\n")
## 
## Número de observações após filtro (setosa e Sepal.Ratio > 3): 0
print(summary_ratio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.268   1.546   2.032   1.954   2.225   2.962

Segunda questão

  datatable(
df,
options = list(
pageLength = 10,
lengthMenu = c(5, 10, 15),
search = list(regex = TRUE, caseInsensitive = TRUE)
),
filter = 'top',
rownames = FALSE
)

Terceira questão

\(L(\beta ;x)=\sum _{i=1}^{n}[y_{i}\ln (p_{i})+(1-y_{i})\ln (1-p_{i})]\).

Significado: função objetivo usada na regressão logística.

\(\Sigma =V\Lambda V^{T}\)

Significado: decomposição da matriz de covariância em autovalores e autovetores.

\(p(\theta |D)=\frac{p(D|\theta )p(\theta )}{p(D)}\)

Significado: atualização de crenças em inferência bayesiana.

\(L(\mathbf{y},\^{\mathbf{y}})=-\sum _{i=1}^{C}y_{i}\log (\^{y}_{i})\)

Significado: função de perda usada em modelos de classificação multi-classe.

\(\min _{\mathbf{w},b,\mathbf{\xi }}\frac{1}{2}\|\mathbf{w}\|^{2}+C\sum _{i=1}^{m}\xi _{i}\)

Significado: formulação que busca um hiperplano com margem máxima penalizando erros.

Quarta questão

Quinta questão

Wickham, H., & Grolemund, G. (2017). R for Data Science. O’Reilly Media.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. Springer.

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer.

Provost, F., & Fawcett, T. (2013). Data Science for Business. O’Reilly Media.

Xie, Y., Allaire, J., & Grolemund, G. (2018). R Markdown: The Definitive Guide. Chapman and Hall/CRC.