Relatório CPAD

Primeira questão:

  data(iris)
df <- as_tibble(iris)


df <- df %>%
mutate(
Sepal.Ratio = Sepal.Length / Sepal.Width,
Sepal.Area = Sepal.Length * Sepal.Width
) %>%
arrange(desc(Sepal.Ratio))


df_filtered <- df %>% filter(Species == "setosa", Sepal.Ratio > 3)


head_df <- head(df, 8)
summary_ratio <- summary(df$Sepal.Ratio)
count_filtered <- nrow(df_filtered)


knitr::kable(head_df, caption = "Primeiras 8 observações do dataset manipulado")

Primeiras 8 observações do dataset manipulado
Sepal.Length	Sepal.Width	Petal.Length	Petal.Width	Species	Sepal.Ratio	Sepal.Area
7.7	2.6	6.9	2.3	virginica	2.961539	20.02
6.2	2.2	4.5	1.5	versicolor	2.818182	13.64
7.7	2.8	6.7	2.0	virginica	2.750000	21.56
6.3	2.3	4.4	1.3	versicolor	2.739130	14.49
6.0	2.2	4.0	1.0	versicolor	2.727273	13.20
6.0	2.2	5.0	1.5	virginica	2.727273	13.20
6.7	2.5	5.8	1.8	virginica	2.680000	16.75
7.4	2.8	6.1	1.9	virginica	2.642857	20.72

cat("\nNúmero de observações após filtro (setosa e Sepal.Ratio > 3):", count_filtered, "\n\n")

## 
## Número de observações após filtro (setosa e Sepal.Ratio > 3): 0

print(summary_ratio)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.268   1.546   2.032   1.954   2.225   2.962

Segunda questão

  datatable(
df,
options = list(
pageLength = 10,
lengthMenu = c(5, 10, 15),
search = list(regex = TRUE, caseInsensitive = TRUE)
),
filter = 'top',
rownames = FALSE
)

Terceira questão

\(L(\beta ;x)=\sum _{i=1}^{n}[y_{i}\ln (p_{i})+(1-y_{i})\ln (1-p_{i})]\).

Significado: função objetivo usada na regressão logística.

\(\Sigma =V\Lambda V^{T}\)

Significado: decomposição da matriz de covariância em autovalores e autovetores.

\(p(\theta |D)=\frac{p(D|\theta )p(\theta )}{p(D)}\)

Significado: atualização de crenças em inferência bayesiana.

\(L(\mathbf{y},\^{\mathbf{y}})=-\sum _{i=1}^{C}y_{i}\log (\^{y}_{i})\)

Significado: função de perda usada em modelos de classificação multi-classe.

\(\min _{\mathbf{w},b,\mathbf{\xi }}\frac{1}{2}\|\mathbf{w}\|^{2}+C\sum _{i=1}^{m}\xi _{i}\)

Significado: formulação que busca um hiperplano com margem máxima penalizando erros.

Quarta questão

Quinta questão

Wickham, H., & Grolemund, G. (2017). R for Data Science. O’Reilly Media.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. Springer.

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer.

Provost, F., & Fawcett, T. (2013). Data Science for Business. O’Reilly Media.

Xie, Y., Allaire, J., & Grolemund, G. (2018). R Markdown: The Definitive Guide. Chapman and Hall/CRC.