Introdução

Este relatório apresenta uma análise simples de dados com R

Manipulação dos dados

# Lendo o dataset iris
data("iris")
library(dplyr)
# Ordenar pela largura da pétala
iris_ord <- iris %>% arrange(desc(Petal.Width))
head(iris_ord)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
## 1          6.3         3.3          6.0         2.5 virginica
## 2          7.2         3.6          6.1         2.5 virginica
## 3          6.7         3.3          5.7         2.5 virginica
## 4          5.8         2.8          5.1         2.4 virginica
## 5          6.3         3.4          5.6         2.4 virginica
## 6          6.7         3.1          5.6         2.4 virginica
# Filtrar flores com pétalas largas
iris_filtrado <- iris_ord %>% filter(Petal.Width > 1.5)
# Criar nova variável
iris_novo <- iris_filtrado %>%
  mutate(petal_ratio = Petal.Length / Petal.Width)
  head(iris_novo)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width   Species petal_ratio
## 1          6.3         3.3          6.0         2.5 virginica    2.400000
## 2          7.2         3.6          6.1         2.5 virginica    2.440000
## 3          6.7         3.3          5.7         2.5 virginica    2.280000
## 4          5.8         2.8          5.1         2.4 virginica    2.125000
## 5          6.3         3.4          5.6         2.4 virginica    2.333333
## 6          6.7         3.1          5.6         2.4 virginica    2.333333

Visualização com DT

Equações LATEX

Regressão Linear: Modela a relação entre uma variável dependente Y e uma variável independente X. \[Y = \beta_0 + \beta_1 X + \epsilon\] Média de uma Amostra: A média representa o valor médio de um conjunto, somando todos os valores e dividindo pelo número total de observações. \[\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i\] Variância Amostral: Mede a dispersão dos dados em relação à média. \[s^2 = \frac{1}{n - 1} \sum_{i=1}^n (X_i - \bar{X})^2\] Função Quadrática: Equação de uma parábola. Os coeficientes a,b e c determinam a forma e posição da curva. \[y = ax^2 + bx + c\] Distância Euclidiana entre Dois Pontos: Calcula a distância direta (“reta”) entre dois pontos \((x_1, y_1)\) e \((x_2, y_2)\) no plano cartesiano. \[d = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}\]

Figuras Científicas

– Imagem do modelo de classificação Support Vector Machine(SVM) – SVM

Disponível em: https://www2.decom.ufop.br/imobilis/svm-entendendo-sua-matematica-parte-1-a-margem/

– Imagem do modelo de classificação Naive Bayes – Naive Bayes Disponível em: https://medium.com/@nicolasfaleiros/classificador-naive-bayes-e-o-teorema-de-bayes-84a76c177893

Referências Bibliográficas

Becker et al. (2009) Jombart (2008) Stefanan (2020) Yadav and Thareja (2019) Zhang (2016)

Becker, Natalia, Wiebke Werft, Grischa Toedt, Peter Lichter, and Axel Benner. 2009. “penalizedSVM: A r-Package for Feature Selection SVM Classification.” Bioinformatics 25 (13): 1711–12.
Jombart, Thibaut. 2008. “Adegenet: A r Package for the Multivariate Analysis of Genetic Markers.” Bioinformatics 24 (11): 1403–5.
Stefanan, Aline Armanini. 2020. “Elaboração de Um Aplicativo Para Comparação de técnicas Avançadas de Agrupamento.”
Yadav, Kirtika, and Reema Thareja. 2019. “Comparing the Performance of Naive Bayes and Decision Tree Classification Using r.” International Journal of Intelligent Systems and Applications 11 (12): 11–19.
Zhang, Zhongheng. 2016. “Naı̈ve Bayes Classification in r.” Annals of Translational Medicine 4 (12): 241.