Este relatório apresenta uma análise simples de dados com R
# Lendo o dataset iris
data("iris")
library(dplyr)
# Ordenar pela largura da pétala
iris_ord <- iris %>% arrange(desc(Petal.Width))
head(iris_ord)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 6.3 3.3 6.0 2.5 virginica
## 2 7.2 3.6 6.1 2.5 virginica
## 3 6.7 3.3 5.7 2.5 virginica
## 4 5.8 2.8 5.1 2.4 virginica
## 5 6.3 3.4 5.6 2.4 virginica
## 6 6.7 3.1 5.6 2.4 virginica
# Filtrar flores com pétalas largas
iris_filtrado <- iris_ord %>% filter(Petal.Width > 1.5)
# Criar nova variável
iris_novo <- iris_filtrado %>%
mutate(petal_ratio = Petal.Length / Petal.Width)
head(iris_novo)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species petal_ratio
## 1 6.3 3.3 6.0 2.5 virginica 2.400000
## 2 7.2 3.6 6.1 2.5 virginica 2.440000
## 3 6.7 3.3 5.7 2.5 virginica 2.280000
## 4 5.8 2.8 5.1 2.4 virginica 2.125000
## 5 6.3 3.4 5.6 2.4 virginica 2.333333
## 6 6.7 3.1 5.6 2.4 virginica 2.333333
Regressão Linear: Modela a relação entre uma variável dependente Y e uma variável independente X. \[Y = \beta_0 + \beta_1 X + \epsilon\] Média de uma Amostra: A média representa o valor médio de um conjunto, somando todos os valores e dividindo pelo número total de observações. \[\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i\] Variância Amostral: Mede a dispersão dos dados em relação à média. \[s^2 = \frac{1}{n - 1} \sum_{i=1}^n (X_i - \bar{X})^2\] Função Quadrática: Equação de uma parábola. Os coeficientes a,b e c determinam a forma e posição da curva. \[y = ax^2 + bx + c\] Distância Euclidiana entre Dois Pontos: Calcula a distância direta (“reta”) entre dois pontos \((x_1, y_1)\) e \((x_2, y_2)\) no plano cartesiano. \[d = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}\]
– Imagem do modelo de classificação Support Vector
Machine(SVM) – 
Disponível em: https://www2.decom.ufop.br/imobilis/svm-entendendo-sua-matematica-parte-1-a-margem/
– Imagem do modelo de classificação Naive Bayes –
Disponível em: https://medium.com/@nicolasfaleiros/classificador-naive-bayes-e-o-teorema-de-bayes-84a76c177893
Becker et al. (2009) Jombart (2008) Stefanan (2020) Yadav and Thareja (2019) Zhang (2016)