• Criação de Abas
  • Criação do Sumário

1 Banco de Dados iris

É uma base de dados de espécies de flores da família das Iridáceas chamada Iris. Existem três classes nesse banco de dados: a Iris-setosa, a Iris-versicolour e a Iris-virginica, e possui para cada classe 50 instâncias, totalizando 150 instâncias. Cada classe possui 4 atributos: o comprimento da sépala, a largura da sépala, o comprimento da pétala e a largura da pétala

data<-iris
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
library(ggplot2)
library(htmltools)
library(emmeans)
library(knitr)
library(dplyr)
library(kableExtra)
library(rstatix)

2 Análise Descritiva

2.1 Sumarização

summary(data)
##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##        Species  
##  setosa    :50  
##  versicolor:50  
##  virginica :50  
##                 
##                 
## 

2.2 Gráfico de Dispersão

ggplot(data)+
  aes(x= Sepal.Length, y=Sepal.Width)+
  geom_point()

2.3 Histograma Sepal.Length

ggplot(data)+
  aes(x= Sepal.Length)+
  geom_histogram()

3 Análise Regressão

3.1 Análise Correlação

data$Species <- NULL
cor(data, method = "pearson", use = "complete.obs")
##              Sepal.Length Sepal.Width Petal.Length Petal.Width
## Sepal.Length    1.0000000  -0.1175698    0.8717538   0.8179411
## Sepal.Width    -0.1175698   1.0000000   -0.4284401  -0.3661259
## Petal.Length    0.8717538  -0.4284401    1.0000000   0.9628654
## Petal.Width     0.8179411  -0.3661259    0.9628654   1.0000000

3.2 Ajuste Modelo de Regressão

regres = lm(Sepal.Length~Sepal.Width, data = data) #Ajusta o Modelo
summary(regres) #Mostra os resultados
## 
## Call:
## lm(formula = Sepal.Length ~ Sepal.Width, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.5561 -0.6333 -0.1120  0.5579  2.2226 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   6.5262     0.4789   13.63   <2e-16 ***
## Sepal.Width  -0.2234     0.1551   -1.44    0.152    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8251 on 148 degrees of freedom
## Multiple R-squared:  0.01382,    Adjusted R-squared:  0.007159 
## F-statistic: 2.074 on 1 and 148 DF,  p-value: 0.1519

3.3 Gráficos Resíduos-ggpolt2

resp <- data.frame(indice = 1:length(regres$residuals),
                   residuos = regres$residuals)

ggplot(resp, aes(x = indice, y = residuos)) +
  geom_point() +
  geom_hline(yintercept = 0) +
  labs(x = "Índice", y = "Resíduos")

3.4 Gráfico dos Resíduos(antiga)

plot(regres$residuals, pch = 16, col = "red")