library(tidyselect)
library(GGally)
library(readr)


library(readr)
carros <- read_csv("C:/Users/Hp1/Desktop/Lista1 - Cars/Dados/cars04.csv", 
                   locale = locale())
## Parsed with column specification:
## cols(
##   `Vehicle Name` = col_character(),
##   Hybrid = col_integer(),
##   SuggestedRetailPrice = col_integer(),
##   DealerCost = col_integer(),
##   EngineSize = col_double(),
##   Cylinders = col_integer(),
##   Horsepower = col_integer(),
##   CityMPG = col_integer(),
##   HighwayMPG = col_integer(),
##   Weight = col_integer(),
##   WheelBase = col_integer(),
##   Length = col_integer(),
##   Width = col_integer()
## )
View(carros)

# Carregando o Pacote
carros <- readr::read_csv("C:/Users/Hp1/Desktop/Lista1 - Cars/Dados/cars04.csv")
## Parsed with column specification:
## cols(
##   `Vehicle Name` = col_character(),
##   Hybrid = col_integer(),
##   SuggestedRetailPrice = col_integer(),
##   DealerCost = col_integer(),
##   EngineSize = col_double(),
##   Cylinders = col_integer(),
##   Horsepower = col_integer(),
##   CityMPG = col_integer(),
##   HighwayMPG = col_integer(),
##   Weight = col_integer(),
##   WheelBase = col_integer(),
##   Length = col_integer(),
##   Width = col_integer()
## )
# Ajustando o modelo
modelo = lm(SuggestedRetailPrice ~ DealerCost, data = carros)
summary(modelo)
## 
## Call:
## lm(formula = SuggestedRetailPrice ~ DealerCost, data = carros)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1743.52  -262.59    74.92   265.98  2912.72 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -61.904248  81.801381  -0.757     0.45    
## DealerCost    1.088841   0.002638 412.768   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 587 on 232 degrees of freedom
## Multiple R-squared:  0.9986, Adjusted R-squared:  0.9986 
## F-statistic: 1.704e+05 on 1 and 232 DF,  p-value: < 2.2e-16
## Análise: Houve um equivoco por parte do Analista. Através do resumo dos dados,nota-se que a mediana é diferente de zero, os dados são assimétricos, no entanto pode-se dizer que os resíduos não dão normais.Para melhor confirmação observe o histograma dos resíduos e o resultado do teste de Shapiro-Wilk.

# Gráficos 
hist(modelo$residuals, xlab = "Residuos", bins = 30)
## Warning in plot.window(xlim, ylim, "", ...): "bins" não é um parâmetro
## gráfico
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## "bins" não é um parâmetro gráfico
## Warning in axis(1, ...): "bins" não é um parâmetro gráfico
## Warning in axis(2, ...): "bins" não é um parâmetro gráfico

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.93723, p-value = 1.839e-08
## Nota-se tambem que o desvio padrão dos resíduos e de "Beta zero" são muito altos,o que ocasiona valores ajustados ruins.Para melhor compreensão observa-se o gráfico dos erros absolutos.

Gráfico dos erros absolutos EA: |Y - Y ajustado|

erro.modelo <- abs(carros\(SuggestedRetailPrice~modelo\)fitted.values) erro.modelo %>% qplot(xlab = “Erros absolutos”, bins = 30)

plot(modelo)