library(tidyselect)
library(GGally)
library(readr)
library(readr)
carros <- read_csv("C:/Users/Hp1/Desktop/Lista1 - Cars/Dados/cars04.csv",
locale = locale())
## Parsed with column specification:
## cols(
## `Vehicle Name` = col_character(),
## Hybrid = col_integer(),
## SuggestedRetailPrice = col_integer(),
## DealerCost = col_integer(),
## EngineSize = col_double(),
## Cylinders = col_integer(),
## Horsepower = col_integer(),
## CityMPG = col_integer(),
## HighwayMPG = col_integer(),
## Weight = col_integer(),
## WheelBase = col_integer(),
## Length = col_integer(),
## Width = col_integer()
## )
View(carros)
# Carregando o Pacote
carros <- readr::read_csv("C:/Users/Hp1/Desktop/Lista1 - Cars/Dados/cars04.csv")
## Parsed with column specification:
## cols(
## `Vehicle Name` = col_character(),
## Hybrid = col_integer(),
## SuggestedRetailPrice = col_integer(),
## DealerCost = col_integer(),
## EngineSize = col_double(),
## Cylinders = col_integer(),
## Horsepower = col_integer(),
## CityMPG = col_integer(),
## HighwayMPG = col_integer(),
## Weight = col_integer(),
## WheelBase = col_integer(),
## Length = col_integer(),
## Width = col_integer()
## )
# Ajustando o modelo
modelo = lm(SuggestedRetailPrice ~ DealerCost, data = carros)
summary(modelo)
##
## Call:
## lm(formula = SuggestedRetailPrice ~ DealerCost, data = carros)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1743.52 -262.59 74.92 265.98 2912.72
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -61.904248 81.801381 -0.757 0.45
## DealerCost 1.088841 0.002638 412.768 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 587 on 232 degrees of freedom
## Multiple R-squared: 0.9986, Adjusted R-squared: 0.9986
## F-statistic: 1.704e+05 on 1 and 232 DF, p-value: < 2.2e-16
## Análise: Houve um equivoco por parte do Analista. AtravĂ©s do resumo dos dados,nota-se que a mediana Ă© diferente de zero, os dados sĂŁo assimĂ©tricos, no entanto pode-se dizer que os resĂduos nĂŁo dĂŁo normais.Para melhor confirmação observe o histograma dos resĂduos e o resultado do teste de Shapiro-Wilk.
# Gráficos
hist(modelo$residuals, xlab = "Residuos", bins = 30)
## Warning in plot.window(xlim, ylim, "", ...): "bins" não é um parâmetro
## gráfico
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## "bins" não é um parâmetro gráfico
## Warning in axis(1, ...): "bins" não é um parâmetro gráfico
## Warning in axis(2, ...): "bins" não é um parâmetro gráfico
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.93723, p-value = 1.839e-08
## Nota-se tambem que o desvio padrĂŁo dos resĂduos e de "Beta zero" sĂŁo muito altos,o que ocasiona valores ajustados ruins.Para melhor compreensĂŁo observa-se o gráfico dos erros absolutos.
erro.modelo <- abs(carros\(SuggestedRetailPrice~modelo\)fitted.values) erro.modelo %>% qplot(xlab = “Erros absolutos”, bins = 30)
plot(modelo)