install.packages("readxl")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("sandwich")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("lmtest")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("readr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("openxlsx")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("tidyverse")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("stringr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("clipr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("zoo")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("Hmisc")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
library(readxl)
library(sandwich)
library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(openxlsx)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.2     ✔ tidyr     1.3.0
## ✔ purrr     1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(stringr)
library(clipr)
## Welcome to clipr. See ?write_clip for advisories on writing to the clipboard in R.
library(zoo)
library(Hmisc)
## 
## Attaching package: 'Hmisc'
## 
## The following objects are masked from 'package:dplyr':
## 
##     src, summarize
## 
## The following objects are masked from 'package:base':
## 
##     format.pval, units

Análisis exploratorio o univariado

kiacerato = read_excel("kiacerato.xlsx")
kiacerato$precio<-as.numeric(kiacerato$precio)

kiacerato$kilometraje<-as.numeric( kiacerato$kilometraje )

kiacerato$modelo<-as.factor(kiacerato$modelo) 
library(summarytools)
## Warning in fun(libname, pkgname): couldn't connect to display ":0"
## system might not have X11 capabilities; in case of errors when using dfSummary(), set st_options(use.x11 = FALSE)
## 
## Attaching package: 'summarytools'
## The following objects are masked from 'package:Hmisc':
## 
##     label, label<-
## The following object is masked from 'package:tibble':
## 
##     view
g1 = ggplot(kiacerato, aes(x = kiacerato$precio )) + geom_histogram(bins = 20,fill="skyblue") + theme_bw()
print(g1)
## Warning: Use of `kiacerato$precio` is discouraged.
## ℹ Use `precio` instead.

descr (kiacerato$precio,stats = "common" )
## Descriptive Statistics  
## kiacerato$precio  
## N: 55  
## 
##                        precio
## --------------- -------------
##            Mean   48792727.25
##         Std.Dev   14047246.39
##             Min    1000000.00
##          Median   48000000.00
##             Max   83000000.00
##         N.Valid         55.00
##       Pct.Valid        100.00

Segun el grafico 1, el precio del kia Cerato ronda en su mayoria eentre 32 y 58 millones de pesos, pues en promedio un acrro de esta categoria, cuesta $48.792.727 y el 50% de estos carros Cuestan $48.000.000. El precio mínimo fue de $1.000.000 y el máximo fue de $83.000.000.

g2 = ggplot(kiacerato, aes(x = kiacerato$kilometraje)) + geom_histogram(bins = 10,fill="pink") + theme_bw()
print(g2)
## Warning: Use of `kiacerato$kilometraje` is discouraged.
## ℹ Use `kilometraje` instead.

descr(kiacerato$kilometraje,stats = "common" )
## Descriptive Statistics  
## kiacerato$kilometraje  
## N: 55  
## 
##                   kilometraje
## --------------- -------------
##            Mean      95435.93
##         Std.Dev      39487.67
##             Min        153.00
##          Median      97000.00
##             Max     228000.00
##         N.Valid         55.00
##       Pct.Valid        100.00

Segun el grafico 2, el kilometraje del kia Cerato usado ronda en su mayoria eentre los 70.000 y los 130.000 kilometros, pues en promedio se venden carros con un kilometraje de 95.435 km y el 50% de estos carros tienen 97.000. El mínimo kilometraje fue de 153 km y el máximo fue de 228.000 km.

g3 = ggplot(kiacerato, aes(x = año)) + geom_bar(fill="purple") + theme_bw()+ theme(axis.text.x = element_text(angle = 90, hjust = 1))
print(g3)

Segun el gráfico, la mayoria kia ceratos usados que se ofertan son modelo año entre 2011 y 2015, y el modelo menos ofrecido es el 2020.

library(ggplot2)
install.packages("ggpubr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
library(ggpubr)
ggarrange(g1, g2,  labels = c("A", "B"), ncol = 2, nrow = 1)
## Warning: Use of `kiacerato$precio` is discouraged.
## ℹ Use `precio` instead.
## Warning: Use of `kiacerato$kilometraje` is discouraged.
## ℹ Use `kilometraje` instead.

Para este caso, no se va atomar en cuenta la variable combustible, ya que todos los carros usan gasolina, del mismo modi, tampoco se tomará l transmisión ya que la mayoria de los carros son mecánicos.

mod_muliple=lm(kiacerato$precio~kiacerato$kilometraje+kiacerato$año)
summary(mod_muliple)
## 
## Call:
## lm(formula = kiacerato$precio ~ kiacerato$kilometraje + kiacerato$año)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -42521010  -2003436         0   2276808  21855600 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            3.679e+07  6.980e+06   5.270 4.41e-06 ***
## kiacerato$kilometraje -1.077e+01  4.214e+01  -0.256 0.799543    
## kiacerato$año2011      7.331e+05  5.473e+06   0.134 0.894086    
## kiacerato$año2012      4.646e+06  5.708e+06   0.814 0.420280    
## kiacerato$año2013      6.000e+06  5.935e+06   1.011 0.317846    
## kiacerato$año2014      7.433e+06  5.991e+06   1.241 0.221552    
## kiacerato$año2015      1.644e+07  5.588e+06   2.942 0.005292 ** 
## kiacerato$año2016      2.189e+07  6.337e+06   3.454 0.001276 ** 
## kiacerato$año2017      2.387e+07  7.077e+06   3.373 0.001608 ** 
## kiacerato$año2018      2.452e+07  7.682e+06   3.192 0.002676 ** 
## kiacerato$año2019      3.571e+07  7.367e+06   4.848 1.74e-05 ***
## kiacerato$año2020      3.946e+07  7.755e+06   5.088 8.00e-06 ***
## kiacerato$año2022      3.900e+07  1.021e+07   3.819 0.000435 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8126000 on 42 degrees of freedom
## Multiple R-squared:  0.7398, Adjusted R-squared:  0.6654 
## F-statistic: 9.949 on 12 and 42 DF,  p-value: 8.354e-09

Como resultado tenemos que por cada kilometro adicional el precio disminuye aproximadamente $10,77 pesos (B!). Por el kiloetraje, tomando como referencia el año 2011, se espera que el kilometraje para un modelo 2012 aumente $4.646.000 (B2), el modelo 2013 aumenta $6.000.000 (B3), el modelo 2014 aumenta $7.437.000 (B4), el modelo 2015 aumenta $1.644.000 (B5), el modelo 2016 aumenta $2.149.000 (B6), el modelo 2017 aumenta $2.387.000 (B7), el modelo 2018 aumenta $2.452.000 (B8), el modelo 2019 aumenta $3.571.000 (B9), el modelo 2020 aumenta $3.946.000 (B10) y el modelo 2020 aumenta $3.900.000 (B11). El modelo explica el 73% de la variación del precio.

plot(kiacerato$kilometraje,kiacerato$precio)

Se Validan los supuestos del modelo

par(mfrow=c(2,2))
plot(mod_muliple)
## Warning: not plotting observations with leverage one:
##   26

sobre los supuestos del modelo se puede concluir que tiene un comportamiento estable y que se ajustan a la linea de normalidad.