install.packages("readxl")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("sandwich")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("lmtest")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("readr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("openxlsx")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("tidyverse")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("stringr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("clipr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("zoo")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
install.packages("Hmisc")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
library(readxl)
library(sandwich)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(openxlsx)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0
## ✔ purrr 1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(stringr)
library(clipr)
## Welcome to clipr. See ?write_clip for advisories on writing to the clipboard in R.
library(zoo)
library(Hmisc)
##
## Attaching package: 'Hmisc'
##
## The following objects are masked from 'package:dplyr':
##
## src, summarize
##
## The following objects are masked from 'package:base':
##
## format.pval, units
kiacerato = read_excel("kiacerato.xlsx")
kiacerato$precio<-as.numeric(kiacerato$precio)
kiacerato$kilometraje<-as.numeric( kiacerato$kilometraje )
kiacerato$modelo<-as.factor(kiacerato$modelo)
library(summarytools)
## Warning in fun(libname, pkgname): couldn't connect to display ":0"
## system might not have X11 capabilities; in case of errors when using dfSummary(), set st_options(use.x11 = FALSE)
##
## Attaching package: 'summarytools'
## The following objects are masked from 'package:Hmisc':
##
## label, label<-
## The following object is masked from 'package:tibble':
##
## view
g1 = ggplot(kiacerato, aes(x = kiacerato$precio )) + geom_histogram(bins = 20,fill="skyblue") + theme_bw()
print(g1)
## Warning: Use of `kiacerato$precio` is discouraged.
## ℹ Use `precio` instead.
descr (kiacerato$precio,stats = "common" )
## Descriptive Statistics
## kiacerato$precio
## N: 55
##
## precio
## --------------- -------------
## Mean 48792727.25
## Std.Dev 14047246.39
## Min 1000000.00
## Median 48000000.00
## Max 83000000.00
## N.Valid 55.00
## Pct.Valid 100.00
Segun el grafico 1, el precio del kia Cerato ronda en su mayoria eentre 32 y 58 millones de pesos, pues en promedio un acrro de esta categoria, cuesta $48.792.727 y el 50% de estos carros Cuestan $48.000.000. El precio mÃnimo fue de $1.000.000 y el máximo fue de $83.000.000.
g2 = ggplot(kiacerato, aes(x = kiacerato$kilometraje)) + geom_histogram(bins = 10,fill="pink") + theme_bw()
print(g2)
## Warning: Use of `kiacerato$kilometraje` is discouraged.
## ℹ Use `kilometraje` instead.
descr(kiacerato$kilometraje,stats = "common" )
## Descriptive Statistics
## kiacerato$kilometraje
## N: 55
##
## kilometraje
## --------------- -------------
## Mean 95435.93
## Std.Dev 39487.67
## Min 153.00
## Median 97000.00
## Max 228000.00
## N.Valid 55.00
## Pct.Valid 100.00
Segun el grafico 2, el kilometraje del kia Cerato usado ronda en su mayoria eentre los 70.000 y los 130.000 kilometros, pues en promedio se venden carros con un kilometraje de 95.435 km y el 50% de estos carros tienen 97.000. El mÃnimo kilometraje fue de 153 km y el máximo fue de 228.000 km.
g3 = ggplot(kiacerato, aes(x = año)) + geom_bar(fill="purple") + theme_bw()+ theme(axis.text.x = element_text(angle = 90, hjust = 1))
print(g3)
Segun el gráfico, la mayoria kia ceratos usados que se ofertan son modelo año entre 2011 y 2015, y el modelo menos ofrecido es el 2020.
library(ggplot2)
install.packages("ggpubr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.3'
## (as 'lib' is unspecified)
library(ggpubr)
ggarrange(g1, g2, labels = c("A", "B"), ncol = 2, nrow = 1)
## Warning: Use of `kiacerato$precio` is discouraged.
## ℹ Use `precio` instead.
## Warning: Use of `kiacerato$kilometraje` is discouraged.
## ℹ Use `kilometraje` instead.
Para este caso, no se va atomar en cuenta la variable combustible, ya que todos los carros usan gasolina, del mismo modi, tampoco se tomará l transmisión ya que la mayoria de los carros son mecánicos.
mod_muliple=lm(kiacerato$precio~kiacerato$kilometraje+kiacerato$año)
summary(mod_muliple)
##
## Call:
## lm(formula = kiacerato$precio ~ kiacerato$kilometraje + kiacerato$año)
##
## Residuals:
## Min 1Q Median 3Q Max
## -42521010 -2003436 0 2276808 21855600
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.679e+07 6.980e+06 5.270 4.41e-06 ***
## kiacerato$kilometraje -1.077e+01 4.214e+01 -0.256 0.799543
## kiacerato$año2011 7.331e+05 5.473e+06 0.134 0.894086
## kiacerato$año2012 4.646e+06 5.708e+06 0.814 0.420280
## kiacerato$año2013 6.000e+06 5.935e+06 1.011 0.317846
## kiacerato$año2014 7.433e+06 5.991e+06 1.241 0.221552
## kiacerato$año2015 1.644e+07 5.588e+06 2.942 0.005292 **
## kiacerato$año2016 2.189e+07 6.337e+06 3.454 0.001276 **
## kiacerato$año2017 2.387e+07 7.077e+06 3.373 0.001608 **
## kiacerato$año2018 2.452e+07 7.682e+06 3.192 0.002676 **
## kiacerato$año2019 3.571e+07 7.367e+06 4.848 1.74e-05 ***
## kiacerato$año2020 3.946e+07 7.755e+06 5.088 8.00e-06 ***
## kiacerato$año2022 3.900e+07 1.021e+07 3.819 0.000435 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8126000 on 42 degrees of freedom
## Multiple R-squared: 0.7398, Adjusted R-squared: 0.6654
## F-statistic: 9.949 on 12 and 42 DF, p-value: 8.354e-09
Como resultado tenemos que por cada kilometro adicional el precio disminuye aproximadamente $10,77 pesos (B!). Por el kiloetraje, tomando como referencia el año 2011, se espera que el kilometraje para un modelo 2012 aumente $4.646.000 (B2), el modelo 2013 aumenta $6.000.000 (B3), el modelo 2014 aumenta $7.437.000 (B4), el modelo 2015 aumenta $1.644.000 (B5), el modelo 2016 aumenta $2.149.000 (B6), el modelo 2017 aumenta $2.387.000 (B7), el modelo 2018 aumenta $2.452.000 (B8), el modelo 2019 aumenta $3.571.000 (B9), el modelo 2020 aumenta $3.946.000 (B10) y el modelo 2020 aumenta $3.900.000 (B11). El modelo explica el 73% de la variación del precio.
plot(kiacerato$kilometraje,kiacerato$precio)
Se Validan los supuestos del modelo
par(mfrow=c(2,2))
plot(mod_muliple)
## Warning: not plotting observations with leverage one:
## 26
sobre los supuestos del modelo se puede concluir que tiene un comportamiento estable y que se ajustan a la linea de normalidad.