La base de datos contiene información sobre las ventas de motos en OLX de Colombia. Tiene como datos el precio,el modelo, el kilometraje y el año
knitr::opts_chunk$set(message = FALSE, warning = FALSE)
library(readxl)
## Warning: package 'readxl' was built under R version 4.1.2
Motos <- read_excel("C:/Users/miche/OneDrive/Escritorio/Estadistica Avanzada/Motos.xlsx")
View(Motos)
attach(Motos)
summary(Motos)
## Precio Modelo Kilometraje (km) ano
## Min. :1500000 Length:51 Min. : 0 Min. :2007
## 1st Qu.:2300000 Class :character 1st Qu.: 2300 1st Qu.:2012
## Median :3100000 Mode :character Median : 12345 Median :2018
## Mean :3186173 Mean : 28314 Mean :2017
## 3rd Qu.:4000000 3rd Qu.: 40682 3rd Qu.:2021
## Max. :6000000 Max. :153530 Max. :2022
Se puede observar que el precio promedio de las motos eco deluxe es de $3186173 y que el kilometraje promedio es de 28314
hist(`Kilometraje (km)`,col="blue")
En esta gráfica se puede observar que hay más motos con poco kilometraje en venta, que motos con mucho kilometraje.
plot(`Kilometraje (km)`,Precio)
cor(`Kilometraje (km)`,Precio)
## [1] -0.4204468
Se puede observar que a menor kilometraje, mayor precio y su relación no es muy fuerte, pues la correlación es tan solo del -0.42
plot(`ano`,Precio)
cor(`ano`,Precio)
## [1] 0.7923287
Se puede observar en el gráfico, que a mayor año, mayor precio y su relación es fuerte, pues su coeficiente de correlación es de 0.79
mod=lm(ano~Precio,data=Motos)
summary(mod)
##
## Call:
## lm(formula = ano ~ Precio, data = Motos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.3847 -2.0024 0.3498 2.1285 6.3660
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.004e+03 1.411e+00 1420.456 < 2e-16 ***
## Precio 3.823e-06 4.205e-07 9.091 4.32e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.162 on 49 degrees of freedom
## Multiple R-squared: 0.6278, Adjusted R-squared: 0.6202
## F-statistic: 82.64 on 1 and 49 DF, p-value: 4.318e-12
El coeficiente de β1 = 3.823e-06, esto quiere decir que por cada año, el precio aumenta en 3.823e-06. También se puede observar que el ajuste del modelo es de R2=0.6202 es decir que el modelo explica el 62% de la variabilidad del precio. Otro dato a observar, es el p valor, el cual es extremadamente pequeño,lo que quiere decir que ambos coeficientes son importantes en la regresión