Uno de los modelos más exitosos de la historia de Renault en Colombia es el Renault Clio Campus (Colcarros.com). La marca fabricante Renault lo presenta como un automóvil de turismo que puede tener carrocería tipo hatchback(tres o cinco puertas) o sedan (4 puertas). La comercialización de este modelo inició en 1990 y hasta el día de hoy (2021) se siguen creando más versiones del mismo, con las cuales se están adaptando al mercado global que busca una disminución en el consumo de gasolina y de emisiones dañinas para el medio ambiente, por lo que han sacado versiones que funcionan con gas y otras de tipo hibrido (gasolina y energia). Hay que especificar que el periodo de fabricación de estos vehiculos en Colombia se dio desde el 2001 hasta el 2016. Luego de que en octubre del 2016 finalizara la produccion del auto en Argentina, se conoció que a finales de diciembre del mismo año fue ensamblado el último Clio en la factoría de Renault-Sofasa en Envigado, Antioquia, y sus últimas unidades se vendieron en los diferentes concesionarios de la marca, hasta agotar existencias (Wikipedia).
En especial, el modelo 2013 del Clio campus fue uno de los que más se vendió en colombia, la revista Motor menciona que más de 63 mil de estos vehiculos se han vendido en Colombia durante los más de 15 años de presencia en el mercado. Este carro contaba, de fábrica, con las siguientes especificaciones técnicas:
– Motor(cilindrada): 1149 cc
– Potencia: 75HP/5500rpm
– Torque: 10,7Kg.m
– Velocidad máxima: 161 km/h
– En cuanto a la dirección se tienen dos alternativas, una mecanica y la otra es asistida.
– Transmisión: Mecánica de 5 velocidades.
La mayoría de los modelos del Clio campus son muy parecidos en cuanto a su apariencia física y especificaciones técnicas. Sin embargo, una vez se vió finalizada la producción del Twingo (automóvil producido por la misma empresa, el cual también tuvo gran éxito), Renault-Sofasa (ensambladora del Clio campus para Colombia) hizo un movimiento inteligente, le instaló al carro un motor de 1.2 litros para no perder presencia en el renglón de entrada de los vehículos nuevos de menos de 25 millones (Revista Motor).
Por otra parte, este auto tambien cuenta con un equipamiento básico que es:
– Toma de 12V y encendedor de cigarrillos.
– Luz de tercer Stop.
– Apoyacabezas en los asientos delanteros regulables en altura.
– Columna de dirección colapsable.
– Sistema antiarranque por reconocimiento de llave.
– Doble luz de reversa.
– Aire acondicionado.
– Radio CD/MP3/USB.
Renault enfocó este carro para un segmento de clientes de clase media que tienen un presupuesto limitado para conseguir un vehiculo. Además, en cuanto a los gastos adicionales, es decir, gastos de mantenimiento y otros se puede decir que es “suave para el bolsillo”, ya que para este Clio se proyecta una revisión preventiva gratis a los 1000 kilómetros y luego cada 10 mil, hasta los 50 mil, el propietario debe visitar el taller. La más económica de estas visitas le saldrá en un poco más de 227 mil pesos y la más cara 469 mil (Revista Motor).
En general, este ha sido un carro que a lo largo del tiempo que ha sido comercializado, ha permitido que personas que no tienen recursos muy altos puedan adquirir un automóvil para transportarse, ya sea a su trabajo, estudio o simplemente para pasear en familia por el país.
Se pretende modelar el precio de oferta de un automóvil Clio por medio de un modelo de regresión lineal simple, cuya variable explicatoria será el año de producción del carro. Para esto, se elicitó, con un “experto” en el tema de la venta de este carro, información sobre el precio de oferta para los modelos del año 2011, 2013 y 2015 con el método de elicitación por muestras hipotéticas. Con esta información se va a generar el modelo de regresión lineal antes mencionado:
\[Y_i = \beta_0 + \beta_1*X + Error\]
\[Error \sim N(0,\sigma^2) \]
Daniel Restrepo de 36 años es ingeniero químico de la Universidad Nacional de Colombia y es apasionado por los automóviles, a edades muy tempranas jugaba muchísimos videojuegos de simulación de carreras de autos, desarrollando así muchísimo gusto por los vehículos motorizados en general. A medida que fue creciendo comenzó a familiarizarse con conceptos de mecánica y de especificaciones de los automotores. A lo largo de su vida ha conducido gran variedad de vehículos, antes de la pandemia por el COVID-19 asistía a muchos eventos automotrices, ganando así experiencia tratando con profesionales en el tema de compraventa.
Constantemente revisa el mercado de autos de segunda mano a la venta en páginas como tucarro.com y OLX.com, además observa videos de modificacines, reviews y publicidad de automóviles. El “experto” conduce un Renault Clio 2013 de manera cotidiana y ha ayudado a varios de sus amigos a comprar carros Clio del año 2014 y 2015. Por lo anterior se escogió este “experto” para realizarle la elicitación, ya que está familiarizado con los precios actuales del mercado para el automotor escogido.
Se consultó la página tucarro.com como una ayuda para reconocer los precios de los Renault Clio y generar unos rangos de precios aceptables para realizar la elicitación, es decir, para tener una idea aproximada de los límites que debía tener la elicitación inicialmente. Para la modelación del precio de oferta de un automovil Clio en antioquia, se va a utilizar la variable del modelo del automovil o mejor dicho el año de producción de éste.
Inicialmente se le explicó al experto que debía suponer que tenía un total de 10000 autómoviles Clio por cada modelo (2011,2013 y 2015) y que deacuerdo a los rangos de precios debía proponer cuanta cantidad de la muestra de autos creía que cuestan el rango de precios en cuestión. Algo importante que mencionar es que el “experto” preguntó si podía hablar en porcentajes, ya que veía dificultad a la hora de dar un valor puntual para cada precio y se le autorizó a esto.
En cada rango de precios propuesto se realizó la siguiente pregunta al “experto” : ¿Cuánta cantidad de la muestra de 10000 autos Clio cree usted que cuestan -una cantidad en millones de pesos-?"
Inicialmente se le propuso a la persona con la que se hizo el simulacro la plantilla de elicitación por muestras hipotéticas con un rango de 10 a 30 millones de pesos colombianos, se establece una muestra de 10000 Clios y se realiza la elicitación para 3 modelos diferentes, los cuales serán: 2011, 2013 y 2015. A continuacion se observan los resultado obtenidos y algunos puntos que se observaron para mejorar el proceso de elicitación:
| Precios de oferta | 10M | 12.5M | 15M | 17.5M | 20M | 22.5M | 25M | 27.5M | 30M |
|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada | 0 | 0 | 500 | 700 | 1000 | 1500 | 2000 | 3000 | 1300 |
| Precios de oferta | 10M | 12.5M | 15M | 17.5M | 20M | 22.5M | 25M | 27.5M | 30M |
|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada | 0 | 0 | 0 | 300 | 600 | 1100 | 1500 | 2500 | 4000 |
| Precios de oferta | 10M | 12.5M | 15M | 17.5M | 20M | 22.5M | 25M | 27.5M | 30M | 32.5M | 35M |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada | 0 | 0 | 0 | 0 | 500 | 1000 | 1000 | 1500 | 2000 | 3000 | 1000 |
Luego de hacer las elicitaciones para cada modelo del automóvil, el sujeto del simulacro se sintió muy limitado a la hora de repartir los vehículos por debajo de 30 millones, según él pueden haber Clios que valgan más de esta cantidad si están en buen estado. Dado esto, y una nueva revisión de los precios de los automóviles, se decidió ampliar en al menos 15 millones el rango de precios y aumentar el ancho de los intervalos de 2.5 millones a 4 millones obteniendo la siguiente tabla para realizar la elicitación al “experto”:
| Precios de oferta | 8M | 12M | 16M | 20M | 24M | 28M | 32M | 36M | 40M | 44M | 48M |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada |
En las tablas siguientes se consigna la información elicitada con el “experto”:
| Precios de oferta | 8M | 12M | 16M | 20M | 24M | 28M | 32M | 36M | 40M | 44M | 48M |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada | 0 | 1000 | 2000 | 4000 | 2000 | 1000 | 0 | 0 | 0 | 0 | 0 |
| Precios de oferta | 8M | 12M | 16M | 20M | 24M | 28M | 32M | 36M | 40M | 44M | 48M |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada | 0 | 0 | 2000 | 3000 | 3000 | 2000 | 0 | 0 | 0 | 0 | 0 |
| Precios de oferta | 8M | 12M | 16M | 20M | 24M | 28M | 32M | 36M | 40M | 44M | 48M |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Muestra asignada | 0 | 0 | 0 | 3000 | 4000 | 2000 | 1000 | 0 | 0 | 0 | 0 |
A diferencia del individuo encuestado en el simulacro, el experto no tuvo necesidad de los valores superiores a 32 millones.
A partir de lo dialogado con el “experto” y evaluando su percepción del mercado, éste se atribuyó un nivel de conocimiento “Bueno” para los 3 modelos del Clio propuestos, por lo que se usará un tamaño muestral de 10 unidades para la realización de la simulación.
En los siguientes links se puede observar la documentación de las elicitaciones hechas al experto:
Uno de los aspectos más importantes que se observó para mejorar en las elicitaciones, fue presentar de una forma más clara el contexto del estudio que se está realizando al “experto”. Además, se necesita mejorar en cuanto a la presentación de las preguntas para que la entrevista sea más dinámica y más cómoda para el “experto”, ya que esto ayuda a que las respuestas sean mucho más acertadas.
A continuación se muestra el codigo realizado para estimar los parámetros de la distribución apriori de \((\beta_0,\beta_1,\sigma^2)'\). Esta apriori se estimará por medio de las distribuciones Normal Bivariada y la Gamma Inversa, con la primera se estimará \((\beta_0,\beta_1)'\) y con la segunda \(\sigma^2\), es decir, la estimación de la apriori será igual al producto entre la Normal Bivariada y la Gamma Inversa.
# CLIO modelo 2011.
PreciosOferta1 = c(12,16,20,24,28) #Precios en millones de pesos.
frec1 = c(1000,2000,4000,2000,1000)
Promedio1 = sum(PreciosOferta1*frec1)/sum(frec1)
desv1 = sd(c(rep(12,1000),rep(16,2000),rep(20,4000),rep(24,2000),rep(28,1000)))
# CLIO modelo 2013.
PreciosOferta2 = c(16,20,24,28) #Precios en millones de pesos.
frec2 = c(2000,3000,3000,2000)
Promedio2 = sum(PreciosOferta2*frec2)/sum(frec2)
desv2 = sd(c(rep(16,2000),rep(20,3000),rep(24,3000),rep(28,2000)))
# CLIO modelo 2015.
PreciosOferta3 = c(20,24,28,32) #Precios en millones de pesos.
frec3 = c(3000,4000,2000,1000)
Promedio3 = sum(PreciosOferta3*frec3)/sum(frec3)
desv3 = sd(c(rep(20,3000),rep(24,4000),rep(28,2000),rep(32,1000)))
# Función para la generación de los parámetros estimados de la regresión.
Parametros_Regre<-function(y,x){
Modelo <-lm(y~x)
Varianza <-sum(Modelo$residuals^2)/Modelo$df
return(c(Modelo$coefficients,Varianza))
}
# simulación para hallar la apriori de (beta0,beta1,sigma^2)'
# en base a la información del experto.
set.seed(123)
Parametros = c()
n_seguridad= 10
Años = c(rep(2011,n_seguridad),rep(2013,n_seguridad),rep(2015,n_seguridad))
for(i in 1:1000){
# Muestra para el modelo 2011
muestra1 = rnorm(n_seguridad,Promedio1,desv1)
# Muestra para el modelo 2013
muestra2 = rnorm(n_seguridad,Promedio2,desv2)
# Muestra para el modelo 2015
muestra3 = rnorm(n_seguridad,Promedio3,desv3)
MuestrasPrecios = c(muestra1,muestra2,muestra3)
Parametros = rbind(Parametros,Parametros_Regre(MuestrasPrecios,Años))
}
La apriori de \((\beta_0,\beta_1)'\) es una normal bivariada.
# Estimación de parámetros de la Normal Bivariada como apriori de (beta0,beta1)'
# Media b0
VectorMedias1 <- colMeans(Parametros[,1:2])
# Matriz de varianzas covarianzas(Precisión B0)
VarCov1 <- round(solve(var(Parametros[,1:2])),3)
VectorMedias1
## (Intercept) x
## -2142.685387 1.075408
VarCov1
## (Intercept) x
## (Intercept) 1.924 3873.307
## x 3873.307 7797757.203
La apriori para \(\sigma^2\) es una Gamma-Inversa.
Media1 <- mean(Parametros[,3])
Varianza1 <- var(Parametros[,3])
# Estimación de parámetros de la Gamma Inversa como apriori de sigma^2
alfa1 = (Media1^2/Varianza1)+2
beta1 = Media1*(alfa1-1)
alfa1
## [1] 16.50897
beta1
## [1] 260.3881
En la simulación se obtuvo que la apriori para \((\beta_0,\beta_1,\sigma^2)\) es igual a una distribución Normal Bivariada con vector de medias igual a \((-2142.685387,1.075408)\) y precisión igual a:
\[\begin{pmatrix} 1.923953 & 3873.307\\ 3873.307436 & 7797757.203 \end{pmatrix}\]
multiplicada por una distribución Gamma Inversa con \(\alpha = 16.50897\) y \(\beta = 260.3881\).
Los datos muestrales para los automóviles Clio se obtuvieron de las páginas web tucarro.com, carroya.com y OLX.com.
# Lectura del paquete para la aplicación de MCMCregress
# Lectura del paquete para realizar gráficas.
library(MCMCpack)
library(ggplot2)
Se creó un dataframe con 88 precios de oferta de automóviles Clio:
# Lectura de datos.
data_clio <- read.csv(file.choose(), sep = "\t")
# Cambiando nombres de las columnas del dataframe.
names(data_clio) = c("Precio", "Año")
# Cabecera de los datos.
head(data_clio)
data_clio$Año<-as.factor(data_clio$Año)
p <- ggplot(data_clio, aes(x=Año, y=Precio/1000000,color=Año)) +
geom_boxplot()+labs(x="Año",y="Precio en COP(millones).",colour="Año.")+
ggtitle("Precios de oferta para carros Clio por año de producción.")
p
data_clio$Año<-as.integer(data_clio$Año)
En la gráfica anterior se observa que los precios de los datos muestrales de los Clio 2015 son en promedio mayores que los del 2011 y 2013.
# Creación del modelo Bayesiano.
mod_bayesiano <- MCMCregress(data_clio$Precio~data_clio$Año,
b0 = VectorMedias1, B0 = VarCov1, c0 = alfa1, d0 = beta1)
# Resumen del modelo Bayesiano.
summary(mod_bayesiano)
##
## Iterations = 1001:11000
## Thinning interval = 1
## Number of chains = 1
## Sample size per chain = 10000
##
## 1. Empirical mean and standard deviation for each variable,
## plus standard error of the mean:
##
## Mean SD Naive SE Time-series SE
## (Intercept) -2.142e+03 1.436e+02 1.436e+00 1.386e+00
## data_clio$Año 1.075e+00 7.135e-02 7.135e-04 6.882e-04
## sigma2 3.842e+14 5.437e+13 5.437e+11 5.437e+11
##
## 2. Quantiles for each variable:
##
## 2.5% 25% 50% 75% 97.5%
## (Intercept) -2.426e+03 -2.238e+03 -2.140e+03 -2.045e+03 -1.861e+03
## data_clio$Año 9.355e-01 1.027e+00 1.074e+00 1.123e+00 1.216e+00
## sigma2 2.919e+14 3.454e+14 3.796e+14 4.170e+14 5.036e+14
# Vector de medias.
VectorMedias2 = colMeans(mod_bayesiano[,1:2])
# Matriz de varianzas y covarianzas.
VarCov2 = solve(var(mod_bayesiano[,1:2]))
VectorMedias2
## (Intercept) data_clio$Año
## -2141.952077 1.075044
VarCov2
## (Intercept) data_clio$Año
## (Intercept) 1.905844 3836.514
## data_clio$Año 3836.513732 7723198.285
# Estimación de parámetros de la Gamma inversa como apriori
# de sigma^2.
Media2 = mean(mod_bayesiano[,3])
Varianza2 = var(mod_bayesiano[,3])
alfa2 = (Media2^2/Varianza2)+2
beta2 = Media2*(alfa2-1)
alfa2
## [1] 51.91916
beta2
## [1] 1.956076e+16
Para la comparación entre los parámetros obtenidos en la simulación (Distribución apriori) y su actualización con los datos muestrales (Distribución aposteriori) tomados de páginas web como tucarro.com, OLX.com y carroya.com, se hará uso de los siguientes resultados:
# Comparación del vector de medias.
VectorMedias1 # Elicitación.
## (Intercept) x
## -2142.685387 1.075408
VectorMedias2 # Datos muestrales.
## (Intercept) data_clio$Año
## -2141.952077 1.075044
Para los vectores de medias de los parámetros estimados para los modelos del automóvil de la elicitación y de los datos muestrales; se tiene que en los datos de la elicitación, \(\beta_1\) tiene un peso mayor en función del modelo(año) del Clio, es decir, que por cada año que aumente el modelo del carro, el precio de oferta de éste va a aumentar en $1.075.408 pesos colombianos, además, en comparación, su intercepto es menor. En general, se esperaría que hacer predicciones con ambos modelos da estimaciones muy parecidas.
Por otra parte, se concluye que el “experto” tenía bastante claro los precios del mercado de los automóviles Clio, ya que al obtener la distribución aposteriori (actualizando la apriori con los datos muestrales) no se ven diferencias muy grandes entre esta distribución y la apriori.
# Comparación de las matrices de Varianzas y Covarianzas.
VarCov1 # Elicitación.
## (Intercept) x
## (Intercept) 1.924 3873.307
## x 3873.307 7797757.203
VarCov2 # Datos muestrales.
## (Intercept) data_clio$Año
## (Intercept) 1.905844 3836.514
## data_clio$Año 3836.513732 7723198.285
En cuanto a la variabilidad del modelo se encontró que la varianza de los parámetros de los modelos estimados a partir de las respuestas del “experto” poseen un mayor grado de dispersión, esto se pudo dar ya que el “experto” intentó abarcar, en la elicitación, un rango más amplio de precios que los reales.
alfa1 # Elicitación.
## [1] 16.50897
beta1 # Elicitación.
## [1] 260.3881
alfa2 # Datos muestrales.
## [1] 51.91916
beta2 # Datos muestrales.
## [1] 1.956076e+16
La diferencia entre el \((\alpha_1, \beta_1)\) y \((\alpha_2,\beta_2)\) se debe en su mayoría a que la variabilidad del \(\sigma^2\) para las regresiones obtenidas en base a los datos muestrales es mayor que la variabilidad del \(\sigma^2\) de las regresiones obtenidas de los datos elicitados con “experto”, esto se puede observar en los siguientes valores:
Varianza1 #Experto
## [1] 19.42851
Varianza2 #Muestrales
## [1] 2.956254e+27
# Cabecera del modelo Bayesiano.
head(mod_bayesiano)
## Markov Chain Monte Carlo (MCMC) output:
## Start = 1001
## End = 1007
## Thinning interval = 1
## (Intercept) data_clio$Año sigma2
## [1,] -2077.089 1.043151 4.439424e+14
## [2,] -2173.544 1.091223 3.538979e+14
## [3,] -2086.683 1.047265 4.766726e+14
## [4,] -2277.579 1.142018 3.423820e+14
## [5,] -2212.071 1.109865 3.053561e+14
## [6,] -2391.766 1.198946 4.850008e+14
## [7,] -2290.449 1.148712 3.273939e+14
# Cabecera del modelo simulado con la elicitación.
head(Parametros)
## (Intercept) x
## [1,] -1221.4359 0.6176995 15.79829
## [2,] -1902.2595 0.9563488 11.84252
## [3,] -2515.2763 1.2605501 13.68203
## [4,] -615.3153 0.3165127 13.31961
## [5,] -1536.1403 0.7737517 21.57772
## [6,] -1992.9550 1.0013541 15.03799
En las cabeceras de datos mostradas anteriormente, se puede observar la gran diferencia en las estimaciones de las varianzas para cada modelo de regresión en el modelo Bayesiano y el modelo generado con los datos de la elicitación.
Esto se puede visualizar en la unidades de la varianza en los gráficos de densidad que siguen:
# Gráficos de densidad de varianza.
par(mfrow = c(1,2))
plot(density(mod_bayesiano[,3]), main = "Densidad de la varianza \n modelo Bayesiano",
xlab = "Varianza", col = "red")
plot(density(Parametros[,3]), main = "Densidad de la varianza \n modelo elicitado",
xlab = "Varianza", col = "red")
Finalización de la producción del Clio en Colombia:
https://www.elcarrocolombiano.com/industria/sofasa-finalizo-ensamble-del-renault-clio-en-colombia/
Datos importantes sobre el Clio:
Especificaciones técnicas del automóvil Clio:
http://www.colcarros.com/comunidad/renault-clio-campus-2013.html