1. Introducción

El constante movimiento y la conexión mundial en la sociedad actual, ha traido con sigo la necesidad de moverse en todo momento, poder acercarse a cualquier ciudad del país, llegar a su lugar de trabajo, visitar a un amigo o conocido se han convertido en prioridades para todas las personas que conformamos a la humanidad.

Alcanzar estos objetivos nos ha llevado a buscar formas de facilitar este movimiento y transporte, es por eso que los vehículos han tomado cada vez más y más importancia. Tener la opción de obtener un vehículo por un precio razonable es una situación de interés para la mayoría de ciudadanos, que buscan un medio de transporte sin necesariamente perder un ojo de la cara para conseguirlo.

Es por esta razón que conocer más a cerca del comportamiento de los automoviles y sus precios es imperativo para gran parte de los adultos actuales.

Sin embargo, para entender el verdadero valor de estas piezas de metal llamadas automóviles, necesitamos mirar al pasado, lejos de nuestros tiempos actuales.

2. Contexto histórico

2.1 El comercio

La historia de la humanidad ha estado marcada por diferentes eventos que han definido el desarrollo y progreso de nuestra sociedad. Al pensar en estos puntos definitorios, inmediatamente pensamos en el descubrimiento del fuego, la creación de la rueda, la utilización de la agricultura o la máquina de vapor.

Sin embargo, uno de los eventos más importantes para el desarrollo humano fue la aparición del comercio. Definido como las actividades económicas que implican la transferencia de bienes y servicios entre una persona o endidad con otra, el comercio ha significado desde la prehistoria un pilar para el desarrollo de la sociedad y sus diferentes comunidades. Empezando con el trueque hace más de diez mil años en el pasado (Phillips, 1994), pasando por la primera aparición de una moneda oficial alrededor del año 600 a.c (Walker, 2002) y llegando hasta el dinero electrónico en forma de tarjetas de créditos o criptomonedas que vemos hoy en día. El comercio ha demostrado ser, incluso hoy en día, una de las mayores fuentes de motivación y deseo en el accionar humano.

2.1.1 Influencia del comercio en el transporte

Partiendo de este principio, se busca mencionar como la aparición del comercio contribuyó de manera directa a la necesidad de generar rutas comerciales con el fin de suplir la altisima demanda de bienes y servicios en toda la europa de la edad media. Estas serían las primeras muestras de necesidad por parte de la humanidad de movilizarse a diferentes partes del mundo.

A partir de esto, se generó un deseo, gusto y una necesidad por desarrollar medios que permitieran, una movilidad más fácil a través de estas rutas, usualmente para transportar, de manera eficiente, los bienes necesarios para comerciar.

Es entonces aquí donde se comienza a ver diferentes medios de transporte, siendo de los más famosos posiblemente los carruajes tirados por caballo u otros animales y los barcos utilizados en rutas marítimas.

2.2 El automóvil

No obstante, estamos interesados unicamente por la llegada del que sería una de las mayores proezas de la ingeniería en la historia del hombre y posiblemente el transporte más conocido de manera general, el automóvil.

2.2.1 Vehículos de vapor

Para hablar de la historia del automóvil como lo conocemos primero debemos remontarnos al siglo XVIII donde el inventor Nicolas-Joseph Cugnot construyó el primer vehículo impulsado de manera autónoma, utilizando un motor de vapor (Manwaring, 1966). Aunque este realmente no fue un modelo eficaz pues rapidamente el invento terminó en desastre al ser de difícil manejo por su peso y tamaño, sirvió como un primer paso para lo que vendría en años posteriores.

Tanto fue el desarrollo en este tipo de vehículos y motores a lo largo del siglo XVIII y XIX que para finales de este último, alrededor del 1873, el inventor francés Amédée Bollée, había desarrollado lo que muchos considerarían los primeros automóviles para pasejeros por carretera. Completando el primer viaje en carretera con acompañantes (12 de ellos), entre Le Mans y Paris en 18 horas, todo un hito para el momento. Otra de sus grandes hazañas se dió en 1878, cuando diseñó “La Mancelle”, un auto de vapor del que se manufactraron 50 unidades, siendo, por tanto, considerado como el primer automóvil producido en serie.

2.2.2 Automóvil de combustión

A pesar del aparente éxito que se había alcanzado con estos automóviles impulsados por vapor, siempre existió un claro problema con ellos, el casi incontrolable calentamiento de la caldera. Y es por esta razón que los inventores y constructores siempre buscarón un sustituto líquido para impulsar sus vehículos.

Es de esta necesidad que nacen los primeros intentos por crear un automóvil que se impulse a partir de combustión con combustible líquido (Se habían hecho intentos con gases). Esto nos lleva al año 1870 donde el inventor austriaco Siegfried Marcus puso en funcionamiento un simple primer carro propulsado a partir de combustión, aunque este requería poner a girar la ruedas antes de que la combustión hiciera su trabajo, razón por la que su propio creador lo desmanteló al no estar satisfecho (Encyclopaedia Britannica, 2016).

Es por esta pequeña matiz, sumada a la propaganda nazi, dada que Marcus era judío, que popularmente, se le atribuye la creación del primer automóvil propulsado por combustión al inventor alemán Karl Benz en el año 1885, que luego lo llevaría a ganar mucho reconocimiento y fama y a empezar una producción en serie de su modelo por la alta demanda que apareció del mismo en todo el territorio europeo.

2.3 El automóvil en Colombia

El grandisimo exito que presentaron los autos en todas partes de europa rapidamente se extendió hasta otras partes del mundo. En este caso, nos interesa como este invento hizo su aparición en el continente americano y, más especificamente, en Colombia.

2.3.1 Llegada del automovil

Despues del boom que se dió en los paises europeos, sólo era cuestión de tiempo para que este vehículo a combustión llegara al país cafetero. Según el periodico “Portafolio” en un artículo escrito en el 2019, el primer auto llegó a Colombia hace más de 120 años, en el 1899.

Este era un vehículo francés de la marca Dion Bouton que llegó hasta la ciudad de Medellín. Su velociad máxima era de 25 kilómetros por hora y rodaba y giraba a partir de un sistema de palancas con cadenas.

A pesar de no ser el primero en rodar por Colombia, el auto del presidente Rafael Reyes rodado en 1909 fue, en definitiva, el que más sobresalto generó entre los colombianos. Un renault importado con el fin de presentar la inauguración de una carretera en Boyacá que además se encargó de mostrar el avance en el área del transporte que había llegado.

Como es de esperarse, esta maravillosa invención, por mucho tiempo, fue vista como un lujo de los más excéntricos. Con sólo unos pocos afortunados contando con uno en su propiedad. Sin embargo, a medida que la industria automotriz se formalizó y asentó en el pais, los automoviles pasaron de ser un objeto muy exclusivo a ser algo accesible.

2.3.2 Willys o jeeps en Colombia

Uno de los vehículos más míticos y representativos de la historia colombiana, especialmente en los pueblos agrícolas, es el willy (o jeep), un automovil estadounidense todoterreno que se tornó perfecto para recorrer los complicados caminos colombianos de la época de los 50’s mientras se cargaban grandes cantidades de personas y de productos producidos en el país.

A medida que pasó el tiempo, estos vehículos perdieron popularidad, pues, al ser extranjeros, los repuestos resultaban muy caros al tener que ser importados en todo caso. Sin embargo, incluso hoy en día, los willys siguen siendo ampliamnete usados para transportar carga agrícola, personas o, en algunos casos, como atracciones en festivales por el grandisimo valor sentimental y cultural que estos tienen.

2.3.3 SOFASA

El altísimo crecimiento en la demanda de automoviles en el país, llevó al gobierno colombiano a tomar cartas en el asunto con el fin de poder ofrecer mayor facilidad a los habitantes de Colombia para obtener estos vehículos.

Es con esta idea que en el año 1969, el gobierno nacional seleccionó a la empresa francesa Reanult para la creación de una empresa ensambladora de automóviles en territorio colombiano. Es de esta manera que se establece la sociedad de fabricación de automoteres S.A, SOFASA, con el fin de ensamblar modelos renault e incrementar el avance en la industria automotriz en el pais.

Desde su creación, SOFASA ha hecho parte imprescindible de la historia colombiana, proveendo de una grandisima cantidad de diferentes autos que han marcado la cultura e historia del país. Empezando con el legendario Renault 4 en 1970, pasando por el renault 9 en 1983, famoso por ser el primer carro con encendido electrónico en el país, luego llegando al twingo, lanzado en 1994 y que, incluso a día de hoy, es uno de los autos más conocidos y recurrentes en el país cafetero; para finalmente llegar al punto de máximo interés para nosotros, el 2005, año en el que se sacó a producción, por primera vez, el modelo Logan, un modelo legendario que ha sido uno de los principales ejes del crecimiento y desarrollo rentable de renault.

3. Renault Logan

Este modelo fue introducido en el 2005, y desde su lanzamiento fue recibido como una gran opción para aquellos buscando una posibilidad de auto estilizado pero económico. Su gran éxito representó un importantisimo crecimiento para SOFASA y Renault. LLegando a convertirse en uno de los autos más reconocidos por los colombianos, pudiendo encontrarse en todas partes del país incluso hoy en día.

3.1 Equipamiento

La versión más reciente del Renault Logan cuenta con una gran variedad de equipamientos que lo colocan como una gran opción para compradores por su utilidad y seguridad.

En primer lugar, cuenta con cuatro (4) Airbags de serie, los frontales para el conductor y el copiloto, así como los airbags laterales. Esto y la estructura reforzada del auto garantizan un entorno más protegido para todos los pasajeros.

También cuenta con un control de estabilidad (ESC) que, en momentos de emergencia, sirve para recuperar el control de la trayectoria más facilmente, al controlar el frenado y la tracción de cada rueda.

Además, cuenta con un sistema de frenos ABS que impide que las ruedas se bloqueen en frenadas bruscas para que mantengan una tracción máxima.

Asimismo, es posible encontrar incluso más equipamientos para mejorar la comodidad y seguridad en el vehículo, como cinturones de seguriad de tres puntas, aire acondicionado automático, sensores de luz y lluvia, cámara de reversa, asistente en pendiente, etc. Esto según la versión que se seleccione, ya sea la Life, Life+, Zen o Intens.

3.2 Motor

Como muchos otros modelos en el mercado, el Renault Logan cuenta también con una variedad de diferentes versiones, diferenciadas principalmente por el motor que usan para impulsar el vehículo. Contamos con tres tipos de motor.

El más sencillo es un motor de 1598 cm3 de cilindraje que cuenta con 85 caballos de fuerza a 5250 revoluciones por minuto, con caja de 5 velocidades mecánica que alcanza una velocidad máxima de 168 km/h. Este solo puede encontrarse en la versión Life del logan.

Luego, se tiene un motor más potente, que comparte el mismo cilindraje y caja de velocidades al mencionado antes, pero que cuenta con 111 caballos de fuerza a más de 5500 revoluciones por minuto y que puede alcanzar una velocidad de hasta 184 km/h. Este puede encontrarse en las versiones life+, Zen e Intens del Logan.

Finalmente, el motor más caro, es una vez más uno con un cilindraje equivalente a 1598 cm3 y con 111 caballos de fuerza a 5500 revoluciones por minuto, pero que se distingue de los primeros dos pues, a diferencia de estos, cuenta con una caja de velocidades automática que le permite alcanzar una velocidad máxima de 174 km/h. Este motor tan solo puede encontrarse en la versión Intens, la más cara entre los Logan.

3.3 Precio

Anteriormente se mencionó lo económico de los Logan para tal nivel de seguridad y comodidad. Para ser específicos se puede comentar que la versión Life, la más barata, empieza con un precio de alrededor de $45.880.000. A su vez, la versión Life+, esta listado por un valor inicial de $50.180.000. Asimismo, tenemos la versión Zen, con un valor de mercado de $53.580.00. Finalemente, tenemos la versión más equipada, la Intens, la cual tiene un precio inicial de $57.880.000.

Es importante aclarar que estos precios son de consecionario y solo incluyen a las últimas versiones del Renault Logan, no versiones anteriores. De igual manera, se especificaron estos precios como iniciales, pues según las diferentes posibles configuraciones a escoger, el precio puede aumentar; ya sea al cambiar el motor, agregar accesorios, etc.

No obstante, no es este precio de consecionario el que representa interés para el análisis posterior. Sino el valor de los autos usados de esta marca y es por esto que el siguiente procedimiento se llevó a cabo.

3.4 Tucarro.com:

En Colombia existen diversos sitios que permiten publicar un vehículo de segunda mano para su venta, uno de los sitios mayor mencionados por los expertos elicitados es Tucarro.com, por lo que en base a su experticia se considerará que el sitio revela la información suficiente para estimar el precio del vehículo de interés para este estudio.

3.5 Servicio público a particulares:

Durante el desarrollo de las elicitaciones todos los expertos mencionaron que uno de los mayores causantes del detrimento del precio en el precio de los vehículos que se busca elicitar es el uso de dicho vehículo para realizar carreras a particulares, ya que entre todos hubo un acuerdo en que el Renault Logan es uno de los vehículos más rentables para realizar dicha actividad.

4. Metodología realizada para elicitar el precio del vehículo

4.1 Metodología general

La elicitación será realizada mediante el uso de muestras hipotéticas, en este caso de tamaño 20 provenientes de un experto principal.

Se designará a tres expertos para realizar la elicitación, de los cuáles dos serán de soporte para tener un panorama respecto a la elicitación del vehículo en general y el último será el experto principal, a los expertos de soporte se les realizará una breve entrevista por audio y no les será necesario brindar muestras hipotéticas pero sí un rango de precios para los respectivos modelos, de ser ameno y oportuno se brindará la oportunidad de hacer una muestra hipotética de tamaño 5 que no será tenida en cuenta para el análisis.

Para seleccionar a los expertos se tuvo en cuenta la cercanía con el experto, la experiencia que tiene en su campo y la impresión de su lógica que ofrezca. Se consideraron tres personas, Andrés Felipe como el experto principal, don Jorge e Ivan cómo expertos secundarios.

4.2 Designación de los expertos

Se designa a Andrés Felipe como el experto principal ya que reúne las primeras tres cualidades y posee afinidad con el contexto universitario, lo que garantiza seguridad para realizar la elicitación mediante el uso de muestras hipotéticas. Se designó a don Jorge y a don Iván como los expertos secundarios ya que don Jorge no manifestó tener disponibilidad para próximas elicitaciones y don Iván manifestó tener mala memoria y poca afinidad con los vehículos cuyo precio se busca elicitar.

4.3 Resultados obtenidos en las entrevista piloto

En la primer entrevista piloto se llamó a Don Jorge, un vendedor con más de 25 años de experiencia, su experticia era evidente y permitió que la conversación fuera muy amena, además, su opinión respaldó lo previamente establecido, el Renault Logan es un vehículo con alto flujo de ventas. Adicionalmente se encontraron aspectos adicionales que cambian el precio de los vehículos, cómo sí el vehículo es asegurable o no, la existencia de diferentes modelos internos entre sí y su uso para aplicaciones tipo “Uber”.

Durante el desarrollo de la elicitación se presentaron diversas dificultades, las cuales se intentan identificar a continuación, en un principio, pese a que se informó previamente acerca de la dinámica a Don Jorge se percibe que la preparación no fue la suficiente para la realización de una elicitación mediante muestras hipotéticas, segundo, hubieron grandes dificultades para realizar muestras hipotéticas de tamaño 5, finalmente, Don Jorge manifestó que una mejor forma de aproximarse al verdadero precio en el mercado del vehículo en sus dos modelos es a través del uso de la página tucarro.

Finalizando la entrevista se trata de obtener muestras hipotéticas de tamaño 5, para el modelo 2013 el experto propuso que vendería un vehículo en 25 millones de pesos y otros cuatro en 20 millones de pesos, para el modelo 2018 hubo una negativa ya que el experto no se imagina el tener 5 vehículos a la venta en la misma compraventa pero indica que el rango del precio de este modelo varía entre 32 y 38 millones de pesos.

Para la segunda entrevista piloto se llamó a don Iván, quién desde un inicio manifestó disponibilidad para resolver dudas acerca de la estimación del precio de cualquier vehículo, inicialmente se le comunicó que se buscaba comprar algún vehículo y que se requería asesoría para ello, de manera muy abierta don Iván contó algunos ‘trucos’ que utiliza en su negocio orientando que la mejor forma de estimar el precio de algún vehículo es a través de su contexto, guiándose en general por el estado del carro, sus detalles, su kilometraje y el número de dueños que ha tenido.

Se habló respecto al ambiente que se maneja en el mercado de los carros usados, la necesidad de requerir de un latonero, los problemas que surgen al momento de cerrar un negocio, la rentabilidad de utilizar algún vehículo para realizar carreras particulares y las posibles estafas que pueden ocurrir en algunas compraventas al ‘maquillar’ el kilometraje de un vehículo.

En torno al precio de los modelos, don Iván manifestó que un Renault Logan de modelo 2013 está entre los 22 y los 25 millones de pesos, para el modelo 2018 se habló sobre que su valor está a lo mínimo sobre los 34 millones de pesos.

Al evaluar los resultados encontrados al realizar las dos entrevistas piloto se encuentran resultados positivos, resaltando que en ambas entrevistas se tiene una similitud en el rango de precios, además, se tienen en común aquellos aspectos relacionados con el estado general del vehículo y su modelo.

4.4 Esquema utilizado para entrevistar al experto:

Se busca dividir la entrevista al experto en tres fases, una primer fase en la que se busque conocer acerca de su vida en general y cómo se relaciona con la industria automovilística, esta primer etapa busca condensar la siguiente información:

  • Cómo se conoce al experto
  • Por qué se elige al experto
  • Vehículos que ha tenido el experto
  • Su trayectoria en la industria automovilística
  • Lugar de trabajo

Una segunda etapa en la que se busca conocer aspectos generales acerca del Renault Logan, su diferencia entre modelos, fuentes sobre la variabilidad de su precio y una expectativa del mercado de los Renault Logan en Antioquia:

  • Modelos de Logan
  • Carros de la costa
  • Trayectoria del logan? Le gusta o no le gusta?
  • Sobrado de rico
  • Frecuencia en la que se venden logan

Finalmente, una tercera etapa en la que se realice la elicitación, habiendo previamente resolviendo dudas acerca de lo que se preguntó en las etapas anteriores:

  • ¿Cuáles son los principales clubes de Medellín?
  • Club al que pertenece
  • Explicación de la metodología, ya se contaba previamente con la pregunta
  • Elicitación, ¿Por qué esos precios?

Después se pedirá al experto ajustar muestras hipotéticas de tamaño 20 para elicitar el precio de un Renault logan de cierto modelo. Posteriormente, fuera de cámaras se preguntará al experto respecto a qué tan seguro se sintió al responder estas preguntas.

4.5 Resultados obtenidos en la entrevista:

Introducimos al experto hablando sobre cómo se conoció, justificando que se eligió ya que tiene experticia en la venta de vehículos particulares, el área automotriz en general y está adelantando actualmente estudios universitarios.

De parte del experto se habla acerca de su crianza, sus primeros vehículos, la venta de su primer vehículo, su antigua compraventa y su posterior migración a las plataformas digitales.

El experto habla sobre las características generales que posee el Renault Logan, se queja acerca de su seguridad y su carrocería y recalca que hubo un cambio significativo entre modelos de el mismo vehículo a partir del modelo 2015.

Se menciona que es un vehículo supremamente comercial, la excelente propuesta que es como vehículo de entrada, la diferencia entre la capacidad de sus motores, lo rápido que es su flujo de venta, el uso de plataformas digitales para publicar ofertas de carros, la exclusividad de los clubes de vehículos que hay en Medellín y el cambio de su precio que hay entre regiones.

Se llega a la parte de la elicitación, se recalca que previamente se preguntó acerca de las dos muestras hipotéticas que considera el experto, el experto explica uno a uno los diferentes precios dados en las muestras hipotéticas iniciando por las muestras hipotéticas para el modelo 2013 y finalizando por las muestras hipotéticas para el modelo 2018.

Durante la justificación de las muestras hipotéticas se menciona todo lo recogido previamente en las entrevistas pilotos y se realiza mediante un contexto, la posibilidad de tener un reporte en fasecolda, la existencia de vehículos de segunda mano en excelente estado, el uso de los vehículos particulares para realizar servicio público, el historial de dueños del vehículo y su carrocería en general.

Para el modelo 2013 se habla sobre un modelo que está en buenas condiciones pero que pudo haber sido utilizado para realizar servicio público, el caso hipotético en dónde sea utilizado por una persona que se desplaza solamente internamente en la ciudad pero presentando algún daño en su carrocería y un modelo en muy buen estado, con carrocería de lujo y muy poco uso.

Respecto al modelo 2018 se mencionaron modelos que pudieron haber sido utilizados para servicio público, algún coche en buen estado pero con algún daño en su carrocería, un modelo en buen estado pero cuyos acabados no son los mejores y por último modelos que tienen excelente estado y poco kilometraje.

Fuera de cámaras se pregunta al experto sobre su seguridad al determinar los precios, éste manifiesta sentirse muy seguro, en base a la entrevista y a cómo se percibe el experto se asigna un nivel de seguridad de 15. Además, se cuenta con la fortuna de que los precios dados por el experto son acordes con los precios encontrados en tucarro, dando la percepción de que hay experticia en general.

5. Distribución a priori

5.1 Valores elicitados para el precio

A partir de la elicitación realizada se obtuvieron los siguientes valores para los logan del 2013 y los logan del 2018 en miles de pesos (Es decir 32000 aquí representa un valor de 32 millones).

valores2013 = c(20900,22300,23000)
frecuencias2013 = c(8,7,5)

valores2018 = c(29.9,31.3,31.9,32.9)*1000
frecuencias2018 = c(6,4,7,3)

par(mfrow = c(2,2))

plot(valores2013,
     frecuencias2013,
     main = "Precio elicitado por muestras \nhipotéticas (2013)",
     xlab = "Precio del Logan (miles de pesos)",
     ylab = "Frecuencia")
lines(valores2013,frecuencias2013)

plot(valores2018,
     frecuencias2018,
     main = "Precio elicitado por muestras \nhipotéticas (2018)",
     xlab = "Precio del Logan (miles de pesos)",
     ylab = "Frecuencia")
lines(valores2018,frecuencias2018)


#nSim = 10000
nSeguridad2013 = 12
nSeguridad2018 = 15

media2013 = sum(valores2013*frecuencias2013)/sum(frecuencias2013)

sd2013 = sqrt(sum((valores2013-media2013)^2*frecuencias2013)/sum(frecuencias2013))

media2018 = sum(valores2018*frecuencias2018)/sum(frecuencias2018)

sd2018 = sqrt(sum((valores2018-media2018)^2*frecuencias2018)/sum(frecuencias2018))

set.seed(1123)

muestra2013_F = rnorm(nSeguridad2013,mean = media2013,sd = sd2013)
  
muestra2018_F = rnorm(nSeguridad2018,mean = media2018,sd = sd2018)

hist(muestra2013_F,
     freq = F, 
     main = "Histograma para el 2013")
lines(density(muestra2013_F))


hist(muestra2018_F,
     freq = F,
     main = "Histograma para el 2018")
lines(density(muestra2018_F))

Podemos observar primeramente, como se puede sospechar, que los precios de los logans de un mdelo más nuevo (2018 en este caso) son vistas como mayores que los modelos de un año menos reciente (2013 en este caso).

Además, al generar una muestra simulada a partir de la información dada por el experto, se puede observar más claramente el comportamiento de los precios del Logan para el año 2013 y para el 2018. Para este primero, se nota una gráfica con asimétria negativa, pues la mayor parte de esta se encuentara acumulada en la parte derecha. Para el 2018, se nota una distribución más asimétrica positivamente y que parece ser más aplanada la del 2013.

summary(muestra2013_F)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20919   21851   22213   22183   22735   23119
summary(muestra2018_F)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   30055   30806   31389   31473   32071   33335

Más precisamente, se observa como, en promedio y segun nuestro experto, tomando como referencia las muestras simuladas,los Logan del año 2013 tienen un precio de 22.18 millones de pesos colombianos. Además, es visible que tan solo el 25% de estos autos vale menos de 21.851 millones de pesos y que el 75% de estos cuesta menos de 22.73 millones de pesos, y que su precio máximo es de 23.12 millones de pesos.

Por otra parte, la muestra simulada a partir de la elicitación del año 2018 tiene un valor promedio de 31.47 millones de pesos. Se observa tambien que el 25% de los autos de este año valen por lo menos 32.07 millones de pesos y que el 75% de los autos Logan en este año tienen un valor de por lo menos 30.81 millones de pesos colombianos.

5.2 Simulación de \(\vec{\beta}\) y \(\sigma^2\)

El siguiente paso requiere que se generen muestras simuladas del precio para cada año de los carro logan, con el fin de poder calcular una regresión lineal simple entre el precio y el año, y posteriormente almacenar los parametros \(\vec{\beta}\) y \(\sigma^2\) resultantes.

Además, para poder generar la distribución de estos parametros se debe repetir este proceso varias veces (1000 en este caso) como se muestra a continuación.

set.seed(51)
starter = Sys.time()

#nSim = 10000

parametros = data.frame(beta0=NULL,beta1 = NULL,sigma2=NULL)

for (i in 1:1000){
  
  
  muestra2013 = rnorm(nSeguridad2013,mean = media2013,sd = sd2013)
  
  muestra2018 = rnorm(nSeguridad2018,mean = media2018,sd = sd2018)
  
  
  data = data.frame(precio = c(muestra2013,muestra2018), 
                    modelo = c(rep(2013,nSeguridad2013),rep(2018,nSeguridad2018)))

  lin_reg = lm(precio~modelo,data = data)
  
  parametros[i,1:2] = coef(lin_reg)
  
  parametros[i,3] = sigma(lin_reg)^2
}

(Sys.time()-starter)
## Time difference of 0.8946362 secs

Luego de simular 1000 valores para los parámetros de una regresión lineal, se obtuvieron los siguientes resultados para sus respectivas distribuciones marginales:

summary(parametros[,1:2])
##        V1                 V2      
##  Min.   :-4202298   Min.   :1630  
##  1st Qu.:-3874282   1st Qu.:1835  
##  Median :-3778314   Median :1888  
##  Mean   :-3774552   Mean   :1886  
##  3rd Qu.:-3672475   3rd Qu.:1936  
##  Max.   :-3259111   Max.   :2098
par(mfrow = c(1,2))

hist(parametros$V1,freq = F,
     main = "Histograma para beta0",
     sub = paste0("valor p - test de shapiro-wilk: ",
                  round(shapiro.test(parametros$V1)$p.value,4)),
     cex.sub = 1,
     xlab = "Beta0")
lines(density(parametros$V1),col = "green",lwd = 2)

hist(parametros$V2,freq = F,
     main = "Histograma para beta1",
     sub = paste0("valor p - test de shapiro-wilk: ",
                  round(shapiro.test(parametros$V2)$p.value,4)),
     cex.sub = 1,
     xlab = "Beta1")
lines(density(parametros$V2),col = "orange",lwd = 2)

En primer lugar, al revisar un pequeño resumen estadístico de los parámetros se puede concluir que, en el caso de \(\beta_0\), su valor promedio es de aproximadamente -3774552, el 75% de las veces su valor es mayor a -3874282 y en el 25% es mayor a -3672475. Este \(\beta_0\) no tiene un verdadero valor interpretativo pues, en primer lugar, el precio de un auto no puede ser negativo y, en segundo lugar, el año de un auto no puede ser 0. Ahora, haciendo referencia a su distribución, observamos una distribución muy simétrica que nos recuerda en gran medida a una distribución normal; de hecho si observamos el valor p para la prueba de Shapiro-Wilk para normalidad, obtuvimos valor muy elevado que nos lleva a no rechazar la normalidad de \(\beta_0\).

Para el caso de \(\beta_1\) se obtuvo un valor medio para el parámetro igual a 1886, es observable también que el 75% de los caso el beta es mayor a 1835 y el 25% de los betas es mayor a 1936. En este caso si se tiene una interpretación; específicamente este valor quiere decirnos que cada año de más en un renault logan (es decir por ejemplo de 2013 a 2014) representa un incremento en su precio de aproximadamente 1.88 millones de pesos colombianos según la información propiciada por el experto. Ahora, remontandonos a la distribución obtenida, al igual que para \(\beta_0\), vemos una distribución muy simétrica y que, una vez más como podemos observar gracias al valor p de la prueba de Shapiro-Wilk, sigue una distribución normal con media 1886 (1.88 millones).

summary(parametros$V3)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  257933  745209  904098  936896 1095940 1965869
hist(parametros$V3,freq = F,
     main = "Histograma para sigma2",
     xlab = "Sigma2")
lines(density(parametros$V3),col = "blue")

Para el caso de \(\sigma^2\) se observa un valor promedio de 936896; asimismo, el 75% de las veces es obtenido un valor para la varianza mayor a 745209, mientras que el 25% de los casos \(\sigma^2\) es mayor a 1095940, estos valores son especialmente altos debido a la escala que se utilizó. Mientras tanto, se tiene una distribución para este parámetro que parece ser asimétrica. Sin embargo, para este parámetro no es de interés ajustar una distribución normal, por lo que esto no representará un problema.

5.3 Ajustar distribuciones conocidas para \(\vec{\beta}\) y \(\sigma^2\)

Ya que se tuvo la oportunidad de simular muestras para nuestros parametros de interés y analizamos sus respecticas distribuciones de manera general, ahora queremos ajustar distribuciones conocidas al vector de betas y a sigma cuadrado:

5.3.1 Normal bivariada para \(\vec{\beta}\)

Para el caso de los betas, es sabido que estos deben distribuirse como una normal bivariada.

Que las distribuciones marginales de cada beta sean normales es un buen primer indicador de la normalidad multivariada de nuestro vector de interés. Sin embargo, no es una prueba definitoria; por lo tanto, se busca hacer uso de un test formal con el fin de probar esta normalidad mencionada.

multi_test = mvn(parametros[,1:2],mvnTest = "mardia")

multi_test$multivariateNormality
##              Test          Statistic           p value Result
## 1 Mardia Skewness   4.13237566189054   0.3883870869758    YES
## 2 Mardia Kurtosis -0.524068140860216 0.600231146612434    YES
## 3             MVN               <NA>              <NA>    YES

Utilizando entonces un test de normalidad multivariada mardia, se obtiene un valor p alto tanto para el test con kurtosis como para el test con asimetría, lo que permite no rechazar que la población de parejas de betas de la regresión vengan de una normal bivariada.

Ahora, habiendo aceptado la normalidad bivariada de los datos, se quiere estimar los correspondientes parámetros de esta. Específicamente, estimamos el vector de medias poblacional con el respectivo vector de medias muestral y la matriz de varianzas con su respectiva variante muestral, de la siguiente forma:

b0 = colMeans(parametros[,1:2])

varB = var(parametros[,1:2])

if(varB[1,2]!=varB[2,1]){varB[1,2]=varB[2,1]}

B0 = solve(varB)

Dejando entonces los parámetros:

\[\underline{\bar{X}} = \begin{bmatrix} -3774552.075 \\ 1885.968 \end{bmatrix} \] \[S^2 = \begin{bmatrix} 21591582143 & -10713534.851 \\ -10713534.851 &5315.961 \end{bmatrix} \] o dado que resulta más útil la precision de la misma:

\[{S^2}^{-1} = \begin{bmatrix} 0.0000302 & 0.06087748 \\ 0.06087748 &122.68977508 \end{bmatrix} \]

5.3.2 Gamma Inversa para \(\sigma^2\)

Ya habiendo ajustado una distribución normal bivariada para el vector de betas, es de interés realizar una procedimiento similar pero con el parámetro \(\sigma^2\). Además, en este caso, es de interés ajustar no una normal sino una gamma inversa \(IG\sim(\alpha,\beta)\)

Para realizar este ajuste nos valdremos de una propiedad de la distribución:

\[\mu = \frac{\beta}{\alpha-1}\]

\[\sigma^2 = \frac{\beta^2}{(\alpha-1)^2(\alpha-2)} = \frac{\mu^2}{\alpha-2}\] Teniendo esto en mente, y conociendo las estimaciones para la varianza y la media del parámetro \(\sigma^2\); se puede estimar el valor para el parámetro de forma \(\alpha\) y el parámetro de escala \(\beta\) de la siguiente forma:

\[\hat{\alpha} = \left(\frac{\hat{\mu}}{\hat{\sigma}} \right)^2+2\] y ya conociendo \(\alpha\):

\[\hat{\beta} = \hat{\mu}\cdot(\hat{\alpha}-1)\]

c0 = (mean(parametros$V3)/sd(parametros$V3))^2+2

d0 = mean(parametros$V3)*(c0-1)

De donde se obtiene un valor para el parámetro de forma \(\alpha = 14.17519\) y un valor para el parámetro de escala \(\beta = 12343773\).

\[\sigma^2 \sim IG(\alpha = 14.17519,\ \beta = 12343773)\] A continuación, se quiere visualizar que tan correctamente se ajusta la densidad de la gamma inversa calculada con respecto a la densidad real de la muestra simulada para el parámetro \(\sigma^2\):

valores_invgamma = dinvgamma(seq(0.1,2000000,length.out = 1000 ),
                             shape =  c0 ,
                             scale = d0 )

hist(parametros$V3,freq = F,
     main = "Histograma para sigma2",
     xlab = "Sigma2")
lines(density(parametros$V3),col = "blue")
points(seq(0.1,2000000,length.out = 1000 ),
       valores_invgamma,
       col = "red",type = "l")
legend("topright",title = "Densidad",
       c("Densidad calculada","Densidad IG estimada"),
       fill = c("blue","red"))

A pesar de no parecer que se ajusta de muy buena manera con la densidad calculada de la muestra simulada. Es necesario ajustarle una gamma inversa al parámetro \(\sigma^2\), por lo que se tomará como un ajuste lo suficientemente bueno para la distribución de este.

6. Predicción del Precio según el año del auto

Ahora, se tiene interés en calcular alguna metodología para explicar el precio de un renault Logan a partir de su año e incluyendo el valor de la distribución apriori calculada a partir del encuentro con el experto.

6.1 Muestra de renault Logan

Para lograr esto, se consiguió una muestra de renault logans de la pagina de internet “tucarro.com”, donde, de manera aleatoria, fueron seleccionados 48 autos listados. Específicamente su valor de venta y su año.

carros = read.csv("carrosAntioquia.csv",sep = ";",dec = ".")

carros$Precio = 1000*carros$Precio

Es importante mencionar que por cuestiones de facilidad se ha decidio trabajar con la variable “precio” en miles de pesos colombianos de la misma forma ilustrada anteriormente cuando se hablaba de la muestra elicitada.

6.1.1 Análisis de la muestra.

summary(carros$Precio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   14900   22500   29750   31000   36625   61860
sd(carros$Precio)
## [1] 11431.9

De manera resumida, se observa que le valor promedio de los Logan es de, aproximadamente, 31 millones de pesos. Sin embargo, es importante tener en cuenta que su desviación estándar estimada es de 11.43 millones de pesos, lo que quiere decir, como es obvio, que los precios de estos autos son muy variables entre si, probablemente debido a la distinción por el año de cada modelo.

p1 = ggplot(carros,aes(Precio))+
  geom_histogram(fill = "#00FF33",col = "black",bins = 20)+
  labs(title = "Histograma para el precio \n (en miles)")+
  theme_bw()

p2 = ggplot(carros,aes(as.factor(Modelo),Precio,col = as.factor(Modelo)))+
  geom_boxplot()+
  geom_jitter()+
  labs(x = "Año",title = "Precio según el año")+
  theme_bw()+
   theme(legend.position = "none",axis.text.x = element_text(angle = 90))

ggarrange(p1,p2)

Gráfcicamente, se observa una clara relación lineal positiva entre el año del automóvil y su respectivo precio, es decir que entre más reciente sea el año del logan, mayor será el precio de venta final de este. Lo que significa que realizar una regresión lineal es correcto y puede generar resultados muy deseables a la hora de predecir el precio de un auto a partir de su año de lanzamiento.

6.1.2 Comparación del conocimiento del experto con la muestra.

Resulta también interesante definir que tan cierta era la información del experto involucrado a comparación de la muestra que se obtuvo.

Dado que se obtuvo una media para la muestra simulada del 2013 igual a 21.91 mllones de pesos. Se busca realizar una prueba de hipótesis para probar si es factible, tomando la muestra real, que esta sea la veradera media de los Logan de este año.

t.test(carros$Precio[which(carros$Modelo==2013)],mu = media2013)
## 
##  One Sample t-test
## 
## data:  carros$Precio[which(carros$Modelo == 2013)]
## t = 1.5282, df = 2, p-value = 0.2661
## alternative hypothesis: true mean is not equal to 21915
## 95 percent confidence interval:
##  20247.76 25418.91
## sample estimates:
## mean of x 
##  22833.33

Al realizar una prueba t, se obtiene un \(\text{Valor p} = 0.2661\) suficientemente grande como para no rechazar que la media de la muestra real sea igual a la media de la muestra simulada.

Sin embargo, es claro que el tamaño de la muestra real de carros del 2013 es reducida. Por lo que realizar un test paramétrico puede ser erróneo. Por esto a continuación se emplea su variante no paramétrica.

wilcox.test(carros$Precio[which(carros$Modelo==2013)],mu= media2013)
## 
##  Wilcoxon signed rank exact test
## 
## data:  carros$Precio[which(carros$Modelo == 2013)]
## V = 6, p-value = 0.25
## alternative hypothesis: true location is not equal to 21915

De manera similar a la prueba paramétrica, el test de signos devuelve un \(\text{Valor P = 0.25 > 0.05}\), lo que llevaría a no rechazar con una confianza del 95% que la muestra simulada y la muestra obtenida en la página de internet vengan de la misma población.

No obstante, se debe tener cuidado con estos resultados, pues como se mencionó, el tamaño de la muestra real es muy pequeño, por lo que esta igualdad en las medias puede deberse unicamente a razones de aleatoriedad.

Ahora realizando un procedimiento equivalente para la muestra del 2018 tenemos:

t.test(carros$Precio[which(carros$Modelo==2018)],mu = media2018)
## 
##  One Sample t-test
## 
## data:  carros$Precio[which(carros$Modelo == 2018)]
## t = 1.413, df = 5, p-value = 0.2168
## alternative hypothesis: true mean is not equal to 31330
## 95 percent confidence interval:
##  30002.79 35897.21
## sample estimates:
## mean of x 
##     32950
wilcox.test(carros$Precio[which(carros$Modelo==2018)],mu = media2018)
## 
##  Wilcoxon signed rank exact test
## 
## data:  carros$Precio[which(carros$Modelo == 2018)]
## V = 17, p-value = 0.2188
## alternative hypothesis: true location is not equal to 31330

Al igual que la muestra del año 2013, para el 2018 se obtuvo, tanto para el caso paramétrico como para el no paramétrico, valores p suficientemente altos, \(0.2168 \text{ y } 0.2188\) respectivamente. Por lo que, para cualquier \(\alpha < 0.2168\) no se puede rechazar que la muestra propiciada por el experto y la muestra tomada de internet vengan de la misma población. Por lo que de manera general se estaría en la capacidad de aceptar la experticia del entrevistado.

Es importante igualmente reiterar en el cuidado que se debe tener a la hora de concluir al respecto dado que la muestra real es muy pequeña.

6.2 Regresión lineal MCMC

Luego de haber obtenido la distribución apriori del precio de los automóviles logan según su año de salida, y ya conociendo más acerca de la muestra real para los precios de estos; es de interés pasar a implementar un modelo con el fin de predecir el valor de un renault logan según su año. En uno de los puntos anteriores se mencionó la tendencia lineal del precio según el año; por lo tanto, puede ser interesante utilizar una regresión lineal, en este caso usando MCMC (Markov chain Monte Carlo).

Estos son métodos iterativos utilizados para muestrear de distribuciones de probabilidad que, en otro caso, serían inviables. Obteniendo una muestra de la distribución deseada a partir de estados de la cadena de markov.

Especificamente para el caso de una regresión lineal asumimos que:

\[Y_i \sim N(\beta_0X_{i0}+\beta_1X_{i1}, \ \sigma^2)\] Luego la formulación bayesiana para el modelo consiste en:

  1. La función de verosimilitud \(f(y|\beta_0,\beta_1,\sigma^2)\)

  2. La distribución apriori \(\xi(\beta_0,\beta_1,\sigma^2)\)

El interés recae en calcular las siguientes distribuciones posteriores:

  • La distribución posterior conjunta:

\[\xi(\beta_0,\beta_1,\sigma^2|y) \propto f(y|\beta_0,\beta_1,\sigma^2)\cdot\xi(\beta_0,\beta_1,\sigma^2)\]

  • Las diistribuciones marginales posteriores:

\[\xi(\beta_0|y), \ \xi(\beta_1|y), \ \xi(\sigma^2|y)\] ### 6.2.1 Construcción del modelo

En r se hace uso de la función “MCMCregress” del paquete “MCMC” para calcular los parámetros de la regresión lineal por cadenas de Markov. Esta función recibe como argumento la variable de respuesta, la variables explicativas, “b0” que representa el vector de medias para la normal bivariada de las betas, “B0” que es la matriz de precisión de la distribución del vector de betas, “c0” el parámetro de forma de la gamma inversa para \(\sigma^2\) y finalmente “d0” que es el parámetro de escala de la misma gamma inversa.

set.seed(111)


mod = MCMCregress(Precio~.,
                  data = carros,
                  b0 = b0,B0 = B0,
                  c0 = c0,d0 = d0)
summary(mod)
## 
## Iterations = 1001:11000
## Thinning interval = 1 
## Number of chains = 1 
## Sample size per chain = 10000 
## 
## 1. Empirical mean and standard deviation for each variable,
##    plus standard error of the mean:
## 
##                 Mean        SD  Naive SE Time-series SE
## (Intercept) -3926431 1.388e+05 1.388e+03      1.425e+03
## Modelo          1961 6.889e+01 6.889e-01      7.073e-01
## sigma2      31627470 6.070e+06 6.070e+04      6.409e+04
## 
## 2. Quantiles for each variable:
## 
##                 2.5%      25%      50%      75%    97.5%
## (Intercept) -4201805 -4018751 -3925550 -3833399 -3656440
## Modelo          1827     1915     1961     2007     2098
## sigma2      21790142 27311459 30937904 35152597 45483879
b1 = colMeans(mod[,1:2])

Después de haberse realizado 11000 iteraciones que resultan en 10000 muestras por cadena, se obtiene un valor para el intercepto \(\beta_0 = -3926431\), que como se vió anteriormente no tiene una interpretación real para el contexto de los datos. Por otra parte, tenemos el valor promedio para la pendiente \(\beta_1 = 1961\) que representa el aumento en \(Y\) por cada unidad más de \(X\); es decir, en este caso, significa que por cada año más reciente que es el auto, su precio aumenta, en promedio, una cantidad de 1.961 millones de pesos. De igual manera, se observa un valor para la varianza \(\sigma^2 = 31627470\).

A su vez, se observa el intervalo de probabilidad para ambos casos, siendo el más atractivo el del 95%, el cual significa que la probabilidad de encontrar el valor del intercepto \(\beta_0\) entre los valores \(-4201805 \text{ y } -3656440\) es del 95%. De manera equivalente para la pendiente \(\beta_1\), este intervalo está definido por los límites \(1827 \text{ y }2098\).

Es interesante observar como los parámetros finales que se obtuvieron, parecen en efecto verse afectadas de alguna manera por la información de la distribución a priori que brindamos. Sin embargo, dado que la seguridad del experto no era muy alta para aquellos autos del 2013, parece ser que esta influencia no es tan notoría.

plot(mod)

En la gráfica anterior se pueden observar las distribuciones marginales para cada uno de los parámetros que hacen parte del modelo. Exceptuando a \(\sigma^2\) se evidencian distribuciones muy simétricas que podrían recordar a una curva normal, esto es sobre todo cierto para los betas, pues como se vió anteriormente estoss siguen distribuciones normales tanto individual como conjuntamente.

Además, los gráficos de la izquierda permiten visualizar los cambios en la cadena de markov a través de cada una de las 11000 iteraciones.

6.2.2 Desempeño del modelo.

Después de haber creado el modelo deseado, es de interés conocer que tan buen trabajo hace este a la hora de realizar predicciones sobre el precio de los Logan a partir del año de este.

Para esto, es de utilidad observar graficamente el ajuste de la recta calculada con respecto al año y precio de estos vehículos.

plot(carros$Modelo,carros$Precio)
lines(2007:2022,b1[1]+b1[2]*2007:2022,col = "red")

De la gráfica se puede concluir que la línea generada explica correctamente la tendencia lineal que se encuentra aproximadamente hasta el 2020. Sin embargo, a partir de este año pareciera que los datos toman un comportamiento más exponencial, por lo que el modelo de regresión para el precio tiende a subestimar a partir de este año mencionado especialmente.

Se cuenta, además, con la raiz cuadrada de la suma media de los residuos del modelo, como una métrica para concluir a cerca del desempeño de la regresión, entre menor sea este valor más efectivo es el modelo de regresión para realizar predicciones.

valores_predichos = b1[1]+b1[2]*carros$Modelo


RMSE(valores_predichos,carros$Precio)
## [1] 6260.777

Se obtiene un valor que parece muy elevado. Sin embargo, este por sí sólo no es de gran ayuda. Para saber si el modelo obtenido es verdaderamente útil, se procederá a realizar una pequeña comparación con un modelo lineal construido uilizando una apriori no informativa en lugar de la distribución que fue elicitada y con un modelo de regresión lineal clásico.

mod2 = MCMCregress(Precio~.,data = carros)

summary(mod2)
## 
## Iterations = 1001:11000
## Thinning interval = 1 
## Number of chains = 1 
## Sample size per chain = 10000 
## 
## 1. Empirical mean and standard deviation for each variable,
##    plus standard error of the mean:
## 
##                 Mean        SD  Naive SE Time-series SE
## (Intercept) -4697564  353896.5  3538.965       3538.965
## Modelo          2346     175.6     1.756          1.756
## sigma2      27624120 6090113.0 60901.130      62547.638
## 
## 2. Quantiles for each variable:
## 
##                 2.5%      25%      50%      75%    97.5%
## (Intercept) -5391377 -4928946 -4692806 -4464027 -4007618
## Modelo          2004     2230     2343     2461     2689
## sigma2      18241517 23346788 26780865 31055032 41808522
b1_2 = colMeans(mod2[,1:2])

valores_pred_ni = b1_2[1]+b1_2[2]*carros$Modelo

RMSE(valores_pred_ni,carros$Precio)
## [1] 5025.867
mod3 = lm(Precio~.,data = carros)

summary(mod3)
## 
## Call:
## lm(formula = Precio ~ ., data = carros)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -7198  -3690  -1049   2028  16630 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -4700844.2   345990.5  -13.59   <2e-16 ***
## Modelo          2347.2      171.6   13.68   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5134 on 46 degrees of freedom
## Multiple R-squared:  0.8026, Adjusted R-squared:  0.7983 
## F-statistic:   187 on 1 and 46 DF,  p-value: < 2.2e-16
RMSE(predict(mod3,newdata = carros),carros$Precio)
## [1] 5025.861
rmses = data.frame(tipo =c("apriori elicitada","No informativa","Regresión clásica"),
                   rmse = c(RMSE(valores_predichos,carros$Precio),
                            RMSE(valores_pred_ni,carros$Precio),
                            RMSE(predict(mod3,newdata = carros),carros$Precio)), 
                   sigma2 = c(31627470,27624120,sigma(mod3)^2))

p1 = ggplot(rmses,aes(tipo,rmse,fill = tipo))+
  geom_col()+
  theme(legend.position = "none")+
  labs(title = "RMSE según el tipo de regresión")

p2 = ggplot(rmses,aes(tipo,sigma2,fill = tipo))+
  geom_col()+
  theme(legend.position = "none")+
  labs(title = "Varianza para cada regresión")

ggarrange(p1,p2,ncol = 1)

A pesar de utilizar una distribución no informativa como apriori, parece ser que se obtiene un modelo incluso más adecuado que el modelo calculado con la distribución elicitada. Además, es menester mencionar que la varianza de la regresión que utiliza una distribución apriori elicitada es mucho mayor que la varianza del modelo con la apriori no informativa, lo que puede representar una ventaja para este último a la hora de predecir nuevas observaciones nunca antes vistas.

Este mismo comportamiento se repite a la hora de calcular una regresión lineal clásica; pues como puede observarse, su RMSE es incluso más reducido que en el caso de la apriori no informativa, y además su varianza es aún más pequeña, lo que resultaría en este siendo la mejor elección de modelo para el caso.

6.3 Distribución posterior

Parte del interés de construir la anterior regresión por MCMC es conocer su respectiva distribución posterior. Los parámetros finales para esta son los siguientes.

b1
##  (Intercept)       Modelo 
## -3926431.394     1961.415
B1 = solve(var(mod[,1:2]))

B1
##              (Intercept)       Modelo
## (Intercept) 3.058078e-05   0.06162822
## Modelo      6.162822e-02 124.19707264
m.var1 = mean(mod[,3])
v.var1 = var(mod[,3])

c1 = m.var1^2/v.var1 + 2
d1 = m.var1*(c1-1)

c1 
## [1] 29.14527
d1
## [1] 890163575

Es decir que nuestro vector de medias para la normal bivariada posterior viene dado por:

\[\underline{\bar{X}}_1 = \begin{bmatrix} -3926431.394 \\ 1961.415 \end{bmatrix}\]

Y su respectiva matriz de precisión como: \[{S_1^2}^{-1} = \begin{bmatrix} 0.0000306 & 0.06162822 \\ 0.06162822 &124.19707264 \end{bmatrix} \] Asimismos, contamos con los parámetros de la distribución posterior para \(\sigma2\)^:

\[\alpha_1 = 29.14527\] \[\beta_1 = 890163575\]

Además, con el fin de observar las distribuciones resultantes, se realizan los siguiente gráficos:

ab = matrix(c(1650,-4500000,2300,-3350000),2,2)
nbin = c(20,20)
bins = bin2(mod[,c(2,1)],ab,nbin)

m = c(5,5)

f = ash2(bins,m)

image(f$x,f$y,f$z)
contour(f$x,f$y,f$z,add=TRUE)

plot(density(mod[,3]),main = "Densidad posterior de sigma2")

7. Conclusiones.

8. Bibliografía.