Introducción

En este ejercicio se hará una regresión múltiple con el ejemplo de Carter-Hill et. al. (2011) de las ventas de la tienda Andy’s, dado el precio promedio de los artículos vendidos y el gasto en publicidad. Todo medido en dólares de los Estados Unidos. Se exponen las primeras 10 filas de la tabla de datos:

Tabla de datos de las ventas mensuales de Andy’s
Ventas Precio Publicidad
73.2 5.69 1.3
71.8 6.49 2.9
62.4 5.63 0.8
67.4 6.22 0.7
89.3 5.02 1.5
a Cifras en miles de USD.

La idea es hacer una ecuación que estime la media condicionada de las ventas:

\[\begin{equation} \widehat{ventas}_t=\alpha+\beta_1\cdot precio_t+\beta_2 \cdot publicidad_t \end{equation}\]

Análisis

Como punto de partida, se hace la primera ecuación del modelo de regresión con todas sus variables:

Dependent variable:
Ventas
Precio -7.908***
(1.096)
Publicidad 1.863***
(0.683)
Constant 118.914***
(6.352)
Observations 75
R2 0.448
Adjusted R2 0.433
Residual Std. Error 4.886 (df = 72)
F Statistic 29.248*** (df = 2; 72)
Note: p<0.1; p<0.05; p<0.01

Como se puede apreciar todos los coeficientes, en lo individual (p-values) y en conjunto (estadístico F) son significativos. A su vez, se cumple la relación estadística esperada. Es decir, existe una relación inversa y significativa entre el precio promedio ponderado de los artículos y el nivel de ventas (en miles de dólares). De manera complementaria, se cumple la expectativa de que existe una relación positiva y significativa entre el gasto en publicidad y el nivel de ventas.

El modelo tiene un nivel de explicación de 43.2931589%.

Sin embargo, cabe una pregunta: se está trabajando con ventas y gasto en publicidad en miles de dólares, así como incrementos unitarios del precio promedio. ¿Qué sucedería si se trabaja con logaritmos (logaritmos naturales) de estas variables? Estos, se interpretan como una potencial variación porcentual de las variables. Dicho esto, se correrá el modelo, con los logaritmos de las variables y se verá si se cumplen las hipótesis del modelo y si es un mejor modelo que el anterior.

Dependent variable:
log(Ventas)
log(Precio) -0.575***
(0.079)
log(Publicidad) 0.045***
(0.014)
Constant 5.320***
(0.138)
Observations 75
R2 0.469
Adjusted R2 0.454
Residual Std. Error 0.062 (df = 72)
F Statistic 31.810*** (df = 2; 72)
Note: p<0.1; p<0.05; p<0.01

Criterios de información:

Función de log-verosimilitud

Veamos la tabla comparativa:

========================================================== Dependent variable:
—————————- Ventas log(Ventas) (1) (2)
———————————————————- Precio -7.908***

Publicidad 1.863***

log(Precio) -0.575***

log(Publicidad) 0.045***

Constant 118.914*** 5.320***

LFF -223.8695 103.2063 Observations 75 75 R2 0.448 0.469 Adjusted R2 0.433 0.454 Residual Std. Error (df = 72) 4.886 0.062 F Statistic (df = 2; 72) 29.248*** 31.810 ========================================================== Note: p<0.1; p<0.05; ***p<0.01
Precio -7.908***
Publicidad 1.863***
log(Precio) -0.575***
log(Publicidad) 0.045***
Constant 118.914*** 5.320***

LFF -223.8695 103.2063
Akaike 455.739 -198.4125
Observations 75 75
R2 0.448 0.469
Adjusted R2 0.433 0.454
Residual Std. Error (df = 72) 4.886 0.062
F Statistic (df = 2; 72) 29.248*** 31.810***
========================================================== Note: p<0.1; p<0.05; p<0.01

Criterio de información de Schwarz (criterio de información bayesiana)

Ahora se calcula el criterio de información de Schwarz:

========================================================== Dependent variable:
—————————- Ventas log(Ventas) (1) (2)
———————————————————- Precio -7.908***

Publicidad 1.863***

log(Precio) -0.575***

log(Publicidad) 0.045***

Constant 118.914*** 5.320***

LFF -223.8695 103.2063 Akaike 455.739 -198.4125 BIC 465.009 -189.1426 Observations 75 75 R2 0.448 0.469 Adjusted R2 0.433 0.454 Residual Std. Error (df = 72) 4.886 0.062 F Statistic (df = 2; 72) 29.248*** 31.810 ========================================================== Note: p<0.1; p<0.05; ***p<0.01
Precio -7.908***
Publicidad 1.863***
log(Precio) -0.575***
log(Publicidad) 0.045***
Constant 118.914*** 5.320***

LFF -223.8695 103.2063
Akaike 455.739 -198.4125
BIC 465.009 -189.1426
Hannan-Quinn 456.5151 -197.6365
Observations 75 75
R2 0.448 0.469
Adjusted R2 0.433 0.454
Residual Std. Error (df = 72) 4.886 0.062
F Statistic (df = 2; 72) 29.248*** 31.810***
========================================================== Note: p<0.1; p<0.05; p<0.01

Estimación de Nuevos Modelos

Dependent variable:
Ventas
Publicidad 1.733*
(0.890)
Constant 74.180***
(1.799)
Observations 75
R2 0.049
Adjusted R2 0.036
Residual Std. Error 6.370 (df = 73)
F Statistic 3.787* (df = 1; 73)
Note: p<0.1; p<0.05; p<0.01
Dependent variable:
log(Ventas)
log(Publicidad) 0.046**
(0.018)
Constant 4.323***
(0.013)
Observations 75
R2 0.082
Adjusted R2 0.069
Residual Std. Error 0.081 (df = 73)
F Statistic 6.518** (df = 1; 73)
Note: p<0.1; p<0.05; p<0.01

Función de log-verosimilitud

#Función de Akaike

Criterio de información de Schwarz (criterio de información bayesiana)

##Función Hannan QuinPu

========================================================== Dependent variable:
—————————- Ventas log(Ventas) (1) (2)
———————————————————- Publicidad 1.733*

log(Publicidad) 0.046**

Constant 74.180*** 4.323***


LLFPu -244.2731 82.6687
AkaikePu 494.5463 -159.3375
BICPu 501.4988 -152.385
Hannan-QuinnPu 494.397 -159.4868
Observations 75 75
R2 0.049 0.082
Adjusted R2 0.036 0.069
Residual Std. Error (df = 73) 6.370 0.081
F Statistic (df = 1; 73) 3.787* 6.518**
========================================================== Note: p<0.1; p<0.05; p<0.01

Conclusiones

Se calculó la Función de Log-Verosimilitud, para la estimación de los tres criterios de información más comunes: Akaike, Schwarz y Hannan Quinn.

Observamos que en el comparativo entre los modelos de regresión original y el modelo calculado con logaritmos, en el cual se agregaron los tres criterios de información que generalmente son utilizados para identificar el modelo que más se ajusta a los valores (Akaike, Schwarz y Hannan Quinn), nos dice que los resultados de los criterios de información Akaike, Schwarz y Hannan Quinn, el modelo calculado en Logaritmos es el modelo más sencillo, más preciso y presenta una menor diferencia entre los valores observados y los valores esperados.

Tanto en el modelo original como en el que utiliza logartimos, la relación entre las variables es la esperada ya que existe una relación positiva entre la publicidad y las ventas. Ambos modelos presentan coeficientes significativos, el modelo original con el 90% de confianza y el modelo logarítmico con el 95%.

También se observa que en el modelo Original con el incremento de un dolar en la publicidad se tiene un incremento de 1,733 USD; mientras que en el modelo en Logaritmos se tiene un incremento de un 1% en la publicidad y un aumento del 0.046% en las ventas.

De acuerdo con el coeficiente de determinación R2 el primer modelo explica en 4.9319% a las ventas y el segundo en 8.1969%. El valor del estadístico F bajó en ambos modelos e indica que la variable Publicidad podría no considerarse en el modelo, aunque este estadístico es de mayor utilidad cuando se tienen al menos dos regresoras.

De acuerdo con la tabla comparativa y los resultados de los criterios de información Akaike, Schwarz y Hannan Quinn, se puede observar que el modelo calculado en Logaritmos es el modelo más sencillo, más preciso y que presenta una menor diferencia entre los valores observados y los valores esperados.

Las ventas son influenciadas por los cambios en los gastos de publicidad. Es muy importante una campña publicitaria efectiva y la necesidad de medirla como una inversión y no como un gasto.