Introducción

En este ejercicio se hará una regresión múltiple con el ejemplo de Carter-Hill et. al. (2011) de las ventas de la tienda Andy’s, dado el precio promedio de los artículos vendidos y el gasto en publicidad. Todo medido en dólares de los Estados Unidos. Se exponen las primeras 10 filas de la tabla de datos:

Tabla de datos de las ventas mensuales de Andy’s
Ventas Precio Publicidad
73.2 5.69 1.3
71.8 6.49 2.9
62.4 5.63 0.8
67.4 6.22 0.7
89.3 5.02 1.5
a Cifras en miles de USD.

La idea es hacer una ecuación que estime la media condicionada de las ventas:

\[\begin{equation} \widehat{ventas}_t=\alpha+\beta_1\cdot precio_t+\beta_2 \cdot publicidad_t \end{equation}\]

Análisis

Como punto de partida, se hace la primera ecuación del modelo de regresión con todas sus variables:

Dependent variable:
Ventas
Precio -7.908***
(1.096)
Publicidad 1.863***
(0.683)
Constant 118.914***
(6.352)
Observations 75
R2 0.448
Adjusted R2 0.433
Residual Std. Error 4.886 (df = 72)
F Statistic 29.248*** (df = 2; 72)
Note: p<0.1; p<0.05; p<0.01

Como se puede apreciar todos los coeficientes, en lo individual (p-values) y en conjunto (estadístico F) son significativos. A su vez, se cumple la relación estadística esperada. Es decir, existe una relación inversa y significativa entre el precio promedio ponderado de los artículos y el nivel de ventas (en miles de dólares). De manera complementaria, se cumple la expectativa de que existe una relación positiva y significativa entre el gasto en publicidad y el nivel de ventas.

El modelo tiene un nivel de explicación de 43.2931589%. El valor del estadístico F indica que en conjunto los coeficientes son distintos de cero, por tanto ambas regresoras deben ser consideradas dentro del modelo; tanto en lo individual como en la interacción conjunta de variables, es posible confirmar que existe evidencia de que nuestro modelo es significativo, se encuentra debidamente especificado y que ambas variables (precio y publicidad) inciden en el nivel de ventas.

Sin embargo, cabe una pregunta: se está trabajando con ventas y gasto en publicidad en miles de dólares, así como incrementos unitarios del precio promedio. ¿Qué sucedería si se trabaja con logaritmos (logaritmos naturales) de estas variables? Estos, se interpretan como una potencial variación porcentual de las variables.

Dicho esto, se correrá el modelo, con los logaritmos de las variables y se verá si se cumplen las hipótesis del modelo y si es un mejor modelo que el anterior.

\[\begin{equation} \widehat{Ventas}_t=\alpha+\beta_1\cdot LogPrecio_t+\beta_2 \cdot LogPublicidad_t \end{equation}\]

Es necesario hacer una trasnformación de las variables a “log”. A continuación se presentan los resultados del segundo modelo.

Dependent variable:
log(Ventas)
log(Precio) -0.575***
(0.079)
log(Publicidad) 0.045***
(0.014)
Constant 5.320***
(0.138)
Observations 75
R2 0.469
Adjusted R2 0.454
Residual Std. Error 0.062 (df = 72)
F Statistic 31.810*** (df = 2; 72)
Note: p<0.1; p<0.05; p<0.01

Como se puede apreciar y de acuerdo a los resultados de la regresión, la relación entre variables es la esperada, existiendo una relación inversa y significativa entre el precio promedio ponderado de los artículos y el nivel de ventas, afectanto un incremento del 1% del precio en un decremento del 57.5% en las ventas, y el mismo incremento del 1% en publicidad incrementará en un 4.5% las ventas; cumpliendose la expectativa de que existe una relación positiva y significativa entre el gasto en publicidad y el nivel de ventas.

El modelo con logarimos tiene un nivel de explicación de 45.4358416%. El valor del estadístico F indica que en conjunto los coeficientes son distintos de cero, por tanto ambas regresoras deben ser consideradas dentro del modelo; tanto en lo individual como en la interacción conjunta de variables, es posible confirmar que existe evidencia de que nuestro modelo es significativo, se encuentra debidamente especificado y que ambas variables (precio y publicidad) inciden en el nivel de ventas.

De acuerdo con los resultados de la regresión la relación entre variables es la esperada: existe una relación negativa entre el precio y las ventas, y una relación positiva entre la publicidad y las ventas. Para ambas variables, de acuerdo con el valór probabilístico, es posible indicar que los coeficiences son significativos al 99%.

Adicionalmente se presenta una tabla comparativa:

Comparación de modelos
Dependent variable:
Ventas log(Ventas)
original logaritmos
(1) (2)
Precio -7.908***
(1.096)
Publicidad 1.863***
(0.683)
log(Precio) -0.575***
(0.079)
log(Publicidad) 0.045***
(0.014)
Constant 118.914*** 5.320***
(6.352) (0.138)
Observations 75 75
R2 0.448 0.469
Adjusted R2 0.433 0.454
Residual Std. Error 4.886 0.062
F Statistic 29.248*** 31.810***
Note: p<0.1; p<0.05; p<0.01

Conclusiones

Comparando los resultados de ambos modelos es posible deducir que el modelo trabajado con logaritmos explica de mejor forma las variaciones en las ventas;

El modelo inicial tiene un nivel de explicación de 43.2931589%., mientras que el…

El modelo con logarimos tiene un nivel de explicación de 45.4358416%.

Además de que presenta un mejor ajuste en conjunto (Estadístico F).

El uso de logaritmos facilita la interpretación cuando se tienen distantas unidades de medida en las variables.