Introducción

En este ejercicio se hará una regresión múltiple con el ejemplo de Carter-Hill et. al. (2011) de las ventas de la tienda Andy’s, dado el precio promedio de los artículos vendidos y el gasto en publicidad. Todo medido en dólares de los Estados Unidos. Se exponen las primeras 10 filas de la tabla de datos:

Tabla de datos de las ventas mensuales de Andy’s
Ventas Precio Publicidad
73.2 5.69 1.3
71.8 6.49 2.9
62.4 5.63 0.8
67.4 6.22 0.7
89.3 5.02 1.5
a Cifras en miles de USD.

La idea es hacer una ecuación que estime la media condicionada de las ventas:

\[\begin{equation} \widehat{ventas}_t=\alpha+\beta_1\cdot precio_t+\beta_2 \cdot publicidad_t \end{equation}\]

Análisis

Como punto de partida, se hace la primera ecuación del modelo de regresión con todas sus variables:

Dependent variable:
Ventas
Precio -7.908***
(1.096)
Publicidad 1.863***
(0.683)
Constant 118.914***
(6.352)
Observations 75
R2 0.448
Adjusted R2 0.433
Residual Std. Error 4.886 (df = 72)
F Statistic 29.248*** (df = 2; 72)
Note: p<0.1; p<0.05; p<0.01

Como se puede apreciar todos los coeficientes, en lo individual (p-values) y en conjunto (estadístico F) son significativos. A su vez, se cumple la relación estadística esperada. Es decir, existe una relación inversa y significativa entre el precio promedio ponderado de los artículos y el nivel de ventas (en miles de dólares). De manera complementaria, se cumple la expectativa de que existe una relación positiva y significativa entre el gasto en publicidad y el nivel de ventas.

El modelo tiene un nivel de explicación de 43.2931589%.

Sin embargo, cabe una pregunta: se está trabajando con ventas y gasto en publicidad en miles de dólares, así como incrementos unitarios del precio promedio. ¿Qué sucedería si se trabaja con logaritmos (logaritmos naturales) de estas variables? Estos, se interpretan como una potencial variación porcentual de las variables. Dicho esto, se correrá el modelo, con los logaritmos de las variables y se verá si se cumplen las hipótesis del modelo y si es un mejor modelo que el anterior.

Dependent variable:
log(Ventas)
log(Precio) -0.575***
(0.079)
log(Publicidad) 0.045***
(0.014)
Constant 5.320***
(0.138)
Observations 75
R2 0.469
Adjusted R2 0.454
Residual Std. Error 0.062 (df = 72)
F Statistic 31.810*** (df = 2; 72)
Note: p<0.1; p<0.05; p<0.01

Criterios de información:

Función de log-verosimilitud

LLF1=logLik(regresion1)
LLF2=logLik(regresion2)
vectorLLF=c("LFF",round(LLF1,4),round(LLF2,4))

Veamos la tabla comparativa:

stargazer(regresion1,regresion2,
          report="vc*",
          type="text",
          add.lines=list(vectorLLF))
## 
## ==========================================================
##                                   Dependent variable:     
##                               ----------------------------
##                                   Ventas      log(Ventas) 
##                                    (1)            (2)     
## ----------------------------------------------------------
## Precio                          -7.908***                 
##                                                           
## Publicidad                       1.863***                 
##                                                           
## log(Precio)                                    -0.575***  
##                                                           
## log(Publicidad)                                0.045***   
##                                                           
## Constant                        118.914***     5.320***   
##                                                           
## ----------------------------------------------------------
## LFF                             -223.8695      103.2063   
## Observations                        75            75      
## R2                                0.448          0.469    
## Adjusted R2                       0.433          0.454    
## Residual Std. Error (df = 72)     4.886          0.062    
## F Statistic (df = 2; 72)        29.248***      31.810***  
## ==========================================================
## Note:                          *p<0.1; **p<0.05; ***p<0.01

Criterio de infromaciónde Akaike

En base al LLF previamente calculado, se va a estimar, para cada regresión, el criterio de información de Akaikeo \(AIC\):

\[ AIC=2k-2LLF \]

akaike1=AIC(regresion1)
akaike2=AIC(regresion2)
vectorAkaike=c("Akaike",round(akaike1,4), round(akaike2,4))
stargazer(regresion1,regresion2,
          report="vc*",
          type="text",
          add.lines=list(vectorLLF,vectorAkaike))
## 
## ==========================================================
##                                   Dependent variable:     
##                               ----------------------------
##                                   Ventas      log(Ventas) 
##                                    (1)            (2)     
## ----------------------------------------------------------
## Precio                          -7.908***                 
##                                                           
## Publicidad                       1.863***                 
##                                                           
## log(Precio)                                    -0.575***  
##                                                           
## log(Publicidad)                                0.045***   
##                                                           
## Constant                        118.914***     5.320***   
##                                                           
## ----------------------------------------------------------
## LFF                             -223.8695      103.2063   
## Akaike                           455.739       -198.4125  
## Observations                        75            75      
## R2                                0.448          0.469    
## Adjusted R2                       0.433          0.454    
## Residual Std. Error (df = 72)     4.886          0.062    
## F Statistic (df = 2; 72)        29.248***      31.810***  
## ==========================================================
## Note:                          *p<0.1; **p<0.05; ***p<0.01

Criterio de información de Schwarz (criterio de información bayesiana)

Ahora se calcula el criterio de información de Schwarz:

BIC1=BIC(regresion1)
BIC2=BIC(regresion2)
vectorBIC=c("BIC",round(BIC1,4),round(BIC2,4))
stargazer(regresion1,regresion2,
          report="vc*",
          type="text",
          add.lines=list(vectorLLF,vectorAkaike,vectorBIC))
## 
## ==========================================================
##                                   Dependent variable:     
##                               ----------------------------
##                                   Ventas      log(Ventas) 
##                                    (1)            (2)     
## ----------------------------------------------------------
## Precio                          -7.908***                 
##                                                           
## Publicidad                       1.863***                 
##                                                           
## log(Precio)                                    -0.575***  
##                                                           
## log(Publicidad)                                0.045***   
##                                                           
## Constant                        118.914***     5.320***   
##                                                           
## ----------------------------------------------------------
## LFF                             -223.8695      103.2063   
## Akaike                           455.739       -198.4125  
## BIC                              465.009       -189.1426  
## Observations                        75            75      
## R2                                0.448          0.469    
## Adjusted R2                       0.433          0.454    
## Residual Std. Error (df = 72)     4.886          0.062    
## F Statistic (df = 2; 72)        29.248***      31.810***  
## ==========================================================
## Note:                          *p<0.1; **p<0.05; ***p<0.01

Criterio de información de Hannan-Quinn

Ahora se estimará el criterio de información de Hannan-Quinn:

HQC1=HQC(regresion1)
HQC2=HQC(regresion2)
vectorHQC=c("Hannan-Quinn",HQC1,HQC2)

========================================================== Dependent variable:
—————————- Ventas log(Ventas) (1) (2)
———————————————————- Precio -7.908***

Publicidad 1.863***

log(Precio) -0.575***

log(Publicidad) 0.045***

Constant 118.914*** 5.320***


LFF -223.8695 103.2063
Akaike 455.739 -198.4125
BIC 465.009 -189.1426
Hannan-Quinn 456.5151 -197.6365
Observations 75 75
R2 0.448 0.469
Adjusted R2 0.433 0.454
Residual Std. Error (df = 72) 4.886 0.062
F Statistic (df = 2; 72) 29.248*** 31.810***
========================================================== Note: p<0.1; p<0.05; p<0.01

Conclusiones