13 de abril de 2018

Objetivos:

-Aplicar el Modelo de Regresi?n Lineal M?ltiple a un conjunto de datos ficticios en el software R-studio.

-Diagnosticar si el modelo cumple con todos los test estad?sticos.

Introducci?n:

La Disquera Rockola, l?der en el mercado musical, ha solicitado a su departamento de marketing, un estudio que permita evaluar el desempe?o de las ventas de los discos de rock, que se efectuaron el a?o 2017, a nivel nacional.

Para este fin, el ?rea de marketing cuenta con una base de datos que contiene la siguiente informaci?n:

-Venta de discos

-Gasto en Publicidad

Sin embargo, para realizar un estudio m?s robusto, el departamento de marketing, ha pedido a las principales radios del pa?s, un informe donde se evidencie el tiempo que cada estaci?n radial dedica al rock y en especial a los grupos de rock que la Disquera Rockola est? promocionando. Asimismo, otro elemento que se ha tomado en consideraci?n al momento de elaborar el estudio, es la construcci?n de una encuesta, donde se ha consultado a las personas (en especial a aquellas en el rango de edad de los 15 hasta los 35 a?os) el nivel de agrado que tienen sobre ciertos grupos de rock.

Modelo:

El ?rea de Marketing elaborar? un modelo de regresi?n lineal m?ltiple, en el cual se desea observar el comportamiento de las ventas de los discos de rock, por medio de las variables explicativas: Gasto en publicidad, tiempo en que cada disco ha estado en el aire y nivel de agrado por los grupos de rock.

El modelo a estimar ser? el siguiente:

\(y_{i}\)=\(\beta_{0}\)+\(\beta_{1}\).\(x_{1i}\)+\(\beta_{2}\).\(x_{2i}\)+\(\beta_{3}\).\(x_{3i}\)+\(\mu_{i}\)

Donde:

\(y_{i}\)=Venta de discos de rock,expresada en miles de discos

\(x_{1}\)=Gasto en publicidad de cada disco de rock,expresado en miles de d?lares

\(x_{2}\)=N?mero de veces que las canciones fueron puestas en el aire en las principales radios del pa?s

\(x_{3}\)=Nivel de preferencia por los grupos de rock,clasificado de la escala del 1 al 10, donde 1 es clasificado como desagradable,mientras que 10 como atractivo.

\(\mu_{i}\) = t?rmino de error inobservable

Resultados:

Tabla No1: Modelo de Regresi?n Lineal M?ltiple

## 
## Call:
## lm(formula = ventas ~ gastos + tiempo + preferencias, data = ventas)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -121.324  -28.336   -0.451   28.967  144.132 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -26.612958  17.350001  -1.534    0.127    
## gastos         0.084885   0.006923  12.261  < 2e-16 ***
## tiempo         3.367425   0.277771  12.123  < 2e-16 ***
## preferencias  11.086335   2.437849   4.548 9.49e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 47.09 on 196 degrees of freedom
## Multiple R-squared:  0.6647, Adjusted R-squared:  0.6595 
## F-statistic: 129.5 on 3 and 196 DF,  p-value: < 2.2e-16

Intervalos de confianza

Tabla No2: Intervalos de confianza

##                     2.5 %      97.5 %
## (Intercept)  -60.82960967  7.60369295
## gastos         0.07123166  0.09853799
## tiempo         2.81962186  3.91522848
## preferencias   6.27855218 15.89411823

Evaluaci?n el modelo de regresi?n

Supuesto No1: Independencia

Tabla No3:Test Durbin-Watson

## Warning: package 'car' was built under R version 3.4.4
## Loading required package: carData
## Warning: package 'carData' was built under R version 3.4.4
##  lag Autocorrelation D-W Statistic p-value
##    1       0.0026951      1.949819   0.736
##  Alternative hypothesis: rho != 0

Supuesto No2: Multicolinealidad

Tabla No4:Test para detectar multicolinealidad

##       gastos       tiempo preferencias 
##     1.014593     1.042504     1.038455
##       gastos       tiempo preferencias 
##    0.9856172    0.9592287    0.9629695
## [1] 1.03185

Supuesto No3: Residuos

Gr?fico No1:Residuos versus los valores ajustados del modelo

## Registering fonts with R

Supuesto No3: Residuos (Continuaci?n)

Gr?fico No2: Q-Q plot

## Warning: `stat` is deprecated

Conclusiones

Una vez que se ha revisado que todos los supuestos inherentes al modelo de regresi?n lineal m?ltiple se han cumplido, se puede concluir que el modelo previsto para la muestra puede ser generalizable para la poblaci?n. Asimismo, y a la luz de los resultados visto en las secciones anteriores, se concluye que el gasto en publicidad, y el tiempo que las emisoras colocan las canciones al aire son igual de importantes para predecir las ventas de los discos. Por otro lado, a pesar de que la variable, preferencia por los grupos de rock, fue estad?sticamente significativo, tuvo un menor impacto en relaci?n a las dos variables antes mencionadas.