# Modelamiento predictivo

Caso: “Publicidad”

Las empresa continuamente invierten en publicidad para hacer más conocidos sus productos, utilizan diferentes medios de comunciación ya sea oral o escrito. Para estas empresa es importante evaluar el efecto que tienen cuando se compra un espacio en algún medio de comunicación. El conjunto de datos de publicidad consiste en las ventas (miles de unidades) de un producto en particular en 200 mercados diferentes (Empresas), junto con los presupuestos publicitarios del producto (miles de dólares) en cada uno de esos mercados para tres medios diferentes: televisión, radio y periódico.

La descripción de las variables es:

• TV: Inversión en televisión • Radio: Inversión en radio • Periódico: Inversión en periódico • Venta: Venta total de unidades en el periodo (Miles de unidades) Variable Dependiente (Y):

Venta total de unidades en el periodo (Miles de unidades) (Venta) Variables Independientes (X):

Inversión en televisión (TV)

# Crear un conjunto de datos para el caso de publicidad
publicidad_data <- data.frame(
  TV = c(50, 30, 60, 45, 70, 55, 80, 40, 75, 65, 90, 85, 55, 75, 100, 65, 80, 110, 95, 120, 70, 100, 130, 115, 140),
  Venta = c(200, 180, 220, 190, 250, 210, 270, 200, 260, 240, 290, 280, 220, 260, 300, 240, 270, 320, 310, 330, 250, 300, 340, 310, 360)
)

publicidad_data

Pasos para construir un modelo de regresión

Diagrama de dispersión o puntos

# Gráfico con plot
plot(x=publicidad_data$TV,y=publicidad_data$Venta)

* Interpretación: Según los resultados, hay relación lineal positiva o directa entre la inversión y la ganancia.

Coeficiente de correlación

# Mediante la función cor
cor(publicidad_data) # Matriz de correlaciones
##              TV     Venta
## TV    1.0000000 0.9859904
## Venta 0.9859904 1.0000000

r = 0.8123909

(Recordar: Si el r en menor que 0.35 para algunos autores, no es viable la regresión, para otros autores se debe probar hipótesis)

Como en este caso el coeficiente de correlación es superior a 0.35, es viable la regresión.

Regresión lineal simple

Modelo general $ = b_o + b_1X $

Modelo para el caso: \(\hat{cantidad} = b_0 + b_1 ingresos\)

Para obtener el modelo, se va a utilizar una función de R > lm

# lm, notación: Y ~ X, data=
modelo1 <- lm(Venta ~ TV, data=publicidad_data)

# Resumen de resultados
summary(modelo1)
## 
## Call:
## lm(formula = Venta ~ TV, data = publicidad_data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -14.153  -7.120   1.780   4.593  20.220 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 126.50639    5.13784   24.62   <2e-16 ***
## TV            1.71867    0.06063   28.35   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.477 on 23 degrees of freedom
## Multiple R-squared:  0.9722, Adjusted R-squared:  0.971 
## F-statistic: 803.7 on 1 and 23 DF,  p-value: < 2.2e-16
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  15.1982     2.1254   7.151 3.10e-05 ***
## ingresos     3.2162     0.3792   8.482 7.03e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.579 on 10 degrees of freedom
## Multiple R-squared:  0.878,  Adjusted R-squared:  0.8658 
## F-statistic: 71.94 on 1 and 10 DF,  p-value: 7.032e-06

Modelo final con los resultados:

  • Modelo general

$ = 15.1982 +3.2162 X $

  • Modelo para el caso:

\(\hat{cantidad} = 15.1982 + 3.2162 Ingresos\)

Resumen: Regresión lineal simple

Paso 3: Modelo Regresión lineal simple