Se cuenta con la base de datos de Marketing para realizar un modelo de regresión lineal simple para predecir las ventas futuras usando la inversión en Facebook como variable regresora.

## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
##   youtube facebook newspaper sales
## 1  276.12    45.36     83.04 26.52
## 2   53.40    47.16     54.12 12.48
## 3   20.64    55.08     83.16 11.16
## 4  181.80    49.56     70.20 22.20
## 5  216.96    12.96     70.08 15.48
## 6   10.44    58.68     90.00  8.64
##   promedio desviacion
## 1   16.827   6.260948
cor(marketing$sales, marketing$newspaper)
## [1] 0.228299
#Correlacion positiva debil
cor(marketing$facebook, marketing$sales)
## [1] 0.5762226
cor(marketing$facebook, marketing$sales)
## [1] 0.5762226
## 
## Call:
## lm(formula = sales ~ facebook, data = marketing)
## 
## Coefficients:
## (Intercept)     facebook  
##     11.1740       0.2025

Ventas = 11.1740 + (0.2025 * Inversion Facebook) + e

Interpretacion: Las ventas promedio esperadas cuando no se invierte en Facebook son de 11.12 millones de USD. Por cada mil USD adicionales de inversión en Facebook, las ventas incrementan 0.2 millones de USD.

## 
## Call:
## lm(formula = sales ~ facebook, data = marketing)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -18.8766  -2.5589   0.9248   3.3330   9.8173 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11.17397    0.67548  16.542   <2e-16 ***
## facebook     0.20250    0.02041   9.921   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.13 on 198 degrees of freedom
## Multiple R-squared:  0.332,  Adjusted R-squared:  0.3287 
## F-statistic: 98.42 on 1 and 198 DF,  p-value: < 2.2e-16

Debido a que el valor P es tan bajo, se rechaza H0 y se concluye que el modelo sí es significativo

predict(mod_fb, list(facebook=65), interval = "confidence", level = 0.95)
##        fit      lwr     upr
## 1 24.33619 22.68098 25.9914

Se concluye que con un 95% de confianza, las ventas mínimas esperadas, inviertiendo 65 mil USD, serán de 22.68 millones de USD y las ventas máximas de 25.99 millones de USD.

#Paso 1: Segmentar los datos
id_modelar <- sample(1:200, size = 160)
marketing_modelar <- marketing[id_modelar,]
marketing_validar <- marketing[-id_modelar,]

#Paso 2: Estimar el modelo set de modelar
mod_fb_modelar <- lm(sales~facebook, data = marketing_modelar)

#Paso 3: Predecir set de validacion
sales_pred <- predict(mod_fb_modelar, list(facebook = marketing_validar$facebook))

#paso 4: Comparar ventas del modelo y reales
sales_real <- marketing_validar$sales
error <- sales_real-sales_pred
res <- data.frame (sales_real, sales_pred,error)

#paso 5: calcular indicador de evaluación de la predicción
MAE <- mean(abs(error)) #mean absolut error
MAE
## [1] 4.21639

Se segmenta un 80% de los datos y se deja el 20% restante como aleatorios. El MAE arroja que 4.23 millones de USD son resultado del error de predicción