En el siguiente ejemplo, estableceremos una relación entre las ventas y la inversión en marketing de la empresa Facebook. Este análisis se basa en los datos recopilados de la base de datos “Marketing”. Este conjunto de datos contiene información sobre el impacto de tres medios publicitarios (YouTube, Facebook y periódico) en las ventas de la empresa. Los datos incluyen el presupuesto publicitario en miles de dólares, así como las cifras de ventas correspondientes. este experimento publicitario se ha repetido en 200 ocasiones para obtener resultados significativos.
# Exploracion de las Ventas
proemdio <- mean(marketing$sales)
Desviacion <- sd(marketing$sales)
data.frame(proemdio,Desviacion)
| proemdio | Desviacion |
|---|---|
| 16.827 | 6.260948 |
La creación de un histograma interactivo de la variable “sales” del conjunto de datos “marketing” en estadística descriptiva resulta útil por varias razones. En primer lugar, proporciona una representación visual de la distribución de los datos, lo que facilita la identificación de patrones, valores atípicos y tendencias. Además, permite resumir de manera efectiva la información sobre la centralidad y dispersión de los datos, lo que es fundamental para comprender la estructura de la variable.
gl <- ggplot(data = marketing,mapping = aes(x=sales))+ geom_histogram(fill="green")+ theme_bw()
ggplotly(gl)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
#gl2 <- ggplot(data = marketing,mapping = aes(x=youtube,y=sales))+ geom_point(color="red")+ theme_bw()+geom_smooth()
#ggplotly(gl2)
#gl3 <- ggplot(data = marketing,mapping = aes(x=newspaper,y=sales))+ geom_point(color="grey")+ theme_bw()+geom_smooth()
#ggplotly(gl3)
gl4 <- ggplot(data = marketing,mapping = aes(x=facebook,y=sales))+ geom_point(color="blue")+ theme_bw()+geom_smooth()
ggplotly(gl4)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
#cor(marketing$youtube,marketing$sales)
cor(marketing$facebook,marketing$sales)
## [1] 0.5762226
#cor(marketing$newspaper,marketing$sales)
El coeficiente del intercepto (11.17397) representa el valor estimado de “sales” cuando la inversión en publicidad en “facebook” es igual a cero.
El coeficiente de “facebook” (0.20250) indica el cambio estimado en “sales” por cada unidad adicional de inversión en publicidad en “facebook.”
Es importante destacar que ambos coeficientes son significativos. Esto significa que tanto el intercepto como el coeficiente de “facebook” son diferentes de cero y tienen un efecto significativo en “sales.”
El coeficiente de determinación, R-cuadrado (Multiple R-squared), tiene un valor de 0.332. Esto implica que el 33.2% de la variabilidad en las ventas (“sales”) se explica por la inversión en publicidad en “facebook”. En otras palabras, el modelo es capaz de explicar una parte significativa de la variabilidad de las ventas.
Mo1 <- lm(sales~facebook, data = marketing)
summary(Mo1)
##
## Call:
## lm(formula = sales ~ facebook, data = marketing)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.8766 -2.5589 0.9248 3.3330 9.8173
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.17397 0.67548 16.542 <2e-16 ***
## facebook 0.20250 0.02041 9.921 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.13 on 198 degrees of freedom
## Multiple R-squared: 0.332, Adjusted R-squared: 0.3287
## F-statistic: 98.42 on 1 and 198 DF, p-value: < 2.2e-16
Mo2 <- lm(sales~youtube, data = marketing)
# encuntra las ventas promedio es 12.45
Mo3 <- lm(sales~newspaper, data = marketing)
predict(Mo1,list(facebook=65),interval = "confidence",level = 0.95)
## fit lwr upr
## 1 24.33619 22.68098 25.9914
#predict(Mo2,list(youtube=65),interval = "confidence",level = 0.95)
#predict(Mo3,list(newspaper=65),interval = "confidence",level = 0.95)
id_modelar=sample(1:200,size = 160)
marketing_modelar=marketing[id_modelar,]
marketing_validar=marketing[-id_modelar,]
##Paso 2 - Estimar el Modelo Set de Modelar
mod_you_modelar=lm(sales~facebook,data=marketing_modelar)
##Paso 3 - Predeccir Set de Validación
sales_pred=predict(mod_you_modelar,list(facebook=marketing_validar$facebook))
##Paso 4 - Comparar Ventas del Modelo y Reales
sales_real=marketing_validar$sales
error=sales_real-sales_pred
res=data.frame(sales_real,sales_pred,error)
##Paso 5 - Calcular Indicador de Evaluación de la Predicción
MAE=mean(abs(error)) #Mean Absolut Error (Error Medio Absoluto)
MAE
## [1] 3.926367