La gerencia de Starbucks, con el objetivo de evaluar la relación entre la cantidad de productos vendidos y los ingresos generados, ha recopilado la siguiente información mensual:
Cantidad de productos vendidos (X): 5, 25, 10, 5, 15, 50, 10, 15, 5, 5, 20, 35, 40, 15, 200, 15, 40, 5, 30, 100, 30, 25, 25, 50, 15.
Ingresos generados (Y): 20, 35, 30, 30, 25, 60, 30, 35, 25, 20, 40, 40, 50, 30, 80, 30, 35, 25, 35, 45, 35, 35, 45, 55, 30.
Se busca desarrollar un modelo de regresión que permita prever eventos futuros basándose en la cantidad de productos vendidos y los ingresos generados.
Ingresamos los datos
ejemplo1 <- data.frame(cantidad=c(5, 25, 10, 5, 15, 50, 10, 15, 5, 5, 20, 35, 40, 15, 200, 15, 40, 5, 30, 100, 30, 25, 25, 50, 15),
ingresos=c(20, 35, 30, 30, 25, 60, 30, 35, 25, 20, 40, 40, 50, 30, 80, 30, 35, 25, 35, 45, 35, 35, 45, 55, 30
))
ejemplo1
## cantidad ingresos
## 1 5 20
## 2 25 35
## 3 10 30
## 4 5 30
## 5 15 25
## 6 50 60
## 7 10 30
## 8 15 35
## 9 5 25
## 10 5 20
## 11 20 40
## 12 35 40
## 13 40 50
## 14 15 30
## 15 200 80
## 16 15 30
## 17 40 35
## 18 5 25
## 19 30 35
## 20 100 45
## 21 30 35
## 22 25 35
## 23 25 45
## 24 50 55
## 25 15 30
Pasos para construir un modelo de regresión:
Paso 1: Determinar las variables X,Y
Paso 2: Evaluar la relación entre variables (Correlación) graficamente
# Gráfico con plot
plot(x=ejemplo1$cantidad,y=ejemplo1$ingresos)
# Gráfico con pairs
pairs(ejemplo1)
Interpretación: Según los resultados, hay relación lineal positiva o directa entre la cantidad y los ingresos.
# Mediante la función cor
cor(ejemplo1) # Matriz de correlaciones
## cantidad ingresos
## cantidad 1.0000000 0.8500323
## ingresos 0.8500323 1.0000000
Coeficiente de correlación:
r = 0.8500323
Interpretación: Existe correlación positiva muy alta entre la cantidad y los ingresos.
Paso 3: Regresión
Modelo:
\(\hat{ingresos} = b_0 + b_1 cantidad\)
Para obtener el modelo, se va a utilizar una función de R > lm
# lm, notación: Y ~ X, data=
modelo1 <- lm(ingresos ~ cantidad, data=ejemplo1)
# Resumen de resultados
summary(modelo1)
##
## Call:
## lm(formula = ingresos ~ cantidad, data = ejemplo1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.964 -4.154 -1.352 2.247 18.045
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 27.9465 1.8452 15.146 1.87e-13 ***
## cantidad 0.2802 0.0362 7.739 7.53e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.239 on 23 degrees of freedom
## Multiple R-squared: 0.7226, Adjusted R-squared: 0.7105
## F-statistic: 59.9 on 1 and 23 DF, p-value: 7.534e-08
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 27.9465 1.8452 15.146 1.87e-13 ***
## cantidad 0.2802 0.0362 7.739 7.53e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.239 on 23 degrees of freedom
## Multiple R-squared: 0.7226, Adjusted R-squared: 0.7105
## F-statistic: 59.9 on 1 and 23 DF, p-value: 7.534e-08
Modelo final con los resultados:
Modelo:
\(\hat{ingresos} = 27.9465 + 0.2802 cantidad\)