Modelamiento predictivo

Ejemplo:

La gerencia de Starbucks, con el objetivo de evaluar la relación entre la cantidad de productos vendidos y los ingresos generados, ha recopilado la siguiente información mensual:

Cantidad de productos vendidos (X): 5, 25, 10, 5, 15, 50, 10, 15, 5, 5, 20, 35, 40, 15, 200, 15, 40, 5, 30, 100, 30, 25, 25, 50, 15.

Ingresos generados (Y): 20, 35, 30, 30, 25, 60, 30, 35, 25, 20, 40, 40, 50, 30, 80, 30, 35, 25, 35, 45, 35, 35, 45, 55, 30.

Se busca desarrollar un modelo de regresión que permita prever eventos futuros basándose en la cantidad de productos vendidos y los ingresos generados.

Ingresamos los datos

ejemplo1 <- data.frame(cantidad=c(5, 25, 10, 5, 15, 50, 10, 15, 5, 5, 20, 35, 40, 15, 200, 15, 40, 5, 30, 100, 30, 25, 25, 50, 15),
                       ingresos=c(20, 35, 30, 30, 25, 60, 30, 35, 25, 20, 40, 40, 50, 30, 80, 30, 35, 25, 35, 45, 35, 35, 45, 55, 30
))

ejemplo1
##    cantidad ingresos
## 1         5       20
## 2        25       35
## 3        10       30
## 4         5       30
## 5        15       25
## 6        50       60
## 7        10       30
## 8        15       35
## 9         5       25
## 10        5       20
## 11       20       40
## 12       35       40
## 13       40       50
## 14       15       30
## 15      200       80
## 16       15       30
## 17       40       35
## 18        5       25
## 19       30       35
## 20      100       45
## 21       30       35
## 22       25       35
## 23       25       45
## 24       50       55
## 25       15       30

Pasos para construir un modelo de regresión:

Paso 1: Determinar las variables X,Y

  • Variable independiente (X): Cantidad
  • Variable dependiente (y): Ingresos

Paso 2: Evaluar la relación entre variables (Correlación) graficamente

Diagrama de dispersión o puntos

# Gráfico con plot
plot(x=ejemplo1$cantidad,y=ejemplo1$ingresos)

# Gráfico con pairs
pairs(ejemplo1)

Interpretación: Según los resultados, hay relación lineal positiva o directa entre la cantidad y los ingresos.

Coeficiente de correlación

# Mediante la función cor
cor(ejemplo1) # Matriz de correlaciones
##           cantidad  ingresos
## cantidad 1.0000000 0.8500323
## ingresos 0.8500323 1.0000000

Coeficiente de correlación:

r = 0.8500323

Interpretación: Existe correlación positiva muy alta entre la cantidad y los ingresos.

Paso 3: Regresión

Regresión lineal simple

Modelo:

\(\hat{ingresos} = b_0 + b_1 cantidad\)

Para obtener el modelo, se va a utilizar una función de R > lm

# lm, notación: Y ~ X, data=
modelo1 <- lm(ingresos ~ cantidad, data=ejemplo1)

# Resumen de resultados
summary(modelo1)
## 
## Call:
## lm(formula = ingresos ~ cantidad, data = ejemplo1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -10.964  -4.154  -1.352   2.247  18.045 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  27.9465     1.8452  15.146 1.87e-13 ***
## cantidad      0.2802     0.0362   7.739 7.53e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.239 on 23 degrees of freedom
## Multiple R-squared:  0.7226, Adjusted R-squared:  0.7105 
## F-statistic:  59.9 on 1 and 23 DF,  p-value: 7.534e-08
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  27.9465     1.8452  15.146 1.87e-13 ***
## cantidad      0.2802     0.0362   7.739 7.53e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.239 on 23 degrees of freedom
## Multiple R-squared:  0.7226, Adjusted R-squared:  0.7105 
## F-statistic:  59.9 on 1 and 23 DF,  p-value: 7.534e-08

Modelo final con los resultados:

Modelo:

\(\hat{ingresos} = 27.9465 + 0.2802 cantidad\)