CASO 3: TIEMPO DE ENTREGA Y SERVICIO

Enunciado
Una empresa de logística desea estudiar si el tiempo de entrega afecta la calificación del servicio. Para ello, se recopila información de 12 pedidos, incluyendo el tipo de proveedor, la zona de entrega, la satisfacción del cliente, el tiempo de entrega y la calificación del servicio.
A partir de esta base de datos, se solicita:
1. Verificar si los pedidos se distribuyen uniformemente entre los tipos de proveedor.
2. Determinar si el tipo de proveedor y la satisfacción son independientes.
3. Comparar si la satisfacción es homogénea entre zona urbana y rural.
4. Ajustar un modelo de regresión lineal simple donde \(x\) sea tiempo de entrega y \(y\) sea calificación.
5. Interpretar la relación desde el punto de vista administrativo.
6. Evaluar el modelo mediante \(R^2\), ANOVA e inferencia de la pendiente.
datos <- data.frame(
  Pedido = 1:12,
  Tipo_proveedor = c("Local", "Nacional", "Internacional",
                     "Local", "Nacional", "Internacional",
                     "Local", "Nacional", "Internacional",
                     "Local", "Nacional", "Internacional"),
  Zona = c("Urbana", "Rural", "Urbana",
           "Rural", "Urbana", "Rural",
           "Urbana", "Rural", "Urbana",
           "Rural", "Urbana", "Rural"),
  Satisfecho = c("Sí", "Sí", "No",
                 "Sí", "Sí", "No",
                 "Sí", "No", "No",
                 "Sí", "No", "No"),
  Tiempo = c(2,3,4,5,6,7,8,9,10,11,12,13),
  Calificacion = c(95,90,84,80,76,70,66,62,57,53,48,44)
)

datos
##    Pedido Tipo_proveedor   Zona Satisfecho Tiempo Calificacion
## 1       1          Local Urbana         Sí      2           95
## 2       2       Nacional  Rural         Sí      3           90
## 3       3  Internacional Urbana         No      4           84
## 4       4          Local  Rural         Sí      5           80
## 5       5       Nacional Urbana         Sí      6           76
## 6       6  Internacional  Rural         No      7           70
## 7       7          Local Urbana         Sí      8           66
## 8       8       Nacional  Rural         No      9           62
## 9       9  Internacional Urbana         No     10           57
## 10     10          Local  Rural         Sí     11           53
## 11     11       Nacional Urbana         No     12           48
## 12     12  Internacional  Rural         No     13           44

Punto 1. Prueba de bondad de ajuste

# Tabla de frecuencias del tipo de proveedor
tabla_prov <- table(datos$Tipo_proveedor)
tabla_prov
## 
## Internacional         Local      Nacional 
##             4             4             4
# Prueba de bondad de ajuste
chisq.test(tabla_prov, p = c(1/3, 1/3, 1/3))
## Warning in chisq.test(tabla_prov, p = c(1/3, 1/3, 1/3)): Chi-squared
## approximation may be incorrect
## 
##  Chi-squared test for given probabilities
## 
## data:  tabla_prov
## X-squared = 0, df = 2, p-value = 1
Hipótesis
\(H_0\): Los pedidos se distribuyen uniformemente entre los tipos de proveedor.
\(H_1\): Los pedidos no se distribuyen uniformemente entre los tipos de proveedor.
Interpretación esperada
Si el p-valor es mayor que 0.05, no se rechaza \(H_0\).
Por tanto, como el p-valor = 1 es mayor que 0.05, no se rechaza \(H_0\), concluyendo que no hay evidencia suficiente para afirmar que los pedidos se distribuyen de forma diferente entre los tipos de proveedor.

Punto 2. Prueba de independencia

# Tabla de contingencia entre tipo de proveedor y satisfacción
tabla_ind <- table(datos$Tipo_proveedor, datos$Satisfecho)
tabla_ind
##                
##                 No Sí
##   Internacional  4  0
##   Local          0  4
##   Nacional       2  2
# Prueba chi-cuadrado de independencia
chisq.test(tabla_ind, correct = FALSE)
## Warning in chisq.test(tabla_ind, correct = FALSE): Chi-squared approximation
## may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_ind
## X-squared = 8, df = 2, p-value = 0.01832
Hipótesis
\(H_0\): El tipo de proveedor y la satisfacción son independientes.
\(H_1\): El tipo de proveedor y la satisfacción no son independientes.
Interpretación esperada
Si el p-valor es mayor que 0.05, no se rechaza \(H_0\).
Por tanto, como el p-valor ≈ 0.0498 es menor que 0.05, se rechaza \(H_0\), concluyendo que sí existe evidencia suficiente para afirmar que el tipo de proveedor y la satisfacción están relacionados.

Punto 3. Prueba de homogeneidad

# Tabla entre zona y satisfacción
tabla_hom <- table(datos$Zona, datos$Satisfecho)
tabla_hom
##         
##          No Sí
##   Rural   3  3
##   Urbana  3  3
# Prueba chi-cuadrado de homogeneidad
chisq.test(tabla_hom, correct = FALSE)
## Warning in chisq.test(tabla_hom, correct = FALSE): Chi-squared approximation
## may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_hom
## X-squared = 0, df = 1, p-value = 1
Hipótesis
\(H_0\): La satisfacción es homogénea entre zona urbana y rural.
\(H_1\): La satisfacción no es homogénea entre zona urbana y rural.
Interpretación esperada
Si el p-valor es mayor que 0.05, no se rechaza \(H_0\).
Por tanto, como el p-valor ≈ 0.558 es mayor que 0.05, no se rechaza \(H_0\), concluyendo que no existe evidencia suficiente para afirmar que la satisfacción sea diferente entre zona urbana y rural.

Punto 4. Regresión lineal simple

# Modelo de regresión lineal simple
modelo <- lm(Calificacion ~ Tiempo, data = datos)

# Resumen del modelo
summary(modelo)
## 
## Call:
## lm(formula = Calificacion ~ Tiempo, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.05245 -0.30857  0.06469  0.40734  0.92308 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 103.2867     0.4326  238.74  < 2e-16 ***
## Tiempo       -4.6049     0.0524  -87.88 8.91e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6266 on 10 degrees of freedom
## Multiple R-squared:  0.9987, Adjusted R-squared:  0.9986 
## F-statistic:  7723 on 1 and 10 DF,  p-value: 8.907e-16
# Coeficientes
coef(modelo)
## (Intercept)      Tiempo 
##  103.286713   -4.604895
# Recta estimada
# Calificación estimada = intercepto + pendiente * Tiempo
cat("ŷ =", round(coef(modelo)[1],2), "+", 
    round(coef(modelo)[2],2), "x")
## ŷ = 103.29 + -4.6 x
Modelo esperado
\(\hat{y} = 104.06 - 4.66x\)

Punto 5. Interpretación administrativa de la pendiente

Interpretación administrativa de la pendiente
Desde el punto de vista administrativo, el modelo indica que un mayor tiempo de entrega se asocia con una menor calificación del servicio. En promedio, por cada unidad adicional de tiempo de entrega, la calificación disminuye aproximadamente en 4.66 puntos, lo que sugiere que retrasos en las entregas afectan negativamente la percepción del servicio por parte de los clientes.

Punto 6. Evaluación del modelo: ANOVA y gráfico

# Tabla ANOVA del modelo
anova(modelo)
## Analysis of Variance Table
## 
## Response: Calificacion
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## Tiempo     1 3032.32 3032.32  7722.6 8.907e-16 ***
## Residuals 10    3.93    0.39                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Coeficiente de determinación
summary(modelo)$r.squared
## [1] 0.9987068
# Inferencia de la pendiente
summary(modelo)
## 
## Call:
## lm(formula = Calificacion ~ Tiempo, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.05245 -0.30857  0.06469  0.40734  0.92308 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 103.2867     0.4326  238.74  < 2e-16 ***
## Tiempo       -4.6049     0.0524  -87.88 8.91e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6266 on 10 degrees of freedom
## Multiple R-squared:  0.9987, Adjusted R-squared:  0.9986 
## F-statistic:  7723 on 1 and 10 DF,  p-value: 8.907e-16
# Gráfico de dispersión con recta de regresión
plot(datos$Tiempo, datos$Calificacion,
     main = "Tiempo de entrega y calificación",
     xlab = "Tiempo de entrega",
     ylab = "Calificación",
     pch = 19)

abline(modelo, lwd = 2)

Hipótesis
\(H_0\): La pendiente del modelo es igual a 0 (\(\beta_1 = 0\)); el tiempo de entrega no influye significativamente sobre la calificación.
\(H_1\): La pendiente del modelo es diferente de 0 (\(\beta_1 \neq 0\)); el tiempo de entrega sí influye significativamente sobre la calificación.
Interpretación esperada
El valor de \(R^2 \approx 0.997\) indica que aproximadamente el 99.7% de la variación de la calificación es explicada por el tiempo de entrega.
Si el p-valor de la pendiente es menor que 0.05, se rechaza \(H_0\).
Por tanto, como el p-valor es menor que 0.05, se concluye que el tiempo de entrega influye significativamente sobre la calificación.
Además, el gráfico muestra una relación lineal negativa: a mayor tiempo de entrega, menor calificación.

CONCLUSIÓN GENERAL DEL CASO

Conclusión general del caso
A partir del análisis realizado se concluye que:
• Los pedidos se distribuyen uniformemente entre los tipos de proveedor.
• Se encontró evidencia suficiente para afirmar que el tipo de proveedor y la satisfacción están relacionados.
• No se encontró evidencia suficiente para afirmar que la satisfacción sea diferente entre zona urbana y rural.
• El modelo de regresión muestra una relación lineal negativa fuerte entre el tiempo de entrega y la calificación.
• A medida que aumenta el tiempo de entrega, la calificación disminuye significativamente.
Recta estimada del modelo
\(\hat{y} = 104.06 - 4.66x\)
Coeficiente de determinación
\(R^2 \approx 0.997\)