CASO 3: TIEMPO DE ENTREGA Y SERVICIO
Enunciado
Una empresa de logística desea estudiar si el tiempo de entrega
afecta la calificación del servicio. Para ello, se recopila información
de 12 pedidos, incluyendo el tipo de proveedor, la zona de entrega, la
satisfacción del cliente, el tiempo de entrega y la calificación del
servicio.
A partir de esta base de datos, se solicita:
1. Verificar si los pedidos se distribuyen uniformemente entre los
tipos de proveedor.
2. Determinar si el tipo de proveedor y la satisfacción son
independientes.
3. Comparar si la satisfacción es homogénea entre zona urbana y
rural.
4. Ajustar un modelo de regresión lineal simple donde \(x\) sea tiempo de entrega y \(y\) sea calificación.
5. Interpretar la relación desde el punto de vista
administrativo.
6. Evaluar el modelo mediante \(R^2\), ANOVA e inferencia de la
pendiente.
datos <- data.frame(
Pedido = 1:12,
Tipo_proveedor = c("Local", "Nacional", "Internacional",
"Local", "Nacional", "Internacional",
"Local", "Nacional", "Internacional",
"Local", "Nacional", "Internacional"),
Zona = c("Urbana", "Rural", "Urbana",
"Rural", "Urbana", "Rural",
"Urbana", "Rural", "Urbana",
"Rural", "Urbana", "Rural"),
Satisfecho = c("Sí", "Sí", "No",
"Sí", "Sí", "No",
"Sí", "No", "No",
"Sí", "No", "No"),
Tiempo = c(2,3,4,5,6,7,8,9,10,11,12,13),
Calificacion = c(95,90,84,80,76,70,66,62,57,53,48,44)
)
datos
## Pedido Tipo_proveedor Zona Satisfecho Tiempo Calificacion
## 1 1 Local Urbana Sí 2 95
## 2 2 Nacional Rural Sí 3 90
## 3 3 Internacional Urbana No 4 84
## 4 4 Local Rural Sí 5 80
## 5 5 Nacional Urbana Sí 6 76
## 6 6 Internacional Rural No 7 70
## 7 7 Local Urbana Sí 8 66
## 8 8 Nacional Rural No 9 62
## 9 9 Internacional Urbana No 10 57
## 10 10 Local Rural Sí 11 53
## 11 11 Nacional Urbana No 12 48
## 12 12 Internacional Rural No 13 44
Punto 1. Prueba de bondad de ajuste
# Tabla de frecuencias del tipo de proveedor
tabla_prov <- table(datos$Tipo_proveedor)
tabla_prov
##
## Internacional Local Nacional
## 4 4 4
# Prueba de bondad de ajuste
chisq.test(tabla_prov, p = c(1/3, 1/3, 1/3))
## Warning in chisq.test(tabla_prov, p = c(1/3, 1/3, 1/3)): Chi-squared
## approximation may be incorrect
##
## Chi-squared test for given probabilities
##
## data: tabla_prov
## X-squared = 0, df = 2, p-value = 1
Hipótesis
• \(H_0\): Los pedidos se
distribuyen uniformemente entre los tipos de proveedor.
• \(H_1\): Los pedidos no se
distribuyen uniformemente entre los tipos de proveedor.
Interpretación esperada
Si el p-valor es mayor que 0.05, no se rechaza \(H_0\).
Por tanto, como el p-valor = 1 es mayor que 0.05, no se rechaza
\(H_0\), concluyendo que no hay
evidencia suficiente para afirmar que los pedidos se distribuyen de
forma diferente entre los tipos de proveedor.
Punto 2. Prueba de independencia
# Tabla de contingencia entre tipo de proveedor y satisfacción
tabla_ind <- table(datos$Tipo_proveedor, datos$Satisfecho)
tabla_ind
##
## No Sí
## Internacional 4 0
## Local 0 4
## Nacional 2 2
# Prueba chi-cuadrado de independencia
chisq.test(tabla_ind, correct = FALSE)
## Warning in chisq.test(tabla_ind, correct = FALSE): Chi-squared approximation
## may be incorrect
##
## Pearson's Chi-squared test
##
## data: tabla_ind
## X-squared = 8, df = 2, p-value = 0.01832
Hipótesis
• \(H_0\): El tipo de proveedor y
la satisfacción son independientes.
• \(H_1\): El tipo de proveedor y
la satisfacción no son independientes.
Interpretación esperada
Si el p-valor es mayor que 0.05, no se rechaza \(H_0\).
Por tanto, como el p-valor ≈ 0.0498 es menor que 0.05, se rechaza
\(H_0\), concluyendo que sí existe
evidencia suficiente para afirmar que el tipo de proveedor y la
satisfacción están relacionados.
Punto 3. Prueba de homogeneidad
# Tabla entre zona y satisfacción
tabla_hom <- table(datos$Zona, datos$Satisfecho)
tabla_hom
##
## No Sí
## Rural 3 3
## Urbana 3 3
# Prueba chi-cuadrado de homogeneidad
chisq.test(tabla_hom, correct = FALSE)
## Warning in chisq.test(tabla_hom, correct = FALSE): Chi-squared approximation
## may be incorrect
##
## Pearson's Chi-squared test
##
## data: tabla_hom
## X-squared = 0, df = 1, p-value = 1
Hipótesis
• \(H_0\): La satisfacción es
homogénea entre zona urbana y rural.
• \(H_1\): La satisfacción no es
homogénea entre zona urbana y rural.
Interpretación esperada
Si el p-valor es mayor que 0.05, no se rechaza \(H_0\).
Por tanto, como el p-valor ≈ 0.558 es mayor que 0.05, no se rechaza
\(H_0\), concluyendo que no existe
evidencia suficiente para afirmar que la satisfacción sea diferente
entre zona urbana y rural.
Punto 4. Regresión lineal simple
# Modelo de regresión lineal simple
modelo <- lm(Calificacion ~ Tiempo, data = datos)
# Resumen del modelo
summary(modelo)
##
## Call:
## lm(formula = Calificacion ~ Tiempo, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.05245 -0.30857 0.06469 0.40734 0.92308
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 103.2867 0.4326 238.74 < 2e-16 ***
## Tiempo -4.6049 0.0524 -87.88 8.91e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.6266 on 10 degrees of freedom
## Multiple R-squared: 0.9987, Adjusted R-squared: 0.9986
## F-statistic: 7723 on 1 and 10 DF, p-value: 8.907e-16
# Coeficientes
coef(modelo)
## (Intercept) Tiempo
## 103.286713 -4.604895
# Recta estimada
# Calificación estimada = intercepto + pendiente * Tiempo
cat("ŷ =", round(coef(modelo)[1],2), "+",
round(coef(modelo)[2],2), "x")
## ŷ = 103.29 + -4.6 x
Modelo esperado
\(\hat{y} = 104.06 - 4.66x\)
Punto 5. Interpretación administrativa de la pendiente
Interpretación administrativa de la pendiente
Desde el punto de vista administrativo, el modelo indica que un
mayor tiempo de entrega se asocia con una menor calificación del
servicio. En promedio, por cada unidad adicional de tiempo de entrega,
la calificación disminuye aproximadamente en 4.66 puntos, lo que sugiere
que retrasos en las entregas afectan negativamente la percepción del
servicio por parte de los clientes.
Punto 6. Evaluación del modelo: ANOVA y gráfico
# Tabla ANOVA del modelo
anova(modelo)
## Analysis of Variance Table
##
## Response: Calificacion
## Df Sum Sq Mean Sq F value Pr(>F)
## Tiempo 1 3032.32 3032.32 7722.6 8.907e-16 ***
## Residuals 10 3.93 0.39
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Coeficiente de determinación
summary(modelo)$r.squared
## [1] 0.9987068
# Inferencia de la pendiente
summary(modelo)
##
## Call:
## lm(formula = Calificacion ~ Tiempo, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.05245 -0.30857 0.06469 0.40734 0.92308
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 103.2867 0.4326 238.74 < 2e-16 ***
## Tiempo -4.6049 0.0524 -87.88 8.91e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.6266 on 10 degrees of freedom
## Multiple R-squared: 0.9987, Adjusted R-squared: 0.9986
## F-statistic: 7723 on 1 and 10 DF, p-value: 8.907e-16
# Gráfico de dispersión con recta de regresión
plot(datos$Tiempo, datos$Calificacion,
main = "Tiempo de entrega y calificación",
xlab = "Tiempo de entrega",
ylab = "Calificación",
pch = 19)
abline(modelo, lwd = 2)

Hipótesis
• \(H_0\): La pendiente del modelo
es igual a 0 (\(\beta_1 = 0\)); el
tiempo de entrega no influye significativamente sobre la
calificación.
• \(H_1\): La pendiente del modelo
es diferente de 0 (\(\beta_1 \neq 0\));
el tiempo de entrega sí influye significativamente sobre la
calificación.
Interpretación esperada
El valor de \(R^2 \approx 0.997\)
indica que aproximadamente el 99.7% de la variación de la calificación
es explicada por el tiempo de entrega.
Si el p-valor de la pendiente es menor que 0.05, se rechaza \(H_0\).
Por tanto, como el p-valor es menor que 0.05, se concluye que el
tiempo de entrega influye significativamente sobre la calificación.
Además, el gráfico muestra una relación lineal negativa: a mayor
tiempo de entrega, menor calificación.
CONCLUSIÓN GENERAL DEL CASO
Conclusión general del caso
A partir del análisis realizado se concluye que:
• Los pedidos se distribuyen uniformemente entre los tipos de
proveedor.
• Se encontró evidencia suficiente para afirmar que el tipo de
proveedor y la satisfacción están relacionados.
• No se encontró evidencia suficiente para afirmar que la
satisfacción sea diferente entre zona urbana y rural.
• El modelo de regresión muestra una relación lineal negativa fuerte
entre el tiempo de entrega y la calificación.
• A medida que aumenta el tiempo de entrega, la calificación
disminuye significativamente.
Recta estimada del modelo
\(\hat{y} = 104.06 - 4.66x\)
Coeficiente de determinación
\(R^2 \approx 0.997\)