Hoy en dia las empresas necesitan apoyarse en el análisis de datos para comprender mejor su funcionamiento y tomar decisiones más acertadas. Variables como la producción, los costos, los turnos de trabajo y el cumplimiento de metas permiten evaluar el desempeño de una organización y detectar posibles patrones dentro de sus operaciones. En este taller se aplicarán métodos no paramétricos y regresión lineal simple utilizando RStudio, con el objetivo de analizar la información de una empresa manufacturera y obtener conclusiones a partir de los resultados estadísticos obtenidos.
Una empresa manufacturera desea analizar si el nivel de producción permite explicar los costos mensuales.
datos <- data.frame(
Mes = 1:12,
Planta = c("Norte", "Sur", "Centro",
"Norte", "Sur", "Centro",
"Norte", "Sur", "Centro",
"Norte", "Sur", "Centro"),
Turno = c("Diurno", "Nocturno", "Diurno",
"Nocturno", "Diurno", "Nocturno",
"Diurno", "Nocturno", "Diurno",
"Nocturno", "Diurno", "Nocturno"),
Cumple_meta = c("Si", "No", "Si",
"Si", "No", "Si",
"Si", "No", "Si",
"Si", "No", "Si"),
`Produccion (x)` = c(100,120,140,160,180,200,
220,240,260,280,300,320),
`Costo (y)` = c(420,455,493,528,566,602,
638,675,711,748,785,820)
)
datos
## Mes Planta Turno Cumple_meta Produccion..x. Costo..y.
## 1 1 Norte Diurno Si 100 420
## 2 2 Sur Nocturno No 120 455
## 3 3 Centro Diurno Si 140 493
## 4 4 Norte Nocturno Si 160 528
## 5 5 Sur Diurno No 180 566
## 6 6 Centro Nocturno Si 200 602
## 7 7 Norte Diurno Si 220 638
## 8 8 Sur Nocturno No 240 675
## 9 9 Centro Diurno Si 260 711
## 10 10 Norte Nocturno Si 280 748
## 11 11 Sur Diurno No 300 785
## 12 12 Centro Nocturno Si 320 820
La base de datos contiene información de 12 meses de operación de una empresa manufacturera. En ella se analizan variables como la planta, el turno, el cumplimiento de metas, la producción y los costos mensuales. Podemos notar que a medida que aumenta la producción, también aumentan los costos, lo que permitirá evaluar posteriormente si existe una relación lineal entre ambas variables.
Se desea verificar si los registros se distribuyen uniformemente entre las plantas de la empresa.
Hipótesis:
H0: Los registros se distribuyen uniformemente entre las plantas.
H1: Los registros no se distribuyen uniformemente entre las plantas.
Nivel de significancia
\[ \alpha = 0.05 \]
Como existen 3 plantas y n = 12:
\[ E_i = \frac{12}{3} = 4 \]
# Tabla de frecuencias de las plantas
tabla_planta <- table(datos$Planta)
tabla_planta
##
## Centro Norte Sur
## 4 4 4
# Prueba de bondad de ajuste
chisq.test(tabla_planta, p = c(1/3, 1/3, 1/3))
## Warning in chisq.test(tabla_planta, p = c(1/3, 1/3, 1/3)): Chi-squared
## approximation may be incorrect
##
## Chi-squared test for given probabilities
##
## data: tabla_planta
## X-squared = 0, df = 2, p-value = 1
Interpretación
Como el p-valor obtenido es igual a 1 y es mayor que el nivel de significancia α=0.05, no se rechaza la hipótesis nula H0. Por lo tanto, no existe evidencia estadística suficiente para afirmar que los registros se distribuyen de manera diferente entre las plantas de la empresa.
Interpretación empresarial
Los registros se encuentran distribuidos de forma equilibrada entre las plantas Norte, Sur y Centro.
Se desea determinar si la planta y el cumplimiento de meta son independientes.
Hipótesis:
H0: La planta y el cumplimiento de meta son independientes.
H1: La planta y el cumplimiento de meta no son independientes.
Nivel de significancia:
\[ \alpha = 0.05 \]
# Tabla de contingencia
tabla_ind <- table(datos$Planta, datos$Cumple_meta)
tabla_ind
##
## No Si
## Centro 0 4
## Norte 0 4
## Sur 4 0
# Prueba chi-cuadrado de independencia
chisq.test(tabla_ind, correct = FALSE)
## Warning in chisq.test(tabla_ind, correct = FALSE): Chi-squared approximation
## may be incorrect
##
## Pearson's Chi-squared test
##
## data: tabla_ind
## X-squared = 12, df = 2, p-value = 0.002479
Interpretación
Como el p-valor obtenido es igual a 0.002479 y es menor que el nivel de significancia α=0.05, se rechaza la hipótesis nula H0.Por lo tanto, existe evidencia estadística suficiente para afirmar que la planta y el cumplimiento de meta están relacionados.
Interpretación empresarial
Con base en los resultados obtenidos, el cumplimiento de metas parece depender de la planta de la empresa. En este caso, las plantas Norte y Centro presentan cumplimiento de meta en todos sus registros, mientras que la planta Sur no presenta cumplimiento en ninguno de los casos observados.
Se desea comparar si el cumplimiento de meta es homogéneo entre el turno diurno y nocturno.
Hipótesis
H0: La proporción de cumplimiento de meta es homogénea entre el turno diurno y nocturno.
H1: La proporción de cumplimiento de meta no es homogénea entre el turno diurno y nocturno.
Nivel de significancia:
\[ \alpha = 0.05 \]
# Tabla entre turno y cumplimiento de meta
tabla_hom <- table(datos$Turno, datos$Cumple_meta)
tabla_hom
##
## No Si
## Diurno 2 4
## Nocturno 2 4
# Prueba chi-cuadrado de homogeneidad
chisq.test(tabla_hom, correct = FALSE)
## Warning in chisq.test(tabla_hom, correct = FALSE): Chi-squared approximation
## may be incorrect
##
## Pearson's Chi-squared test
##
## data: tabla_hom
## X-squared = 0, df = 1, p-value = 1
Interpretación
Como el p-valor obtenido es igual a 1 y es mayor que el nivel de significancia α=0.05, no se rechaza la hipótesis nula H0. Por lo tanto, no existe evidencia estadística suficiente para afirmar que la proporción de cumplimiento de meta sea diferente entre el turno diurno y nocturno.
Interpretación empresarial
Aunque en ambos turnos se presentan registros de cumplimiento y no cumplimiento de metas, las diferencias observadas no son estadísticamente significativas al nivel del 5 %. Entonces, el comportamiento del cumplimiento de meta puede considerarse homogéneo entre el turno diurno y nocturno.