Se estudia la compra de una nueva máquina. Se comprará si la proporción de producción defectuosa es inferior al 5%. En una muestra de 40 artículos, 3 necesitan ser reprocesados.
Hipótesis:
\[H_0: p \geq 0.05 \quad \text{vs} \quad H_1: p < 0.05\]
## Warning in prop.test(x1, n1, p = p0, alternative = "less", correct = FALSE):
## Chi-squared approximation may be incorrect
## Proporcion muestral: p̂ = 0.075
## Estadístico Z = 0.7255
## Valor-p = 0.7659
## Decisión: No se rechaza H0 (p-value >= 0.05)
## Conclusión: NO se compra la máquina. No hay suficiente evidencia de que la tasa defectuosa sea menor al 5%.
Interpretación: La proporción muestral es \(\hat{p} = 0.075\) (7.5%), que es mayor al 5% de referencia. El valor-p es 0.7659 > 0.05, por lo que no se rechaza \(H_0\). No existe evidencia estadística suficiente para afirmar que la tasa de defectos es inferior al 5%, por lo que la máquina no debería comprarse con base en esta muestra.
Empresa con dos métodos de entrenamiento. ¿El método 2 es superior al método 1?
| Grupo | n | Media | SD |
|---|---|---|---|
| 1 | 36 | 6.0 | 4.0 |
| 2 | 40 | 8.2 | 4.3 |
Hipótesis:
\[H_0: \mu_2 \leq \mu_1 \quad \text{vs} \quad H_1: \mu_2 > \mu_1\]
(equivalente a \(H_0: \mu_1 - \mu_2 \geq 0\) vs \(H_1: \mu_1 - \mu_2 < 0\))
## Estadístico t = -2.3104
## Grados de libertad (Welch) = 73.91
## Valor-p (prueba unilateral) = 0.0118
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El método 2 ES estadísticamente superior al método 1.
##
## Supuestos a tener en cuenta:
## - Independencia entre grupos
## - Normalidad de los puntajes (o n suficientemente grande por TLC)
## - Se usa t de Welch por varianzas desconocidas y posiblemente distintas
Interpretación: El valor-p = 0.0118 < 0.05, por lo que se rechaza \(H_0\). Hay evidencia estadística de que el método de entrenamiento 2 produce puntajes significativamente más altos que el método 1. Supuestos clave: independencia entre grupos, distribución aproximadamente normal de los puntajes (apoyada por el TLC con n > 30) y varianzas no necesariamente iguales (se usa t de Welch).
Comparación de neumáticos FB vs KT. Se distribuyen normalmente. \(\alpha = 0.05\).
Hipótesis:
\[H_0: \mu_{FB} = \mu_{KT} \quad \text{vs} \quad H_1: \mu_{FB} \neq \mu_{KT}\]
## Resumen FB: media = 37.2083 | SD = 5.4166
## Resumen KT: media = 42.1417 | SD = 3.4007
## Prueba F (igualdad de varianzas):
## F = 2.537 | p-value = 0.1379
## Varianzas: iguales (no se rechaza H0)
## Prueba t dos muestras independientes:
## t = -2.6721
## gl = 22
## Valor-p = 0.0139
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: Hay diferencia significativa. Se recomienda la marca KT
Interpretación: La prueba F indica varianzas iguales (p = 0.1379). La prueba t arroja un valor-p = 0.0139 < 0.05, por lo que se rechaza \(H_0\). Existe diferencia estadísticamente significativa entre las marcas. KT tiene mayor duración promedio (42.14 vs 37.21), por lo que se recomienda adquirir la marca KT.
Comparación de dos métodos de ensamble en las mismas 9 unidades. Datos pareados. \(\alpha = 0.05\).
Hipótesis (¿nuevo método es más eficiente = menor tiempo?):
\[H_0: \mu_d \leq 0 \quad \text{vs} \quad H_1: \mu_d > 0 \quad \text{donde } d = PE - PN\]
## Diferencias d = PE - PN: -3 6 6 3 7 4 8 -1 3
## Media de d: 3.6667 | SD de d: 3.6742
## Prueba t pareada:
## t = 2.9938
## gl = 8
## Valor-p = 0.0086
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El nuevo procedimiento ES más eficiente (tiempos menores) que el estándar.
Interpretación: Se usa prueba t pareada porque cada unidad fue medida con ambos métodos. La media de las diferencias es \(\bar{d} = 3.6667\), indicando que el procedimiento estándar toma más tiempo. El valor-p = 0.0086 < 0.05, por lo que se rechaza H₀. El nuevo procedimiento es significativamente más eficiente..
Datos de peso antes (\(x_1\)) y después (\(x_2\)) de un mes de ejercicio con nuevo instructor. \(\alpha = 0.01\).
Hipótesis (el programa reduce peso → \(x_1 > x_2\) → \(d = x_1 - x_2 > 0\)):
\[H_0: \mu_d \leq 0 \quad \text{vs} \quad H_1: \mu_d > 0\]
## n = 16
## Media d: 2.3125 | SD d: 2.7011
## Prueba t pareada (α = 0.01):
## t = 3.4246
## gl = 15
## Valor-p = 0.0019
## Decisión: Se RECHAZA H0 (p-value < 0.01)
## Conclusión: El programa ES eficaz. Se recomienda contratar al instructor.
Interpretación: Se aplica prueba t pareada porque las mediciones antes/después corresponden a los mismos individuos. El valor-p = 0.0019 < 0.01, por lo que se rechaza H₀. El programa de ejercicio sí reduce el peso de forma estadísticamente significativa. Se recomienda contratar al instructor..
Comparación de lector láser nuevo (\(X_1\)) vs antiguo (\(X_2\)). Códigos de barra leídos por segundo.
Hipótesis (¿se puede preferir uno sobre el otro?):
\[H_0: \mu_1 = \mu_2 \quad \text{vs} \quad H_1: \mu_1 \neq \mu_2\]
## Estadístico t (Welch) = 2.6657
## Grados de libertad = 118.99
## Valor-p (bilateral) = 0.008751
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: Sí existe preferencia. Se recomienda el lector nuevo (X1)
Interpretación: Con un valor-p = 0.008751 << 0.05, se rechaza \(H_0\). Existe diferencia estadísticamente significativa. El lector nuevo (\(X_1\)) lee en promedio 11.5 códigos más por segundo que el antiguo, por lo que se recomienda adquirir el nuevo lector láser.
Producción de obreros con salario fijo (G1) vs plan de incentivos (G2). ¿El plan de incentivos es efectivo?
Hipótesis:
\[H_0: \mu_{G1} \geq \mu_{G2} \quad \text{vs} \quad H_1: \mu_{G1} < \mu_{G2}\]
## G1 - Media: 75.1 | SD: 2.5582
## G2 - Media: 82.4 | SD: 3.6576
## Prueba F (igualdad de varianzas): p-value = 0.3018
## Varianzas: iguales
## Prueba t:
## t = -5.1719
## gl = 18
## Valor-p = 0
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El plan de incentivos SÍ es efectivo. G2 produce significativamente más.
Interpretación: El valor-p = 0 < 0.05, por lo que se rechaza H₀. El plan de incentivos sí incrementa significativamente la producción. Con salarios equivalentes, implementar el plan es la decisión recomendada..
Campaña publicitaria de pizza. Antes: 40/200 con preferencia. Después: 44/200 con preferencia. \(\alpha = 0.05\).
Hipótesis (¿la campaña no fue efectiva? → prueba unilateral, \(H_1: p_1 < p_2\)):
\[H_0: p_{\text{antes}} \geq p_{\text{después}} \quad \text{vs} \quad H_1: p_{\text{antes}} < p_{\text{después}}\]
## p̂ antes = 0.2
## p̂ después = 0.22
## Estadístico chi² = 0.2411
## Valor-p = 0.3117
## Decisión: No se rechaza H0 (p-value >= 0.05)
## Conclusión: No hay evidencia de que la campaña haya sido efectiva.
## A nivel del 5%, podría decirse que la campaña NO fue efectiva.
Interpretación: El valor-p = 0.3117 > 0.05, por lo que no se rechaza \(H_0\). No existe evidencia estadística suficiente de que la campaña publicitaria haya incrementado la preferencia por el producto. Con un nivel de significancia del 5%, se concluye que la campaña no fue efectiva.
Horas-hombre perdidas por accidentes en 10 plantas, antes (A) y después (D) de un programa de seguridad. \(\alpha = 0.05\).
Hipótesis (programa reduce accidentes → \(d = A - D > 0\)):
\[H_0: \mu_d \leq 0 \quad \text{vs} \quad H_1: \mu_d > 0\]
## Diferencias d = Antes - Después: 9 13 2 5 -5 6 6 5 2 6
## Media d: 4.9 | SD d: 4.7246
## Prueba t pareada:
## t = 3.2796
## gl = 9
## Valor-p = 0.0048
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El programa de seguridad SÍ es eficaz. Redujo las horas-hombre perdidas.
Interpretación: Se usa prueba t pareada ya que las mediciones corresponden a las mismas 10 plantas antes y después del programa. La media de las diferencias es \(\bar{d} = 4.9\) horas, y el valor-p = 0.0048 < 0.05, por lo que se rechaza H₀. El programa de seguridad industrial sí es eficaz para reducir las horas-hombre perdidas por accidentes..