Problema 1

Se estudia la compra de una nueva máquina. Se comprará si la proporción de producción defectuosa es inferior al 5%. En una muestra de 40 artículos, 3 necesitan ser reprocesados.

Hipótesis:

\[H_0: p \geq 0.05 \quad \text{vs} \quad H_1: p < 0.05\]

## Warning in prop.test(x1, n1, p = p0, alternative = "less", correct = FALSE):
## Chi-squared approximation may be incorrect
## Proporcion muestral: p̂ = 0.075
## Estadístico Z = 0.7255
## Valor-p = 0.7659
## Decisión: No se rechaza H0 (p-value >= 0.05)
## Conclusión: NO se compra la máquina. No hay suficiente evidencia de que la tasa defectuosa sea menor al 5%.

Interpretación: La proporción muestral es \(\hat{p} = 0.075\) (7.5%), que es mayor al 5% de referencia. El valor-p es 0.7659 > 0.05, por lo que no se rechaza \(H_0\). No existe evidencia estadística suficiente para afirmar que la tasa de defectos es inferior al 5%, por lo que la máquina no debería comprarse con base en esta muestra.


Problema 2

Empresa con dos métodos de entrenamiento. ¿El método 2 es superior al método 1?

Grupo n Media SD
1 36 6.0 4.0
2 40 8.2 4.3

Hipótesis:

\[H_0: \mu_2 \leq \mu_1 \quad \text{vs} \quad H_1: \mu_2 > \mu_1\]

(equivalente a \(H_0: \mu_1 - \mu_2 \geq 0\) vs \(H_1: \mu_1 - \mu_2 < 0\))

## Estadístico t = -2.3104
## Grados de libertad (Welch) = 73.91
## Valor-p (prueba unilateral) = 0.0118
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El método 2 ES estadísticamente superior al método 1.
## 
## Supuestos a tener en cuenta:
##   - Independencia entre grupos
##   - Normalidad de los puntajes (o n suficientemente grande por TLC)
##   - Se usa t de Welch por varianzas desconocidas y posiblemente distintas

Interpretación: El valor-p = 0.0118 < 0.05, por lo que se rechaza \(H_0\). Hay evidencia estadística de que el método de entrenamiento 2 produce puntajes significativamente más altos que el método 1. Supuestos clave: independencia entre grupos, distribución aproximadamente normal de los puntajes (apoyada por el TLC con n > 30) y varianzas no necesariamente iguales (se usa t de Welch).


Problema 3

Comparación de neumáticos FB vs KT. Se distribuyen normalmente. \(\alpha = 0.05\).

Hipótesis:

\[H_0: \mu_{FB} = \mu_{KT} \quad \text{vs} \quad H_1: \mu_{FB} \neq \mu_{KT}\]

## Resumen FB: media = 37.2083 | SD = 5.4166
## Resumen KT: media = 42.1417 | SD = 3.4007
## Prueba F (igualdad de varianzas):
##    F = 2.537 | p-value = 0.1379
##    Varianzas: iguales (no se rechaza H0)
## Prueba t dos muestras independientes:
##    t = -2.6721
##    gl = 22
##    Valor-p = 0.0139
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: Hay diferencia significativa. Se recomienda la marca KT

Interpretación: La prueba F indica varianzas iguales (p = 0.1379). La prueba t arroja un valor-p = 0.0139 < 0.05, por lo que se rechaza \(H_0\). Existe diferencia estadísticamente significativa entre las marcas. KT tiene mayor duración promedio (42.14 vs 37.21), por lo que se recomienda adquirir la marca KT.


Problema 4

Comparación de dos métodos de ensamble en las mismas 9 unidades. Datos pareados. \(\alpha = 0.05\).

Hipótesis (¿nuevo método es más eficiente = menor tiempo?):

\[H_0: \mu_d \leq 0 \quad \text{vs} \quad H_1: \mu_d > 0 \quad \text{donde } d = PE - PN\]

## Diferencias d = PE - PN: -3 6 6 3 7 4 8 -1 3
## Media de d: 3.6667 | SD de d: 3.6742
## Prueba t pareada:
##    t = 2.9938
##    gl = 8
##    Valor-p = 0.0086
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El nuevo procedimiento ES más eficiente (tiempos menores) que el estándar.

Interpretación: Se usa prueba t pareada porque cada unidad fue medida con ambos métodos. La media de las diferencias es \(\bar{d} = 3.6667\), indicando que el procedimiento estándar toma más tiempo. El valor-p = 0.0086 < 0.05, por lo que se rechaza H₀. El nuevo procedimiento es significativamente más eficiente..


Problema 5

Datos de peso antes (\(x_1\)) y después (\(x_2\)) de un mes de ejercicio con nuevo instructor. \(\alpha = 0.01\).

Hipótesis (el programa reduce peso → \(x_1 > x_2\)\(d = x_1 - x_2 > 0\)):

\[H_0: \mu_d \leq 0 \quad \text{vs} \quad H_1: \mu_d > 0\]

## n = 16
## Media d: 2.3125 | SD d: 2.7011
## Prueba t pareada (α = 0.01):
##    t = 3.4246
##    gl = 15
##    Valor-p = 0.0019
## Decisión: Se RECHAZA H0 (p-value < 0.01)
## Conclusión: El programa ES eficaz. Se recomienda contratar al instructor.

Interpretación: Se aplica prueba t pareada porque las mediciones antes/después corresponden a los mismos individuos. El valor-p = 0.0019 < 0.01, por lo que se rechaza H₀. El programa de ejercicio sí reduce el peso de forma estadísticamente significativa. Se recomienda contratar al instructor..


Problema 6

Comparación de lector láser nuevo (\(X_1\)) vs antiguo (\(X_2\)). Códigos de barra leídos por segundo.

Hipótesis (¿se puede preferir uno sobre el otro?):

\[H_0: \mu_1 = \mu_2 \quad \text{vs} \quad H_1: \mu_1 \neq \mu_2\]

## Estadístico t (Welch) = 2.6657
## Grados de libertad = 118.99
## Valor-p (bilateral) = 0.008751
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: Sí existe preferencia. Se recomienda el lector nuevo (X1)

Interpretación: Con un valor-p = 0.008751 << 0.05, se rechaza \(H_0\). Existe diferencia estadísticamente significativa. El lector nuevo (\(X_1\)) lee en promedio 11.5 códigos más por segundo que el antiguo, por lo que se recomienda adquirir el nuevo lector láser.


Problema 7

Producción de obreros con salario fijo (G1) vs plan de incentivos (G2). ¿El plan de incentivos es efectivo?

Hipótesis:

\[H_0: \mu_{G1} \geq \mu_{G2} \quad \text{vs} \quad H_1: \mu_{G1} < \mu_{G2}\]

## G1 - Media: 75.1 | SD: 2.5582
## G2 - Media: 82.4 | SD: 3.6576
## Prueba F (igualdad de varianzas): p-value = 0.3018
## Varianzas: iguales
## Prueba t:
##    t = -5.1719
##    gl = 18
##    Valor-p = 0
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El plan de incentivos SÍ es efectivo. G2 produce significativamente más.

Interpretación: El valor-p = 0 < 0.05, por lo que se rechaza H₀. El plan de incentivos sí incrementa significativamente la producción. Con salarios equivalentes, implementar el plan es la decisión recomendada..


Problema 8

Campaña publicitaria de pizza. Antes: 40/200 con preferencia. Después: 44/200 con preferencia. \(\alpha = 0.05\).

Hipótesis (¿la campaña no fue efectiva? → prueba unilateral, \(H_1: p_1 < p_2\)):

\[H_0: p_{\text{antes}} \geq p_{\text{después}} \quad \text{vs} \quad H_1: p_{\text{antes}} < p_{\text{después}}\]

## p̂ antes  = 0.2
## p̂ después = 0.22
## Estadístico chi² = 0.2411
## Valor-p = 0.3117
## Decisión: No se rechaza H0 (p-value >= 0.05)
## Conclusión: No hay evidencia de que la campaña haya sido efectiva.
##            A nivel del 5%, podría decirse que la campaña NO fue efectiva.

Interpretación: El valor-p = 0.3117 > 0.05, por lo que no se rechaza \(H_0\). No existe evidencia estadística suficiente de que la campaña publicitaria haya incrementado la preferencia por el producto. Con un nivel de significancia del 5%, se concluye que la campaña no fue efectiva.


Problema 9

Horas-hombre perdidas por accidentes en 10 plantas, antes (A) y después (D) de un programa de seguridad. \(\alpha = 0.05\).

Hipótesis (programa reduce accidentes → \(d = A - D > 0\)):

\[H_0: \mu_d \leq 0 \quad \text{vs} \quad H_1: \mu_d > 0\]

## Diferencias d = Antes - Después: 9 13 2 5 -5 6 6 5 2 6
## Media d: 4.9 | SD d: 4.7246
## Prueba t pareada:
##    t = 3.2796
##    gl = 9
##    Valor-p = 0.0048
## Decisión: Se RECHAZA H0 (p-value < 0.05)
## Conclusión: El programa de seguridad SÍ es eficaz. Redujo las horas-hombre perdidas.

Interpretación: Se usa prueba t pareada ya que las mediciones corresponden a las mismas 10 plantas antes y después del programa. La media de las diferencias es \(\bar{d} = 4.9\) horas, y el valor-p = 0.0048 < 0.05, por lo que se rechaza H₀. El programa de seguridad industrial sí es eficaz para reducir las horas-hombre perdidas por accidentes..