Problema 1

Una reconocida empresa de plásticos ha tenido mucho éxito con la producción de juguetes. Por esta razón, sus dos líneas de producción no son suficientes para satisfacer la demanda. Esta situación ha ocasionado que el dueño desee abrir una tercera línea de producción y para esto necesitará comprar la máquina que produce dicho juguete. El valor de dicha máquina asciende a más de un millón de quetzales, por esta razón, el dueño quiere estar completamente seguro de hacer la mejor elección. Para esto se evaluarán dos máquinas que cumplen con todos los requisitos en cuanto a la calidad del producto y con precios similares. Para tomar esta decisión se tomará en cuenta el tiempo que le toma a cada una de estas máquinas, producir un juguete. A continuación se muestran datos de ambas máquinas. ¿Qué máquina se debería elegir?, ¿por qué?, justifique sus respuestas con el análisis estadístico adecuado. (Ver base de datos adjunta)

library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
library(exactRankTests)
## Warning: package 'exactRankTests' was built under R version 4.2.3
##  Package 'exactRankTests' is no longer under development.
##  Please consider using package 'coin' instead.
library(BSDA)
## Warning: package 'BSDA' was built under R version 4.2.3
## Loading required package: lattice
## Warning: package 'lattice' was built under R version 4.2.3
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
p1 <-read_excel("Caso2.xlsx", sheet = 1)
View(p1)

Prueba Normalidad

\[ Ho: \text{Es normal}\] \[ Ha: \text{No es normal}\]

shapiro.test(p1$`MARCA "A"`)
## 
##  Shapiro-Wilk normality test
## 
## data:  p1$`MARCA "A"`
## W = 0.44361, p-value = 6.987e-06
shapiro.test(p1$`MARCA "B"`)
## 
##  Shapiro-Wilk normality test
## 
## data:  p1$`MARCA "B"`
## W = 0.96173, p-value = 0.8083

Con un \(valor-p = 0.8083 > \alpha\) y \(valor-p = 6.987e-06 < \alpha\) no es posible rechazar Ho, ya que una no cumple con normalidad, aunque la otra sí. Por lo tanto, resulta razonable suponer que se debe realizar una prueba no paramétrica.

Prueba Wilcoxon

\[Ho: \text{Las dos poblaciones son idénticas}\] \[Ha: \text{Las dos poblaciones no son idénticas}\]

wilcox.test(x = p1$`MARCA "A"`, y = p1$`MARCA "B"`, alternative = "two.sided", mu = 0, paired = FALSE, conf.int = 0.95)
## Warning in wilcox.test.default(x = p1$`MARCA "A"`, y = p1$`MARCA "B"`,
## alternative = "two.sided", : cannot compute exact p-value with ties
## Warning in wilcox.test.default(x = p1$`MARCA "A"`, y = p1$`MARCA "B"`,
## alternative = "two.sided", : cannot compute exact confidence intervals with
## ties
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  p1$`MARCA "A"` and p1$`MARCA "B"`
## W = 85.5, p-value = 0.4524
## alternative hypothesis: true location shift is not equal to 0
## 95 percent confidence interval:
##  -0.09999887  0.49997383
## sample estimates:
## difference in location 
##             0.05996906

Con un \(valor-p \geq \alpha\) no es posible rechazar Ho, ya que una no cumple. Por lo tanto, no hay evidencia significativa para decir que una máquina es mejor que la otra.

Problema 2

Un proveedor de pintura afirma que un nuevo aditivo reducirá el tiempo de secado de su pintura acrílica. Para probar esta afirmación, se pintaron 12 paneles de madera: una mitad de cada panel con pintura que contiene el aditivo regular, y la otra con pintura que contiene el nuevo aditivo. Los tiempos de secado, en minutos, se registran en la base de datos. ¿Existe evidencia estadísticamente significativa para asegurar que los tiempos de secado se mejoran al utilizar el nuevo aditivo? Resuelva utilizando: (a) Prueba de signos (b) Wilcoxon (c) Prueba t (d) Decida cuál de las tres pruebas anteriores es la apropiada (valide los supuestos)

library(readxl)
library(exactRankTests)
library(BSDA)
p2 <-read_excel("Caso2.xlsx", sheet = 2)
View(p2)

\[Ho: \tilde \mu_1 \geq \tilde \mu_2\]

\[Ha: \tilde \mu_1 < \tilde \mu_2\]

Prueba de Signos:

library(BSDA)
SIGN.test(x = p2$`Nuevo aditivo`, y = p2$`Aditivo regular`, alternative = "less")
## 
##  Dependent-samples Sign-Test
## 
## data:  p2$`Nuevo aditivo` and p2$`Aditivo regular`
## S = 2, p-value = 0.01123
## alternative hypothesis: true median difference is less than 0
## 95 percent confidence interval:
##  -Inf  -12
## sample estimates:
## median of x-y 
##           -12 
## 
## Achieved and Interpolated Confidence Intervals: 
## 
##                   Conf.Level L.E.pt U.E.pt
## Lower Achieved CI     0.9102   -Inf    -12
## Interpolated CI       0.9500   -Inf    -12
## Upper Achieved CI     0.9713   -Inf    -12

Wilcoxon:

wilcox.test(x = p2$`Nuevo aditivo`, y = p2$`Aditivo regular`, alternative = "less", mu = 0, paired = TRUE, conf.int = 0.95)
## Warning in wilcox.test.default(x = p2$`Nuevo aditivo`, y = p2$`Aditivo
## regular`, : cannot compute exact p-value with ties
## Warning in wilcox.test.default(x = p2$`Nuevo aditivo`, y = p2$`Aditivo
## regular`, : cannot compute exact confidence interval with ties
## Warning in wilcox.test.default(x = p2$`Nuevo aditivo`, y = p2$`Aditivo
## regular`, : cannot compute exact p-value with zeroes
## Warning in wilcox.test.default(x = p2$`Nuevo aditivo`, y = p2$`Aditivo
## regular`, : cannot compute exact confidence interval with zeroes
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  p2$`Nuevo aditivo` and p2$`Aditivo regular`
## V = 9.5, p-value = 0.006262
## alternative hypothesis: true location shift is less than 0
## 95 percent confidence interval:
##       -Inf -11.99997
## sample estimates:
## (pseudo)median 
##      -14.99996

Prubea t

t.test(p2$`Nuevo aditivo`, p2$`Aditivo regular`, alternative = "less", mu = 0, paired = TRUE, conf.int = 0.95)
## 
##  Paired t-test
## 
## data:  p2$`Nuevo aditivo` and p2$`Aditivo regular`
## t = -3.1658, df = 13, p-value = 0.003721
## alternative hypothesis: true mean difference is less than 0
## 95 percent confidence interval:
##       -Inf -6.608961
## sample estimates:
## mean difference 
##             -15

Supuestos

\[ Ho: \text{Es normal}\] \[ Ha: \text{No es normal}\]

shapiro.test(p2$`Nuevo aditivo`)
## 
##  Shapiro-Wilk normality test
## 
## data:  p2$`Nuevo aditivo`
## W = 0.96787, p-value = 0.847
shapiro.test(p2$`Aditivo regular`)
## 
##  Shapiro-Wilk normality test
## 
## data:  p2$`Aditivo regular`
## W = 0.893, p-value = 0.08932

Con un \(valor-p > \alpha\) no es posible rechazar Ho. Por lo tanto, resulta razonable suponer normalidad, por lo tanto es posible aplicar una prueba parametrica para la media, en este caso la prueba t.

Problema 3

Se evalúan tres programas de preparación para un examen de admisión. Las calificaciones obtenidas por una muestra de 20 personas que utilizaron los programas de preparación arrojaron los siguientes datos. Utilice la prueba de Kruskal-Wallis para determinar si existe una diferencia significativa entre los tres programas. Utilice 𝛼 = 0.05

library(readxl)
library(exactRankTests)
library(BSDA)
p3 <-read_excel("Caso2.xlsx", sheet = 3)
View(p3)
library(agricolae)
skewness(p3$A)
## [1] -0.2779763
skewness(p3$B)
## [1] 0.2949904
skewness(p3$C)
## [1] -1.529059
kruskal.test(list(p3$A, p3$B, p3$C))
## 
##  Kruskal-Wallis rank sum test
## 
## data:  list(p3$A, p3$B, p3$C)
## Kruskal-Wallis chi-squared = 9.1009, df = 2, p-value = 0.01056

Con un nivel de confianza del 95%, y un valor-p = 0.01056, existe una diferencia significativa entre las medianas de los programas de preparación para el examen de admisión.

Problema 4

En una universidad, una organización estudiantil entrevistó tanto a los alumnos actuales como a los recién egresados para obtener información sobre la calidad de la enseñanza. Al analizar las respuestas, se llega a la siguiente clasificación sobre la habilidad de los profesores (Professor) para la enseñanza. ¿Coincide la clasificación de los estudiantes actuales (Current Students) con la de los recién egresados (Recent Graduates)? Utilice 𝛼 = 0.1 y pruebe la significancia de la correlación por rangos.

library(readxl)
library(exactRankTests)
library(BSDA)
p4 <-read_excel("Caso2.xlsx", sheet = 4)
View(p4)
cor.test(p4$`Current Students`, p4$`Recent Graduates`, method = c("spearman"), alternative = "two.sided", exact = F)
## 
##  Spearman's rank correlation rho
## 
## data:  p4$`Current Students` and p4$`Recent Graduates`
## S = 38, p-value = 0.009222
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##      rho 
## 0.769697

Con un rho de 0.769697, un valor-p = 0.009222, y un nivel de confianza del 99%, se rechaza la hipótesis nula. Por lo tanto, existe evidencia significativa para concluir que hay una relación fuerte entre la clasificación los estudiantes actuales y los egresados.