Problema 1

Suponga que se estudia la compra de una nueva maquina para una empresa. Se comprara la maquina si la proporción de la producción que necesita ser reprocesados por tener defectos es inferior al 5 %. Se examina una muestra de 40 artículos construidos por la maquina y 3 necesitan ser reprocesados . ¿ Que decisión se toma? ( Se compra o no la maquina?)

\[ Ho: \text{La máquina no presenta mejoras}\] \[ Ha: \text{La máquina presenta mejoras}\]

# Datos del problema
n <- 40          # tamaño de la muestra
x <- 3           # número de artículos defectuosos
p0 <- 0.05       # proporción de referencia

# Prueba binomial exacta (unilateral izquierda: alternativa "less")
prueba <- binom.test(x, n, p = p0, alternative = "less")
prueba
## 
##  Exact binomial test
## 
## data:  x and n
## number of successes = 3, number of trials = 40, p-value = 0.8619
## alternative hypothesis: true probability of success is less than 0.05
## 95 percent confidence interval:
##  0.0000000 0.1825869
## sample estimates:
## probability of success 
##                  0.075

Como el valor p es de 0.87, mayor a 0.05, no se rechaza la hipotesis nula. No hay suficiente evidencia para confirmar que la proporción de defectuosos es menor al 5%. Por esto, la máquina no se compra.

Problema 2

Los ingenieros de una ensambladora de automóviles requieren decidir sobre cuál de dos de las marcas de neumáticos deben comprar. La marca FB o la marca KT. Con el fin de tomar una decisión basada en evidencias estadísticas, deciden realizar un experimento en el que usan 12 neumáticos de cada marca. Los neumáticos se utilizan hasta su terminación. Los resultados obtenidos son los siguientes:

\[Ho: \mu_1 \geq \mu_2 \] \[Ha: \mu_1 < \mu_2 \]

FB =c(41.8, 41.6, 31.5, 48.7, 40.8, 31.2, 36.5, 36.2, 32.8, 36.3, 38.6, 30.5)
KT =c(40.5, 38.4, 44.0, 34.9, 44.0, 44.7, 44.0, 47.1, 39.8, 43.9, 44.2, 40.2)

var.test(FB,KT)
## 
##  F test to compare two variances
## 
## data:  FB and KT
## F = 2.537, num df = 11, denom df = 11, p-value = 0.1379
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.7303443 8.8127611
## sample estimates:
## ratio of variances 
##           2.536996
t.test(FB,KT, alternative = "less", paired=FALSE, var.equal=TRUE, conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  FB and KT
## t = -2.6721, df = 22, p-value = 0.006961
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -1.763063
## sample estimates:
## mean of x mean of y 
##  37.20833  42.14167

El valor p es menor a 0.05. Rechazamos la hipótesis nula y aceptamos la hipótesis alterna. concluimos que la marca KT tiene mayor tiempo de vida y se recomienda comprar esta marca.

Problema 3

Un ingeniero desea establecer si existen diferencias entre dos métodos diferentes de realizar el ensamble de una casa prefabricada. Para comprobarlo recoge información la producción de ambos métodos que se presentan a continuación: \[Ho: \mu_1 = \mu_2\] \[Ha: \mu_1 \neq \mu_2\]

x1 = c(32, 37, 35, 28, 41, 44, 35, 31, 34) # Procedimiento estándar
x2 = c(35, 31, 29, 25, 34, 40, 27, 32, 31) # Nuevo procedimiento
# Prueba F para igualdad de varianzas
var.test(x1, x2)
## 
##  F test to compare two variances
## 
## data:  x1 and x2
## F = 1.2205, num df = 8, denom df = 8, p-value = 0.7849
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2753114 5.4109136
## sample estimates:
## ratio of variances 
##           1.220527
# Prueba t para muestras independientes con varianzas iguales
t.test(x1, x2, var.equal = TRUE, alternative = "two.sided", conf.level = 0.95)
## 
##  Two Sample t-test
## 
## data:  x1 and x2
## t = 1.6495, df = 16, p-value = 0.1185
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.045706  8.379039
## sample estimates:
## mean of x mean of y 
##  35.22222  31.55556

valor p mayor a 0.05. no se rechaza la hipotesis nula. No hay suficiente evidencia para concluír que hay una diferencia significativa entre los dos métodos. Se requiere más evidencia para tomar la decisión de cambiar el método actual.

Problema 4

Un director de un gimnasio quiere determinar si un instructor de ejercicio debe ser contratado o no para su campaña estrella “Reducción de peso”, Para tomar la decisión le dice que pruebe con 16 de las personas que habitualmente concurren tomadas al azar. Los datos que se tomaron antes (𝑥1) y después (𝑥2) de haber realizado un mes de ejercicios son los siguientes:

\[Ho: \mu_1 = \mu_2\] El peso se mantuvo igual

\[Ho: \mu_1 > \mu_2\] El peso disminuyó:

x1 <- c(104,    89, 84, 106,    90, 96, 79, 90, 85, 76, 91, 82, 100,    89, 121,    72)

x2 <- c(98, 85, 85, 103,    88, 95, 79, 90, 82, 76, 89, 81, 99, 86, 111,    70)
prueba <- t.test(x1, x2, paired = TRUE, alternative = "greater")
prueba
## 
##  Paired t-test
## 
## data:  x1 and x2
## t = 3.4246, df = 15, p-value = 0.001882
## alternative hypothesis: true mean difference is greater than 0
## 95 percent confidence interval:
##  1.128718      Inf
## sample estimates:
## mean difference 
##          2.3125

como el valor p es menor a 0.05, se rechaza la hipotesis nula y concluímos que la hipotesis alterna es verdadera. Así, el valor del peso promedio final del grupo fue menor al del inicial, por lo que se recomienda contratar al entrenador. Su programa fue exitoso

Problema 5

Se realizan pruebas de un nuevo lector láser manual para uso en inventarios y el lector utilizado actualmente, con el fin de decidir si se adquiere el primero. Se obtienen los datos siguientes sobre el número de códigos de barra de 7 pulgadas que pueden leerse por segundo. Sea 𝑋1: número de códigos leído por segundo con el dispositivo nuevo y 𝑋2 el correspondiente al dispositivo antiguo. \[Ho: \mu_1 \leq \mu_2 \hspace{.5cm}\text{(el nuevo lector no es mejor)}\] \[Ha: \mu_1 > \mu_2 \hspace{.5cm}\text{(el nuevo lector es mejor)}\]

# Datos
n1 <- 61
n2 <- 61
xbar1 <- 40
xbar2 <- 29
s2_1 <- 24.9
s2_2 <- 22.7

# Estadístico z
denominador <- sqrt(s2_1/n1 + s2_2/n2)
z <- (xbar1 - xbar2) / denominador

# p-valor (cola derecha)
valorp <- 1 - pnorm(z)

# Resultados
z
## [1] 12.45243
valorp
## [1] 0

como el valor p es menor a 0.05, rechazamos la hipotesis nula y concluimos la hipotesis alterna como verdadera. Se considera que el lector nuevo tiene mayor velocidad de lectura en codigos por segundo. Por esto se recomienda comprar el lector.

Problema 6

Un empresario registro el número de artículos producidos durante 10 días, para un grupo de 15 obreros que trabajaban con base en un salario fijo (Grupo 1). El industrial introdujo un plan de incentivos para otros 15 obreros y registro su producción durante otros 10 días (Grupo 2). El número de artículos producidos por cada uno de los grupos fue: \[Ho: \mu_1 \geq \mu_2 \hspace{.5cm}\text{(el incentivo no es efectivo)}\] \[Ha: \mu_1 < \mu_2 \hspace{.5cm}\text{(el incentivo es efectivo)}\]

x1 <- c(75, 76, 74, 80, 72, 78, 76, 73, 72, 75)
x2 <- c(86, 78, 86, 84, 81, 79, 78, 84, 88, 80)
n1 = 15
n2 = 15
var.test(x1, x2) #como el intervalo contiene el 1, se asumen iguales.
## 
##  F test to compare two variances
## 
## data:  x1 and x2
## F = 0.4892, num df = 9, denom df = 9, p-value = 0.3018
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.121511 1.969527
## sample estimates:
## ratio of variances 
##          0.4892027
t.test(x1, x2,
       alternative = "less",     
       var.equal = TRUE,         
       conf.level = 0.95)
## 
##  Two Sample t-test
## 
## data:  x1 and x2
## t = -5.1719, df = 18, p-value = 3.204e-05
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -4.852437
## sample estimates:
## mean of x mean of y 
##      75.1      82.4

Como el valor p es casi 0, se rechaza la hipotesis nula y se concluye que la alterna es verdadera. Por esto se concluye que el plan de incentivos fué efectivo.

Problema 7

En una muestra de 200 clientes, el 20% indica una preferencia por tamaño especial de pizza. Con posterioridad a una campaña publicitaria realizada en radio y televisión promoviendo dicho producto, se selecciono una muestra de igual tamaño. En esta ultima muestra el 22% de los clientes indico preferencia por el producto. De acuerdo con estos resultados y un nivel de significancia del 5% , podría decirse que la campaña publicitaria no fue efectiva?

\[Ho: p_2 \leq p_1 \quad \text{(la campaña no fue efectiva)}\] \[Ha: p_2 > p_1 \quad \text{(la campaña fue efectiva)}\]

  # Datos
n1 <- 200
p1 <- 0.20
x1 <- n1 * p1  # número de éxitos antes

n2 <- 200
p2 <- 0.22
x2 <- n2 * p2  # número de éxitos después

# Prueba de proporciones para dos muestras independientes
prop.test(x = c(x1, x2),
          n = c(n1, n2),
          alternative = "less",   # H1: p2 > p1 ⇒ usamos "less" en p1 - p2
          correct = FALSE)        
## 
##  2-sample test for equality of proportions without continuity correction
## 
## data:  c(x1, x2) out of c(n1, n2)
## X-squared = 0.24111, df = 1, p-value = 0.3117
## alternative hypothesis: less
## 95 percent confidence interval:
##  -1.00000000  0.04697605
## sample estimates:
## prop 1 prop 2 
##   0.20   0.22

el valor p es mayor a 0.05. No se rechaza la hipotesis nula. No hay suficiente evidencia para comprobar que la campaña no fue efectiva. Por esto, recomendamos realizar otra muestra para determinar si la campaña no fue efectiva.

Problema 8

Los siguientes son los datos de las horas hábiles que se pierden en promedio por accidentes en 10 plantas industriales antes (A) y después (D) de la implantación de un programa de seguridad industrial: \[Ho: \mu_1 \leq \mu_2 \hspace{.5cm}\text{(el programa de seguridad no es efectivo)}\] \[Ho: \mu_1 > \mu_2 \hspace{.5cm}\text{(el programa de seguridad es efectivo)}\]

a <- c(45,  73, 46, 124,    30, 57, 83, 34, 26, 17)
d <- c(36,  60, 44, 119,    35, 51, 77, 29, 24, 11)
t.test(a,d, paired = TRUE, alternative = "greater", conf.level = 0.95)
## 
##  Paired t-test
## 
## data:  a and d
## t = 3.2796, df = 9, p-value = 0.004767
## alternative hypothesis: true mean difference is greater than 0
## 95 percent confidence interval:
##  2.161215      Inf
## sample estimates:
## mean difference 
##             4.9

como el valor p es cercano a 0, rechazamos la hipótesis nula y concluímos la hipótesis alterna como verdadera. Se concluye que el programa de seguridad es efectivo.

Problema 9

$Ho: x $

$Ho: x no $

# cafe, amarillo, rojo, azul, naranja, verde
obs=c(70, 72, 61, 118, 108, 85) # de la muestra
esp=c(0.13, 0.14, 0.13, 0.24, 0.20, 0.16) # distribución teorica
chisq.test(x=obs,p=esp)
## 
##  Chi-squared test for given probabilities
## 
## data:  obs
## X-squared = 1.2468, df = 5, p-value = 0.9403

el valor p es mayor a 0.05. No se rechaza la hipótesis nula. No se puede concluír que los datos no siguen la distribución teórica. Se recomienda realizar otra muestra para determinarlo.

Problema 10

En una línea de producción los artículos se inspeccionan en forma periódica con el fin de detectar defectos. La siguiente secuencia de artículos defectuosos (D) y no defectuosos (N) corresponde a la producción de uno de los turnos. \[Ho: \text{la generación de artículos defectuosos sigue un patrón} \] \[Ha: \text{la generación de artículos defectuosos se debe al azar} \]

library(randtests)
x = sample(c("D", "N"), 50, replace = TRUE)
rachas <- as.numeric(x=="N")
runs.test(rachas, alternative = "left.sided", threshold = 0.5, pvalue= "exact", plot = F)
## 
##  Runs Test
## 
## data:  rachas
## statistic = 1.3481, runs = 29, n1 = 19, n2 = 31, n = 50, p-value =
## 0.9359
## alternative hypothesis: trend

el valor p es mayor a 0.05. se rechaza la hipótesis nula y se acepta la hipótesis alterna. Concluímos que la generación de artículos defectuosos se debe al azar.

Problema 11

\[Ho:X,Y \hspace{.5cm} \text{son variables independientes}\] \[Ho:X,Y \hspace{.5cm} \text{son variables dependientes}\]

x=c(470,445,257,191,171,139,42,28,17)
m=matrix(x, ncol = 3)
colnames(m) = c("alta", "moderada", "baja")
rownames(m) = c("dia", "tarde", "noche")
m
##       alta moderada baja
## dia    470      191   42
## tarde  445      171   28
## noche  257      139   17
chisq.test(m)
## 
##  Pearson's Chi-squared test
## 
## data:  m
## X-squared = 9.4939, df = 4, p-value = 0.04987

el valor p es casi igual a 0.05 entonces por el contexto tomamos p como muy pequeño. rechazamos la hipotesis y concluímos que son dependientes por lo que las fallas dependen de los turnos.

Problema 12

Los siguientes datos corresponde a las notas obtenidas por un grupo de estudiantes de la asignatura Matemáticas Fundamentales. Si la distribución de los datos es normal, podría afirmar que la prueba realizada es una prueba normalizada. En caso contrario serviría para estudiar problemas relacionados con su aprendizaje. Para un 𝛼=0,05, se podría afirmar que los datos proceden de una distribución normal? . Si se requiere realizar una prueba de hipótesis sobre la media de la nota 𝐻𝑜:𝜇≤3.3 vs 𝐻𝑎:𝜇>3.3, ¿Que prueba se realizaría?

x=c(3.4, 2.8, 4.2, 2.1, 2.8, 2.4, 3.5, 4.2, 3.1, 4.1, 2.4, 3.4, 4.1, 4.0, 2.4, 
    4.1, 3.4, 4.4, 3.8, 3.7, 2.2, 3.6, 2.3, 3.7, 2.8, 4.1, 2.3, 4.6, 4.6, 5.2, 
    2.4, 2.4, 2.7, 3.8, 4.6, 4.4, 4.2, 4.4, 2.4, 3.3, 3.8, 2.9, 3.1, 2.7, 3.6, 
    3.8, 4.4, 3.9, 2.8, 3.7)
qqnorm(x)
qqline(x)

mu_0 <- 3.3
sd = sd(x)
n <- length(x)

xbar <- mean(x)

valorz <- (xbar - mu_0)/(sd / sqrt(n))
valorz
## [1] 1.416021
valorp <- 1 - pnorm(valorz)
valorp
## [1] 0.0783847

Como el valor p es mayor a 0.05, no rechazamos la hipotesis nula y no hay suficiente evidencia para afirmar que la media sea mayor a 3.3.