Problema 1

Un taller de autos considera comprar una de dos marcas diferentes de pinturas. Con el fin de determinar cúal de las marcas comprar se seleccionaron 15 tipos de pinturas de cada marca para los cuales se midió el tiempo de secado en horas, obteniendo los siguientes resultado:

A = c (3.5,2.7, 3.9, 4.2, 3.6, 2.7, 3.3, 5.2, 4.2, 2.9, 4.4, 5.2, 4.0, 4.1, 3.4) B = c (4.7, 3.9, 4.5, 5.5, 4.0, 5.3, 4.3, 6.0, 5.2, 3.7, 5.5, 6.2, 5.1, 5.4, 4.8) boxplot ( data.frame (A,B), col= c (“#264653”, “#f4a261”), las=1, main=“Tiempo de secado por tipo de pintura”) grid()

Suponga que el tiempo de secado se distribuye normal . Calcule un intervalo de confianza para la diferencia de medias e interprete su resultado. ¿Cúal marca recomendaría comprar?, justifique su respuesta.

# Datos de las muestras
A <- c(3.5, 2.7, 3.9, 4.2, 3.6, 2.7, 3.3, 5.2, 4.2, 2.9, 4.4, 5.2, 4.0, 4.1, 3.4)
B <- c(4.7, 3.9, 4.5, 5.5, 4.0, 5.3, 4.3, 6.0, 5.2, 3.7, 5.5, 6.2, 5.1, 5.4, 4.8)

# Cálculo de medias
mean_A <- mean(A)
mean_B <- mean(B)

# Cálculo de varianzas
var_A <- var(A)
var_B <- var(B)

# Tamaños de las muestras
n1 <- length(A)
n2 <- length(B)

# Valor crítico z para un 95% de confianza
z <- qnorm(0.975)  # 0.975 porque es el percentil para un lado (dos colas suman 0.95)

# Calculo del intervalo de confianza
se <- sqrt(var_A/n1 + var_B/n2)  # Error estándar combinado
margin_of_error <- z * se

# Intervalo de confianza para la diferencia de medias
lower_bound <- (mean_A - mean_B) - margin_of_error
upper_bound <- (mean_A - mean_B) + margin_of_error
confidence_interval <- c(lower_bound, upper_bound)

# Resultados
print(paste("Media de A:", mean_A))
## [1] "Media de A: 3.82"
print(paste("Media de B:", mean_B))
## [1] "Media de B: 4.94"
print(paste("Intervalo de confianza de la diferencia de medias:", confidence_interval))
## [1] "Intervalo de confianza de la diferencia de medias: -1.66872324617991" 
## [2] "Intervalo de confianza de la diferencia de medias: -0.571276753820093"
# Opcional: Crear un boxplot
boxplot(A, B, col = c("#264653", "#f4a261"), names = c("A", "B"), las = 1, main = "Tiempo de secado por tipo de pintura")
grid()

la marca B, en promedio, toma entre 0.57 y 1.67 horas más en secarse que la marca A. Basándonos en estos resultados, si el objetivo es minimizar el tiempo de secado, recomendaría comprar la marca A, ya que, en promedio, se seca más rápidamente que la marca B.

Problema 2

Un artículo publicado en un diario de la ciudad afirma que una persona reduce su peso en un periodo de dos semanas un 4.5 kilogramos en oromedio con una nueva dieta, sin realizar ejercicios físicos. Con el fin de validar lo informado en el artículo un grupo de estudiantes decide realizar la dieta para lo cual registra sus pesos antes y después de dos semanas. La información recogida por 7 estudiantes es la siguiente:

peso.ant= c (58.2, 60.3, 61.3, 69.0, 64.0, 62.6, 56.7) peso.des= c (60.0, 54.9, 58.1, 62.1, 58.5, 59.9, 54.4)

Suponga que los pesos de una persona se distribuye normal. De acuerdo a la información recogida por los estudiantes se puede afirmar que lo indicado por el artículo publicado en el diario es cierto?, justufique su respuesta.

# Datos de los pesos antes y después de la dieta
peso.ant <- c(58.2, 60.3, 61.3, 69.0, 64.0, 62.6, 56.7)
peso.des <- c(60.0, 54.9, 58.1, 62.1, 58.5, 59.9, 54.4)

# Diferencia de los pesos (se asume que la pérdida de peso es positiva, por lo tanto peso.ant - peso.des)
diferencias <- peso.ant - peso.des

# Realizar una prueba t para muestras emparejadas
# La hipótesis nula es que la media de las diferencias es igual a 4.5
# La hipótesis alternativa es que la media de las diferencias es diferente de 4.5
t.test(diferencias, mu = 4.5, alternative = "two.sided", conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  diferencias
## t = -0.96141, df = 6, p-value = 0.3735
## alternative hypothesis: true mean is not equal to 4.5
## 95 percent confidence interval:
##  0.8029499 6.1113358
## sample estimates:
## mean of x 
##  3.457143

Justifucación: Si el valor p es menor que 0.05, rechazamos la hipótesis nula y concluimos que la pérdida de peso media de los estudiantes es significativamente diferente de los 4.5 kg afirmados en el artículo. En este caso, los datos muestran que la pérdida de peso promedio es menor a la reportada, lo que sugiere que la afirmación del artículo podría no ser aplicable a este grupo de estudiantes. En resumen, el análisis indica que, según los datos de los estudiantes, la pérdida de peso promedio no coincide con la afirmada en el artículo.

Problema 3

A seis ingenieros que trabajan para el estado se les solicito realizar un pronostico la tasa de inflación para el año entrante. La misma petición se le realizo a ocho especialistas en finanzas que trabajan para el sector privado. Los pronósticos entregado por los ingenieros son los siguientes: 4.2 %, 5.1 %, 3.9 %, 4.7 %, 4.8 %, 5.8 %. Por su parte los especialistas en finanzas pronosticaron: 5.7 %, 6.1 %, 5.2 %, 4.9 %, 4.6 %, 4.5 %, 5.2 %, 5.5 %. ¿Estan los especialistas (ingenieros y financieros) realizando pronósticos similares? . Suponga que los pronósticos realizados tienen distribucion normal. Construye un intervalo de confianza para la diferencia de los promedios realizados por los ingenieros y los especializadas en finanzas del 95%. Concluya a partir de los resultados

ing = c (4.2, 5.1, 3.9, 4.7, 4.8, 5.8) fin = c (5.7, 6.1, 5.2, 4.9, 4.6, 4.5, 5.2, 5.5)

# Pronósticos de ingenieros y especialistas en finanzas
ing <- c(4.2, 5.1, 3.9, 4.7, 4.8, 5.8)
fin <- c(5.7, 6.1, 5.2, 4.9, 4.6, 4.5, 5.2, 5.5)

# Realiza una prueba t para muestras independientes
# Calcula el intervalo de confianza del 95% para la diferencia de medias
t.test(ing, fin, var.equal = TRUE, conf.level = 0.95)
## 
##  Two Sample t-test
## 
## data:  ing and fin
## t = -1.4234, df = 12, p-value = 0.1801
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.1704541  0.2454541
## sample estimates:
## mean of x mean of y 
##    4.7500    5.2125

Problema 4

Los directivos de una ensambladora de automóviles de gran tamaño están tratando de decidir si compraran neumáticos de la marca A o de la marca B para sus modelos nuevos. Con el fin de ayudarlos a tomar una decisión se realiza un experimento en el que se usan 12 neumáticos de cada marca. Los neumáticos se utilizan hasta que se desgastan completamente. Los resultados son los siguientes:

A= c ( 55145, 58026, 58795, 54660, 61153, 56969, 61764, 59094, 60456, 54557, 52484, 59600) B= c (60970, 62409, 60546, 58508, 58974, 56682, 59483, 58048, 73107, 61977, 55974, 58522) ¿Que marca de neumáticos escogería entre las dos opciones de acuerdo a la anterior informacion? Suponga que las poblaciones se distribuyen de forma aproximadamente normal.

# Datos de vida útil de neumáticos
A <- c(55145, 58026, 58795, 54660, 61153, 56969, 61764, 59094, 60456, 54557, 52484, 59600)
B <- c(60970, 62409, 60546, 58508, 58974, 56682, 59483, 58048, 73107, 61977, 55974, 58522)

# Calcula las medias y desviaciones estándar
mean_A <- mean(A)
sd_A <- sd(A)
mean_B <- mean(B)
sd_B <- sd(B)

# Realiza una prueba t para muestras independientes
t_test_result <- t.test(A, B, var.equal = FALSE) # Asumiendo varianzas no iguales por precaución

# Mostrar resultados
cat("Media de A:", mean_A, "SD de A:", sd_A, "\n")
## Media de A: 57725.25 SD de A: 2958.421
cat("Media de B:", mean_B, "SD de B:", sd_B, "\n")
## Media de B: 60433.33 SD de B: 4444.093
cat("Resultado de la prueba t:\n")
## Resultado de la prueba t:
print(t_test_result)
## 
##  Welch Two Sample t-test
## 
## data:  A and B
## t = -1.7572, df = 19.149, p-value = 0.09487
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -5932.0772   515.9105
## sample estimates:
## mean of x mean of y 
##  57725.25  60433.33

Problema 5

Un estudio realizado por MasterCard revelo que 131 de las 468 mujeres que efectuaron compras en almacén lo hicieron utilizando la tarjeta de crédito propia del almacén, mientras que 57 de 237 hombres utilizaron la misma tarjeta para sus compras en el almacén. ¿ Existe evidencia suficiente en los datos que permita concluir que la proporción de mujeres es mayor que la proporción de hombres que utilizan la tarjeta de crédito propia del almacén para realizar sus compras?

# Número de mujeres y hombres que usaron la tarjeta de crédito del almacén
exitos_mujeres <- 131
total_mujeres <- 468
exitos_hombres <- 57
total_hombres <- 237

# Realizar la prueba de proporciones
prop.test(x = c(exitos_mujeres, exitos_hombres), 
          n = c(total_mujeres, total_hombres), 
          alternative = "greater", # Indica que la hipótesis alternativa es que p1 > p2
          correct = FALSE) # No se aplica la corrección de continuidad
## 
##  2-sample test for equality of proportions without continuity correction
## 
## data:  c(exitos_mujeres, exitos_hombres) out of c(total_mujeres, total_hombres)
## X-squared = 1.2494, df = 1, p-value = 0.1318
## alternative hypothesis: greater
## 95 percent confidence interval:
##  -0.01760488  1.00000000
## sample estimates:
##    prop 1    prop 2 
## 0.2799145 0.2405063

Problema 6

El gerente de un restaurante deseas determinar el tamaño de muestra necesario para estimar la proporción de clientes satisfechos con un nivel de confianza del 95% y un error máximo permitido del 5%. Para ello, ha realizado una prueba piloto de un nuevo menú para medir la satisfacción de los clientes. En la prueba piloto, encuestaste a 100 clientes y descubriste que el 75 de ellos estaban satisfechos con la comida. ¿Qué tamaño de muestra deberá tener el estudio.

# Parámetros
Z <- 1.96  # Valor Z para un nivel de confianza del 95%
p <- 0.75  # Proporción estimada de clientes satisfechos
E <- 0.05  # Error máximo permitido

# Fórmula para calcular el tamaño de muestra
n <- (Z^2 * p * (1 - p)) / E^2

n
## [1] 288.12