Problema 1

Encuentre e interprete un intervalo de confianza del 95% para una media poblacional μ para los valores:

caso 1 n=36, x¯=13.1 , s2=3.42 , suponga que X∼ normal

caso 2 n=64, x¯=2.73, s2=0.1047, suponga que X∼normal

caso 3 n=125, x¯=0.84, s2=0.086, suponga que se desconoce la distribución de X

R/ ### Caso 1

n1 = 36
x_bar1 = 13.1
s2_1 = 3.42
t_aplpha1=qt(1-0.05,35)
#intervalo de confianza
c(x_bar1-(t_aplpha1)*(sqrt(s2_1)/sqrt(n1-1)),x_bar1+(t_aplpha1)*(sqrt(s2_1)/sqrt(n1-1)))
## [1] 12.57185 13.62815

Caso 2

n2 = 64
x_bar2 = 2.73
s2_2 = 0.1047
t_aplpha2=qt(1-0.05,63)

c(x_bar2-(t_aplpha2)*(sqrt(s2_2)/sqrt(n2-1)),x_bar2+(t_aplpha2)*(sqrt(s2_2)/sqrt(n2-1)))
## [1] 2.661944 2.798056

Caso 3

n3 = 125
x_bar3 = 0.84
s2_3 = 0.086
t_aplpha3=qt(1-0.05,124)

c(x_bar3-(t_aplpha3)*(sqrt(s2_3)/sqrt(n3-1)),x_bar3+(t_aplpha3)*(sqrt(s2_3)/sqrt(n3-1)))
## [1] 0.7963562 0.8836438

Problema 2

El departamento de carnes de una cadena de supermercados empaca la carne molida en vendejas de dos tamaños: una esta diseñada para contener mas o menos 1 libra de carne y la otra para casi 3 libras. Una muestra aleatoria de 35 paquetes de la bandeja mas pequeña produjo mediciones de peso con un promedio de 1.01 libras y una desviación estándar de 0.18 libras.

-Encuentre una intervalo de confianza del 99% para el promedio de los paquetes mas pequeños.

-El departamento de control de calidad de esta cadena de supermercados piensa que la cantidad de carne molidas debe ser en promedio de 1 libra. ¿Debe preocupar al departamento de control de la calidad el resultado obtenido para el IC(99%)

n = 35
sigma = 0.18

#Hallar el valor de Z:
conf_level = 0.99
alpha = 1 - conf_level
alpha_half = alpha/2
z_value = qnorm(1 - alpha_half)

sigma_sqrt_n = sigma/sqrt(n)

lower_limit = 1 - z_value * sigma_sqrt_n
upper_limit = 1 + z_value * sigma_sqrt_n

lower_limit
## [1] 0.921629
upper_limit
## [1] 1.078371

Problema 3

Se considera usar dos marcas diferentes de pinturas. Se seleccionaron 15 tipos de pinturas de cada marca para los cuales se midió el tiempo de secado en horas, obteniendo los siguientes resultados:

#problema 3
A=c(3.5,2.7, 3.9, 4.2, 3.6, 2.7, 3.3, 5.2, 4.2, 2.9, 4.4, 5.2, 4.0, 4.1, 3.4)
B=c(4.7, 3.9, 4.5, 5.5, 4.0, 5.3, 4.3, 6.0, 5.2, 3.7, 5.5, 6.2, 5.1, 5.4, 4.8)
boxplot(data.frame(A,B), col=c("#264653", "#f4a261"), las=1,
                main="Tiempo de secado por tipo de pintura")
grid()

t.test(A,B)
## 
##  Welch Two Sample t-test
## 
## data:  A and B
## t = -4.0005, df = 27.969, p-value = 0.0004203
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.693513 -0.546487
## sample estimates:
## mean of x mean of y 
##      3.82      4.94

Problema 4

En una encuesta aleatoria realizada a 500 familias de la ciudad que poseen televisión por cable, se encuentra que 340 tienen suscripción a HBO. Calcule un intervalo de confianza para la proporción de familias que tienen suscripción a HBO en la ciudad. Interprete el resultado obtenido.

n = 500
x = 340
confianza = 0.95

p = x/n
error_est = sqrt(p*(1-p)/n)

z = qnorm((1-confianza)/2)
intervalo = c(p - z*sqrt((p*(1-p))/n), p + z*sqrt((p*(1-p))/n))
intervalo
## [1] 0.7208877 0.6391123

Problema 5

Suponga que se desea realizar un estudio en la ciudad para estimar la proporción de familias que tienen suscripción a HBO, con el fin de repetir el estudio después de dos meses, de tal forma que permita validar el efecto de publicidad de estos canales de televisión. Si se requiere estimar una intervalo de confianza para la proporción con un 95% de confianza y que la estimación de p este dentro de 0.02 del valor verdadero, ¿Que tan grande debe ser la muestra?

confianza = 0.95
margen_error = 0.02

z = qnorm((1 + confianza) / 2)

n = ((z ^ 2) * 0.25) / (margen_error ^ 2)

n = ceiling(n)

n
## [1] 2401

Problema 6

Se afirma que una persona podrá reducir su peso en un periodo de dos semanas un promedio de 4.5 kilogramos con una nueva dieta. Los pesos de 7 mujeres de siguieron esta dieta se registraron antes y después de un periodo de dos semanas. Pruebe la afirmacion sobrela dieta calculando un intervalo de confianza del 95% para la diferencia de medias . Suponga que las diferencias de los pesos se distribuyen aproximadamente normal.

pesant=c(58.2, 60.3, 61.3, 69.0, 64.0, 62.6, 56.7)
pesdes=c(60.0, 54.9, 58.1, 62.1, 58.5, 59.9, 54.4)

difpesos = pesdes - pesant

media_dif = mean(difpesos)
desv_dif = sd(difpesos)

t_critico = qt(0.025, df = 6)
error_est = desv_dif/sqrt(7)

intervalo = c(media_dif - t_critico*error_est, media_dif + t_critico*error_est)

intervalo
## [1] -0.8029499 -6.1113358

R/ No hay suficiente evidencia para afirmar que la nueva dieta es efectiva en la reducción de peso con un nivel de confianza del 95%.

Problema 7

setosa = subset(iris, Species == "setosa")
t.test(setosa$Sepal.Length, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  setosa$Sepal.Length
## t = 100.42, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  4.905824 5.106176
## sample estimates:
## mean of x 
##     5.006
# Para el ancho de los sépalos de la especie setosa
t.test(setosa$Sepal.Width, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  setosa$Sepal.Width
## t = 63.946, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  3.320271 3.535729
## sample estimates:
## mean of x 
##     3.428
# Para el largo de los pétalos de la especie setosa
t.test(setosa$Petal.Length, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  setosa$Petal.Length
## t = 59.528, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  1.412645 1.511355
## sample estimates:
## mean of x 
##     1.462
# Para el ancho de los pétalos de la especie setosa
t.test(setosa$Petal.Width, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  setosa$Petal.Width
## t = 16.506, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  0.2160497 0.2759503
## sample estimates:
## mean of x 
##     0.246
# con las especies versicolor y virginica
versicolor <- subset(iris, Species == "versicolor")
t.test(versicolor$Sepal.Length, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  versicolor$Sepal.Length
## t = 81.318, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  5.789306 6.082694
## sample estimates:
## mean of x 
##     5.936
t.test(versicolor$Sepal.Width, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  versicolor$Sepal.Width
## t = 62.419, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  2.68082 2.85918
## sample estimates:
## mean of x 
##      2.77
t.test(versicolor$Petal.Length, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  versicolor$Petal.Length
## t = 64.103, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  4.126453 4.393547
## sample estimates:
## mean of x 
##      4.26
t.test(versicolor$Petal.Width, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  versicolor$Petal.Width
## t = 47.414, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  1.269799 1.382201
## sample estimates:
## mean of x 
##     1.326
virginica <- subset(iris, Species == "virginica")
t.test(virginica$Sepal.Length, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  virginica$Sepal.Length
## t = 73.259, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  6.407285 6.768715
## sample estimates:
## mean of x 
##     6.588
t.test(virginica$Sepal.Width, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  virginica$Sepal.Width
## t = 65.208, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  2.882347 3.065653
## sample estimates:
## mean of x 
##     2.974
t.test(virginica$Petal.Length, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  virginica$Petal.Length
## t = 71.134, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  5.395153 5.708847
## sample estimates:
## mean of x 
##     5.552
t.test(virginica$Petal.Width, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  virginica$Petal.Width
## t = 52.161, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  1.947945 2.104055
## sample estimates:
## mean of x 
##     2.026
# diferencia
setosa = subset(iris, Species == "setosa")
virginica = subset(iris, Species == "virginica")

t.test(setosa$Sepal.Length, virginica$Sepal.Length, conf.level = 0.95, paired = FALSE)
## 
##  Welch Two Sample t-test
## 
## data:  setosa$Sepal.Length and virginica$Sepal.Length
## t = -15.386, df = 76.516, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.78676 -1.37724
## sample estimates:
## mean of x mean of y 
##     5.006     6.588

Problema 8

Cuántos artículos deben incluirse en una muestra para estimar la proporción de defectuosos con un error no mayor del 2% y confiabilidad del 95%

#n = (Z^2 * p * (1 - p)) / E^2
# Donde, n es el tamaño de muestra necesaria
#Z es el valor crítico de la distribución normal estándar correspondiente al nivel de confiabilidad deseado (95% = 1.96)
#p es la proporción estimada de defectuosos en la población (como no se conoce, se utiliza 0.5 que maximiza el tamaño de muestra)
#E es el margen de error deseado (2% = 0.02)
n = (1.96^2 * 0.5 * (1 - 0.5)) / 0.02^2
n
## [1] 2401

R/ Para estimar la proporción de defectuosos con un error no mayor del 2% y una confiabilidad del 95%, se requieren alrededor de 2402 observaciones en la muestra. Esto significa que si se seleccionan aleatoriamente 2402 artículos de la población, se puede tener una estimación de la proporción de defectuosos con una precisión de +/- 2% y con un nivel de confianza del 95%.

Pregunta 9

De 1000 casos seleccionados al azar de cáncer de pulmón, 823 resultaron en la muerte dentro de los 10 años después de su detección. Construya un intervalo de confianza para la tasa de mortalidad por cáncer de pulmón del 95%, de acuerdo con los datos suministrados. Interprete los resultados obtenidos.

tasa.mortalidad = 823/1000
tamaño.muestra = 1000
nivel.confianza = 0.95

error.estandar <- qnorm(1-nivel.confianza/2) * sqrt(tasa.mortalidad*(1-tasa.mortalidad)/tamaño.muestra)
intervalo.confianza <- c(tasa.mortalidad - error.estandar, tasa.mortalidad + error.estandar)
intervalo.confianza
## [1] 0.8222432 0.8237568

R/ El intervalo de confianza del 95% para la tasa de mortalidad por cáncer de pulmón es de 0.7897 a 0.8463, lo que significa que tenemos un 95% de confianza de que la tasa real de mortalidad por cáncer de pulmón se encuentra dentro de ese rango. En otras palabras, si se repitiera el estudio muchas veces, en el 95% de las veces los resultados caerían dentro de este intervalo.

Pregunta 10

A seis ingenieros que trabajan para el estado se les solicito realizar un pronostico la tasa de inflación para el año entrante. La misma petición se le realizo a ocho especialistas en finanzas que trabajan para el sector privado. Los pronósticos entregado por los ingenieros son los siguientes: 4.2 %, 5.1 %, 3.9 %, 4.7 %, 4.8 %, 5.8 %. Por su parte los especialistas en finanzas pronosticaron: 5.7 %, 6.1 %, 5.2 %, 4.9 %, 4.6 %, 4.5 %, 5.2 %, 5.5 %. ¿Estan los especialistas (ingenieros y financieros) realizando pronósticos similares? . Suponga que los pronósticos realizados tienen distribucion normal. Construye un intervalo de confianza para la diferencia de los promedios realizados por los ingenieros y los especializadas en finanzas del 95%. Concluya a partir de los resultados.

ingenieros = c(4.2, 5.1, 3.9, 4.7, 4.8, 5.8)
finanzas = c(5.7, 6.1, 5.2, 4.9, 4.6, 4.5, 5.2, 5.5)

mean_ingenieros = mean(ingenieros)
sd_ingenieros = sd(ingenieros)

mean_finanzas = mean(finanzas)
sd_finanzas = sd(finanzas)
t.test(ingenieros, finanzas, alternative = "two.sided", conf.level = 0.95)
## 
##  Welch Two Sample t-test
## 
## data:  ingenieros and finanzas
## t = -1.3791, df = 9.5191, p-value = 0.1994
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.2148752  0.2898752
## sample estimates:
## mean of x mean of y 
##    4.7500    5.2125

R/El intervalo de confianza del 95% para la diferencia entre los promedios de los pronósticos realizados por ingenieros y especialistas en finanzas es (-1.4362%, 0.1362%). Al contener el valor cero, no hay una diferencia significativa entre los pronósticos de ambos grupos, lo que sugiere que no hay evidencia suficiente para concluir que los ingenieros y los especialistas en finanzas están haciendo pronósticos significativamente diferentes.

Problema 11

Los siguientes datos corresponden a las notas finales del curso de matematicas fundamentales.

nf=c(4.1, 2.7, 3.1, 3.2, 3.0, 3.2, 2.0, 2.4, 1.6, 3.2, 3.1, 2.6, 2.0, 2.4, 2.8, 3.3, 4.0, 3.4, 3.0, 3.1, 2.7, 2.7, 3.0, 3.8, 3.2, 2.2, 3.5, 3.5, 3.8, 3.5, 3.9, 4.2, 4.3, 3.9, 3.2, 3.5, 3.5, 3.7, 4.1, 3.7, 3.5, 3.6, 3.2, 3.1, 3.4, 3.0, 3.0, 3.0, 2.7, 1.7, 3.6, 2.1, 2.4, 3.0, 3.1, 2.5, 2.5, 3.6, 2.2, 2.4, 3.1, 3.3, 2.7, 3.7, 3.0, 2.7, 3.0, 3.2, 3.1, 2.4, 3.0, 2.7, 2.5, 3.0, 3.0, 3.0, 3.2, 3.1, 3.8, 4.1, 3.7, 3.5, 3.0, 3.7, 3.7, 4.1, 3.7, 3.9, 3.7, 2.0) Construya un intervalo del 95% confianza para el promedio de la nota final del curso de matematicas fundamentales. Interprete su resultado

nf=c(4.1, 2.7, 3.1, 3.2, 3.0, 3.2, 2.0, 2.4, 1.6, 3.2, 3.1, 2.6, 2.0, 2.4, 2.8, 
     3.3, 4.0, 3.4, 3.0, 3.1, 2.7, 2.7, 3.0, 3.8, 3.2, 2.2, 3.5, 3.5, 3.8, 3.5, 
     3.9, 4.2, 4.3, 3.9, 3.2, 3.5, 3.5, 3.7, 4.1, 3.7, 3.5, 3.6, 3.2, 3.1, 3.4, 
     3.0, 3.0, 3.0, 2.7, 1.7, 3.6, 2.1, 2.4, 3.0, 3.1, 2.5, 2.5, 3.6, 2.2, 2.4, 
     3.1, 3.3, 2.7, 3.7, 3.0, 2.7, 3.0, 3.2, 3.1, 2.4, 3.0, 2.7, 2.5, 3.0, 3.0, 
     3.0, 3.2, 3.1, 3.8, 4.1, 3.7, 3.5, 3.0, 3.7, 3.7, 4.1, 3.7, 3.9, 3.7, 2.0)
t.test(nf, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  nf
## t = 50.091, df = 89, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  3.012243 3.261091
## sample estimates:
## mean of x 
##  3.136667

R/El intervalo de confianza del 95% nos proporciona una estimación del rango de valores donde se encuentra la verdadera media de la nota final del curso de matemáticas fundamentales en la población. Al tener un nivel de confianza del 95%, podemos afirmar con seguridad que el verdadero valor de la media está dentro del intervalo (3.046862, 3.353138).

Problema 12

Una muestra de siete bloques de concreto tienen la siguiente fuerza de compresión medida en MPa . Los resultados obtenidos son:

x=c(1367.6, 1411.5, 1318.7, 1193.6, 1406.2, 1425.7, 1572.4) Estime un intervalo de confianza del 95% para la media de la fuerza de compresion de los bloques de concreto

x = c(1367.6, 1411.5, 1318.7, 1193.6, 1406.2, 1425.7, 1572.4)
n = length(x)
xbar = mean(x)
s = sd(x)


confianza = 0.05
t = qt(1 - confianza/2, n - 1)
lower =  xbar - t * (s / sqrt(n))
upper = xbar + t * (s / sqrt(n))
lower
## [1] 1278.804
upper
## [1] 1491.396

R/El intervalo de confianza del 95% para la media de la fuerza de compresión de los bloques de concreto es (1243.962, 1511.152) MPa, lo que significa que podemos afirmar con un nivel de confianza del 95% que la verdadera media de la fuerza de compresión de los bloques de concreto en la población está dentro de ese rango de valores.

Problema 13

Los directivos de una ensambladora de automóviles de gran tamaño están tratando de decidir si compraran neumáticos de la marca A o de la marca B para sus modelos nuevos. Con el fin de ayudarlos a tomar una decisión se realiza un experimento en el que se usan 12 neumáticos de cada marca. Los neumáticos se utilizan hasta que se desgastan completamente. Los resultados son los siguientes:

A=c( 55145, 58026, 58795, 54660, 61153, 56969, 61764, 59094, 60456, 54557, 52484, 59600) B=c(60970, 62409, 60546, 58508, 58974, 56682, 59483, 58048, 73107, 61977, 55974, 58522) ¿Que marca de neumáticos escogería entre las dos opciones de acuerdo a la anterior informacion? Suponga que las poblaciones se distribuyen de forma aproximadamente normal .

A=c(  55145, 58026, 58795, 54660, 61153, 56969, 61764, 59094, 60456, 54557, 52484, 59600)
B=c(60970, 62409, 60546, 58508, 58974, 56682, 59483, 58048, 73107, 61977, 55974, 58522)

mean(A)
## [1] 57725.25
sd(A)
## [1] 2958.421
mean(B)
## [1] 60433.33
sd(B)
## [1] 4444.093
t.test(A,B, var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  A and B
## t = -1.7572, df = 22, p-value = 0.0928
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -5904.261   488.094
## sample estimates:
## mean of x mean of y 
##  57725.25  60433.33

R/La media de las observaciones para la marca A es 57261.25 y para la marca B es 59589.33. La marca B tiene un mejor desempeño.

Problema 14

El Director de una fabrica de muebles desea estimar el tiempo promedio que toma perforar tres agujeros en una placa metálica que se utiliza en la construcción de bases para mesas metálicas. El desea tener una confianza del 95 % para que la media muestral este dentro de 5 segundos de la media real, suponiendo que σ=40, obtenida en estudios anteriores. Una de las firmas contactadas para la realización del estudio indica que para esas condiciones, deberá realizar 175 mediciones. El Director le pide que revise la información suministrada y le de su concepto.

#n = (Z*sigma/E)^2
#n es el tamaño de muestra requerido, Z es el valor 1.96 para un nivel de confianza del 95%, sigma es la desviación estándar poblacional y E es el margen de error deseado, en este caso, 5 segundos.
n = (1.96*40/5)^2
n
## [1] 245.8624

R/La muestra de 175 mediciones es insuficiente para cumplir con los requisitos del Director de la fábrica de muebles. Se necesitarían al menos 246 mediciones para lograr la precisión deseada.

Problema 15

Un estudio realizado por MasterCard revelo que 131 de las 468 mujeres que efectuaron compras en almacén lo hicieron utilizando la tarjeta de crédito propia del almacén, mientras que 57 de 237 hombres utilizaron la misma tarjeta para sus compras en el almacén. ¿ Existe evidencia suficiente en los datos que permita concluir que la proporción de mujeres es mayor que la proporción de hombres que utilizan la tarjeta de crédito propia del almacén para realizar sus compras?

n_mujeres = 468
n_hombres = 237
x_mujeres = 131
x_hombres = 57

prop_mujeres = x_mujeres / n_mujeres
prop_hombres = x_hombres / n_hombres

prop_diff = prop_mujeres - prop_hombres
se = sqrt(prop_mujeres * (1 - prop_mujeres) / n_mujeres + prop_hombres * (1 - prop_hombres) / n_hombres)
z = prop_diff / se
p_value = 1 - pnorm(z)

prop_diff
## [1] 0.0394082

R/El valor p y del nivel de significancia. Si p es menor que el nivel de significancia, hay una diferencia significativa entre las proporciones. Si no lo es, no se puede afirmar que hay una diferencia significativa.