Ejercicio 9.91
Se afirma que un individuo podrá reducir, en un lapso de 2 semanas, un promedio de 4.5 kilogramos de peso con una nueva dieta. Los pesos de 7 mujeres que siguieron esta dieta se registraron antes y después de un periodo de 2 semanas.
alfa <- (1 - 0.95) / 2
a1 <- c(58.5,60.3,61.7,69,64,62.6,56.7)
a2 <- c(-60,-54.9,-58.1,-62.1,-58.5,-59.9,-54.4)
ai <- a1 + a2
a = (1/7) * sum(ai)
n <- 7
sd <- (1/(n-1))* sum((ai - a)^2)
sd <- sqrt(sd)
talfa <- 2.44
linf <- a - talfa*(sd /sqrt(n))
lsup <- a + talfa * (sd/sqrt(n))
cat("El intervalo es dado por:", linf ," < ud < ",lsup)## El intervalo es dado por: 0.9970208 < ud < 6.117265
Ejercicio 9.92
En Virginia Tech se realizó un estudio para determinar si se puede utilizar el fuego como una herramienta de control viable para aumentar la cantidad de forraje disponible para los venados durante los meses críticos a fi nales del invierno y principios de la primavera primavera.
El calcio es un elemento necesario para las plantas y los animales. La cantidad que la planta toma y almacena está estrechamente correlacionada con la cantidad presente en el suelo. Se formuló la hipótesis de que el fuego podría cambiar los niveles de calcio presentes en el suelo y, por lo tanto, infl uir en la cantidad disponible para los venados. Se seleccionó una extensión grande de tierra en el bosque Fishburn para provocar un incendio controlado. Justo antes de la quema se tomaron muestras de suelo de 12 parcelas con la misma área y se analizaron para verifi car su contenido de calcio. Después del incendio se volvieron a analizar los niveles de calcio en las mismas parcelas. Los valores obtenidos, en kilogramos por parcela, se presentan en la siguiente tabla:
Construya un intervalo de confianza del 95% para la diferencia media en los niveles de calcio presentes en el suelo antes y después del incendio controlado. Suponga que la distribución de las diferencias en los niveles de calcio es aproximadamente normal.
a<- c(50, 50, 82, 64, 82, 73, 77, 54, 23, 45, 36, 54)
d<- c(9, 18, 45, 18, 18, 9, 32, 9, 18, 9, 9, 9)
diferencia <- a - d
media <- mean(diferencia)
ds <- sd(diferencia)
e_estandar <- ds / sqrt(length(diferencia))
intervalo_confi <- t.test(diferencia)$conf.int
cat("Diferencias: ", diferencia)## Diferencias: 41 32 37 46 64 64 45 45 5 36 27 45
## Media de diferencias: 40.58333
## Intervalo de confianza del 95%: 30.5502 < ud < 50.61646
Ejercicio 9.93
El dueño de un gimnasio afirma que una persona podrá reducir, en un periodo de 5 días, un promedio de 2 centímetros en su talla de cintura con un nuevo programa de ejercicios. En la siguiente tabla se presentan las tallas de cintura de 6 hombres que participaron en este programa de ejercicios antes y después del periodo de 5 días:
Mediante el cálculo de un intervalo de confianza del 95% para la reducción media en la talla de cintura determine si la afirmación del dueño del gimnasio es válida. Suponga que la distribución de las diferencias en las tallas de cintura antes y después del programa es aproximadamente normal.
a <- c(90.4, 95.5, 98.7, 115.9, 104.0, 85.6)
d <- c(91.7, 93.9, 97.4, 112.8, 101.3, 84.0)
diferencia <- a - d
media_difer <- mean(diferencia)
desviacion_estandar_difer <- sd(diferencia)
e_estandar <- desviacion_estandar_difer / sqrt(length(diferencia))
intervalo_confi <- t.test(diferencia)$conf.int
cat("Diferencias: ", diferencia)## Diferencias: -1.3 1.6 1.3 3.1 2.7 1.6
## Media de diferencias: 1.5
cat("Intervalo de confianza del 95%: ", round(intervalo_confi[1],2),"< ud < ",round(intervalo_confi[2],2))## Intervalo de confianza del 95%: -0.12 < ud < 3.12
Ejercicio 9.96
Un antropólogo está interesado en determinar la proporción de individuos de dos tribus indias que tienen doble remolino de cabello en la zona occipital. Suponga que toma muestras independientes de cada una de las dos tribus y encuentra que 24 de 100 individuos de la tribu A y 36 de 120 individuos de la tribu B poseen tal característica. Construya un intervalo de confianza del 95% para la diferencia pB – pA entre las proporciones de estas dos tribus con remolinos de cabello en la zona occipital.
propor_A <- 24 / 100
propor_B <- 36 / 120
n_A <- 100
n_B <- 120
nivel_confi <- 0.95
diferencia_propor <- propor_B - propor_A
e_estandar <- sqrt((propor_A * (1 - propor_A) / n_A) + (propor_B * (1 - propor_B) / n_B))
intervalo_confi <- c(diferencia_propor - qnorm(1 - (1 - nivel_confi) / 2) * e_estandar,
diferencia_propor + qnorm(1 - (1 - nivel_confi) / 2) * e_estandar)
cat("Intervalo de confianza del 95%: ", round(intervalo_confi[1],4),"< ud < ",round(intervalo_confi[2],4))## Intervalo de confianza del 95%: -0.0572 < ud < 0.1772
Ejercicio 9.97
Un fabricante de planchas eléctricas produce estos artículos en dos plantas en las que las partes pequeñas son surtidas por el mismo proveedor. El fabricante puede ahorrar algo si le compra a un proveedor local los termostatos para la planta B. Para probar si estos nuevos termostatos son tan precisos como los anteriores le compra sólo un lote al proveedor local y los prueba en planchas a 550°F. Al fi nal lee con un termopar las temperaturas reales y las redondea al siguiente 0.1°F más cercano. Los datos son los siguientes:
Calcule un intervalo de confianza de 95% para σ 1 2 /σ 2 2 y para σ1/σ2, donde σ1 2 y σ2 2 son las varianzas de la población de las lecturas de los termostatos del proveedor nuevo y del anterior, respectivamente.
proveedor_n <- c(530.3, 559.3, 549.4, 544.0, 551.7, 566.3, 549.9, 556.9, 536.7, 558.8, 538.8, 543.3, 559.1, 555.0, 538.6, 551.1, 565.4, 554.9, 550.0, 554.9, 554.7, 536.1, 569.1)
proveedor_a <- c(559.7, 534.7, 554.8, 545.0, 544.6, 538.0, 550.7, 563.1, 551.1, 553.8, 538.8, 564.6, 554.5, 553.0, 538.4, 548.3, 552.9, 535.1, 555.0, 544.8, 558.4, 548.7, 560.3)
varianza_n <- var(proveedor_n)
varianza_an <- var(proveedor_a)
intervalo_confi_var_nuevo <- sqrt((length(proveedor_n) - 1) * varianza_n / qchisq(c(0.975, 0.025), df = length(proveedor_n) - 1))
intervalo_confi_var_a <- sqrt((length(proveedor_a) - 1) * varianza_an / qchisq(c(0.975, 0.025), df = length(proveedor_a) - 1))
razon_varianzas <- varianza_n / varianza_an
intervalo_confi_razon_varianzas <- sqrt(qchisq(0.975, df = length(proveedor_n) - 1) / qchisq(0.025, df = length(proveedor_a) - 1)) * c(razon_varianzas / qchisq(0.975, df = length(proveedor_a) - 1), razon_varianzas / qchisq(0.025, df = length(proveedor_n) - 1))
cat("Intervalo de confianza del 95% para la varianza del proveedor nuevo: ", round(intervalo_confi_var_nuevo[1], 2), " < ud < ", round(intervalo_confi_var_nuevo[2], 2), "\n")## Intervalo de confianza del 95% para la varianza del proveedor nuevo: 7.96 < ud < 14.57
cat("Intervalo de confianza del 95% para la varianza del proveedor anterior: ", round(intervalo_confi_var_a[1], 2), " < ud < ", round(intervalo_confi_var_a[2], 2))## Intervalo de confianza del 95% para la varianza del proveedor anterior: 6.8 < ud < 12.45
cat("Intervalo de confianza del 95% para la razón de varianzas: ", round(intervalo_confi_razon_varianzas[1], 2), " < ud < ", round(intervalo_confi_razon_varianzas[2], 2), "\n")## Intervalo de confianza del 95% para la razón de varianzas: 0.07 < ud < 0.23
Ejercicio 9.103
Se realizó una encuesta con el fi n de comparar los sueldos de administradores de plantas químicas empleados en dos áreas del país: el norte y el centro-occidente. Se eligió una muestra aleatoria independiente de 300 gerentes de planta para cada una de las dos áreas. A tales gerentes se les preguntó el monto de su sueldo anual. Los resultados fueron los siguientes:
Z <- qnorm(0.995)
a1 <- 102300
b1 <- 5700
c1 <- 300
a2 <- 98500
b2 <- 3800
c2 <- 300
intervalo_confi <- (a1 - a2) + c(-1, 1) * Z * sqrt(b1^2/c1 + b2^2/c2)
print(intervalo_confi)## [1] 2781.217 4818.783
Para emplear la fórmula del intervalo de confianza mencionada anteriormente, se realiza una inferencia acerca de la distribución de los salarios anuales en ambas regiones. La formulación se obtiene al asumir que las muestras son lo bastante amplias para aplicar el Teorema del Límite Central, siendo esta suposición más sólida cuando los tamaños de muestra son considerables. En esta situación específica, se especifica que se han seleccionado de forma aleatoria e independiente muestras de 300 gerentes de planta para cada una de las áreas.
c)¿Qué supuso acerca de las dos varianzas? ¿Es razonable la suposición de igualdad de varianzas? ¡Explique
Son considerablemente distintas, y no resulta lógico presuponer que sean idénticas. Por esta razón, es crucial corroborar esta suposición, ya que si las variabilidades difieren significativamente y se asume igualdad, podrían derivarse intervalos de confianza o pruebas de hipótesis erróneas.
Ejercicio 9.105
Un sindicato se preocupa por el notorio ausentismo de sus miembros. Los líderes del sindicato siempre habían afirmado que, en un mes típico, el 95% de sus afiliados estaban ausentes menos de 10 horas al mes. El sindicato decide verifi car esto revisando una muestra aleatoria de 300 de sus miembros. Se registra el número de horas de ausencia para cada uno de los 300 miembros. Los resultados son ¯x = 6.5 horas y s = 2.5 horas. Utilice los datos para responder esa afirmación utilizando un límite de tolerancia unilateral y eligiendo un nivel de confianza del 99%. Asegúrese de aplicar lo que ya sabe acerca del cálculo del límite de tolerancia.
media_muestra <- 6.5
desviacion_estandar <- 2.5
tamaño_muestra <- 300
nivel_confianza <- 0.99
Z <- qnorm(1 - (1 - nivel_confianza))
limite_tol <- media_muestra + Z * (desviacion_estandar / sqrt(tamaño_muestra))
print(paste("Límite de tolerancia (99%):", limite_tol))## [1] "Límite de tolerancia (99%): 6.83577939282655"
Ejercicio 106
Se seleccionó una muestra aleatoria de 30 empresas que comercializan productos inalámbricos para determinar la proporción de tales empresas que implementaron software nuevo para aumentar la productividad. Resultó que 8 de las 30 empresas habían implementado tal software. Calcule un intervalo de confianza del 95% en p, la proporción verdadera de ese tipo de empresas que implementaron el nuevo software.
proporcion_muestra <- 8/30
tamaño_muestra <- 30
nivel_confianza <- 0.95
Z <- qnorm((1 + nivel_confianza) / 2)
limite_inferior <- proporcion_muestra - Z * sqrt((proporcion_muestra * (1 - proporcion_muestra)) / tamaño_muestra)
limite_superior <- proporcion_muestra + Z * sqrt((proporcion_muestra * (1 - proporcion_muestra)) / tamaño_muestra)
print(paste("Intervalo de confianza del 95% para p:", c(limite_inferior, limite_superior)))## [1] "Intervalo de confianza del 95% para p: 0.108424382618373"
## [2] "Intervalo de confianza del 95% para p: 0.424908950714961"
Ejercicio 9.110
Un grupo de consumidores está interesado en comparar los costos de operación de dos diferentes tipos de motor para automóvil. El grupo encuentra 15 propietarios cuyos automóviles tienen motor tipo A y 15 que tienen motor tipo B. Los 30 propietarios compraron sus automóviles más o menos al mismo tiempo y todos llevaron buenos registros en cierto periodo de 12 meses. Los consumidores encontraron, además, que los propietarios recorrieron aproximadamente el mismo número de millas. Los estadísticos de costo son yA = $87.00/1000 millas, yB = $75.00/1000 millas, sA = $5.99 y sB = $4.85. Calcule un intervalo de confianza del 95% para estimar μA –μB, la diferencia en el costo medio de operación. Suponga normalidad y varianzas iguales.
media_a <- 87.00
desviacion_a <- 5.99
tamaño_muestra_a <- 15
media_b <- 75.00
desviacion_b <- 4.85
tamaño_muestra_b <- 15
nivel_confianza <- 0.95
varianza_combinada <- ((tamaño_muestra_a - 1) * desviacion_a^2 + (tamaño_muestra_b - 1) * desviacion_b^2) / (tamaño_muestra_a + tamaño_muestra_b - 2)
grados_libertad <- tamaño_muestra_a + tamaño_muestra_b - 2
t_valor <- qt((1 + nivel_confianza) / 2, df = grados_libertad)
intervalo_confianza <- (media_a - media_b) + c(-1, 1) * t_valor * sqrt(varianza_combinada * (1 / tamaño_muestra_a + 1 / tamaño_muestra_b))
print(paste("Intervalo de confianza del 95% para μA - μB:", intervalo_confianza))## [1] "Intervalo de confianza del 95% para μA - μB: 7.92363204515703"
## [2] "Intervalo de confianza del 95% para μA - μB: 16.076367954843"