Los jóvenes colombianos se han vuelto más consientes con respecto a la importancia de una buena nutrición acompañada de actividad deportiva para tener buena salud. Una asociación de médicos opina que quizás los jóvenes estén modificando sus dietas para para incluir menos carnes rojas y más frutas y verduras.
Para verificar esta teoría ,un grupo de estudiantes de la Javeriana Cali decide seleccionar registros nutricionales delos estudiantes (consignados en una encuesta realizada por VMU) de hace 10 años y comparar la cantidad promedio de carne de res consumida por año, con las cantidades consumidas por un número de jóvenes que serían entrevistados este año. De acuerdo con la información actual se estima que el consumo de carne de res por año varia entre 0 y 104 libras por año.
¿Cuántos jóvenes deben seleccionar los investigadores de cada grupo si desean estimar la diferencia en el consumo anual promedio per cápita de carne de res correcta dentro de 5 libras con un 99% de confianza?
Si además se desea estimar la proporción de jóvenes que son vegetarianos con un error de muestreo del 5%, ¿que tamaño debe tener la muestra?
Los investigadores del problema anterior seleccionaron dos grupos de 400 jóvenes cada uno y reunieron la siguiente información sobre los hábitos de consumo de carnes de res actuales y de hace 10 años :
media muestral 73 (Hace 10 años) 63 (Este año) desviación estandar muestral 25 (Hace 10 años) 28 (Este año)
A los investigadores les gustaría poder mostrar que el consumo de carne per cápita se redujo en los últimos 10 años, mediante la construcción de intervalos de confianza. ¿A que conclusión se puede lllegar a partir de la información suministrada?
Suponemos que \(\alpha = 0.05\)
\(H_o: \mu_1 \le \mu_2\)
\(H_a: \mu_1 > \mu_2\)
Welch Two Sample t-test
data: muestra1 and muestra2
t = 5.5716, df = 783.05, p-value = 1.736e-08
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
7.242208 Inf
sample estimates:
mean of x mean of y
73.41938 63.13846
Vemos que nuestro valor \(\alpha > p-value\), lo que quiere decir, por la segunda regla de de decisión, aceptamos \(H_a\) y decimos que el consumo de carne per cápita se redujo en los últimos 10 años.
Uno de los problemas más frecuentes en jóvenes universitarios es la alta tensión que generan las evaluaciones finales, las cuales en algunos casos genera dolores de cabeza. La tensión muscular en la región de la cabeza se ha asociado con los dolores de cabeza, es razonable pensar que si la tensión muscular disminuye, es probable que los dolores de cabeza se reduzcan o desaparezcan. Un grupo de investigadores diseña un experimento en el cual participan nueve estudiantes que padecen dolores de cabeza durante las semanas de evaluación. Posteriormente un grupo de profesionales de ingeniería Biomédica y Enfermería los entrenan con el fin de que puedan aprender a reducir la tensión muscular en la región frontal de la cabeza. Para este experimento el dispositivo mencionado se conecta al musculo frontal, que se encuentra en la región frontal de la cara. El dispositivo indica al estudiante la cantidad de tensión que existe en el musculo al que está unido (en este caso, al frontal) y le ayuda a reducir los niveles de tensión. Después de 6 semanas de entrenamiento, los jóvenes han logrado mantener una baja tensión en el musculo frontal; entonces se lleva nuevamente un registro de los dolores de cabeza que sufren durante las dos semanas de evaluaciones. La información recogida se presenta en la siguiente tabla :
Muestra experimental antes:
17 13 6 5 5 10 8 6 7
Muestra experimental después:
3 7 2 3 6 2 1 0 2
Dado que pueden existir problemas de interacción en el planteamiento anterior, debido a que los resultados muestran aparentemente una disminución de los dolores de cabeza, es posible que esta disminución no se deba al entrenamiento realizado con la utilización del dispositivo , sino a algún otro factor también presente en la situación, como por ejemplo el momento en que se realizan las mediciones ( primeros parciales, segundos parciales, finales), los investigadores incorporan un grupo que se denomina grupo control que permita dar cuenta de estas variaciones. Este grupo de jóvenes que tambien presentan dolores de cabeza fue medido durante los mismos momentos del primer grupo (grupo experimental) salvo que no fue entrenado con el dispositivo para controlar la tension. Durante el periodo intermedion este grupo solo hablo con los investigadores sobre los dolores de cabeza. El número de dolores de cabeza durante la linea base y el segundo periodo para el grupo control se presentan en la siguiente tabla:
Muestra control antes:
5 8 14 16 6 5 8 10 9
Muestra control después:
4 9 12 15 4 3 7 6 7
Se puede concluir que el tratamiento realizado con el dispositivo disminuye los dolores de cabeza?
Suponemos que \(\alpha = 0.05\)
\(H_o: \mu_{EA} = \mu_{ED}\)
\(H_a: \mu_{EA} \neq \mu_{ED}\)
Paired t-test
data: mea and med
t = 4.0931, df = 8, p-value = 0.003471
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
2.474149 8.859185
sample estimates:
mean difference
5.666667
Los resultados del primer experimento nos muestran un cambio en la media, es decir, se acepta la \(H_a\).
Welch Two Sample t-test
data: mea and mca
t = -0.23746, df = 15.934, p-value = 0.8153
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.413507 3.524618
sample estimates:
mean of x mean of y
8.555556 9.000000
Como \(p-value = 1\) aceptamos la \(H_0\), y concluimos que las muestras tienen la misma media.
F test to compare two variances
data: mea and mca
F = 1.1375, num df = 8, denom df = 8, p-value = 0.8599
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2565779 5.0427288
sample estimates:
ratio of variances
1.137476
Como \(p-value = 1\) aceptamos la \(H_0\), y concluimos que las muestras tienen la misma varianza.
\(H_o: \mu_{CA} = \mu_{CD}\)
\(H_a: \mu_{CA} \neq \mu_{CD}\)
Paired t-test
data: mca and mcd
t = 3.5, df = 8, p-value = 0.008079
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
0.5306648 2.5804463
sample estimates:
mean difference
1.555556
Los resultados del primer experimento nos muestran un cambio en la media, es decir, se acepta la \(H_a\).
Welch Two Sample t-test
data: med and mcd
t = -2.9902, df = 12.691, p-value = 0.01067
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-7.855000 -1.256111
sample estimates:
mean of x mean of y
2.888889 7.444444
Como \(\alpha > p-value\) aceptamos la \(H_a\), y concluimos que las muestras tienen medias diferentes.
F test to compare two variances
data: med and mcd
F = 0.32394, num df = 8, denom df = 8, p-value = 0.1315
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.07307121 1.43612644
sample estimates:
ratio of variances
0.3239437
Como \(p-value = 1\) aceptamos la \(H_0\), y concluimos que las muestras tienen la misma varianza.
Con lo anterior tenemos suficiente evidencia para afirmar que el dispositivo sí tiene un impacto en los dolores de cabeza y la reducción de la tensión de los estudiantes.
Los ingenieros de una ensambladora de automóviles requieren decidir sobre cuál de dos de las marcas de neumáticos deben comprar. La marca FB o la marca KT. Con el fin de tomar una decisión basada en evidencias estadísticas, deciden realizar un experimento en el que usan 12 neumáticos de cada marca. Los neumáticos se utilizan hasta su terminación. Los resultados obtenidos son los siguientes:
Cuál marca de neumáticos recomendaría comprar. Justifique su respuesta. Suponga que la distancia recorrida por un neumático se distribuye aproximadamente normal y un \(\alpha = 0.05\).
\(H_o: \mu_{FB} \ge \mu_{KT}\)
\(H_a: \mu_{FB} < \mu_{KT}\)
Welch Two Sample t-test
data: FB and KT
t = -2.6721, df = 18.506, p-value = 0.007649
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -1.736557
sample estimates:
mean of x mean of y
37.20833 42.14167
Como \(\alpha > p-value\) aceptamos la \(H_a\), y concluimos que los neumáticos KT tienen una media más grande que la de los FB.
\(H_o: \sigma_{FB}^2 \le \sigma_{KT}^2\)
\(H_a: \sigma_{FB}^2 > \sigma_{KT}^2\)
F test to compare two variances
data: FB and KT
F = 2.537, num df = 11, denom df = 11, p-value = 0.06893
alternative hypothesis: true ratio of variances is greater than 1
95 percent confidence interval:
0.9003047 Inf
sample estimates:
ratio of variances
2.536996
Como \(\alpha < p-value\) y \(p-value\) está tan cerca de \(1\) aceptamos la \(H_0\), y concluimos que los neumáticos FB tienen una varianza más grande que la de los KT.
Vemos entonces que los neumáticos KT además de tener una media de rendimientos mayor, su varianza tamién es menor, lo que nos indica que el rendimiento es mejor con con la marca FB.
Un director de un gimnasio quiere determinar si un instructor de ejercicio debe ser contratado o no para su campaña estrella “Reducción de peso”, Para tomar la decisión le dice que pruebe con 16 de las personas que habitualmente concurren tomadas al azar. Los datos que se tomaron antes (x1 ) y después (x2 ) de haber realizado un mes de ejercicios son los siguientes:
Muestra x1:
104 89 84 106 90 96 79 90 85 76 91 82 100 89 121
Muestra x2:
98 85 85 103 88 95 79 90 82 76 89 81 99 86 111 70
Emplee y realice las pruebas de hipótesis a un nivel de significancia del 0.01 para determinar si el programa que ofrece el nuevo instructor es eficaz. Suponga que la variable peso se distribuye aproximadamente normal.
Suponemos que \(\alpha = 0.01\)
\(H_o: \mu_{a} \le \mu_{d}\)
\(H_a: \mu_{a} > \mu_{d}\)
Welch Two Sample t-test
data: x1 and x2
t = 0.88801, df = 28.196, p-value = 0.191
alternative hypothesis: true difference in means is greater than 0
99 percent confidence interval:
-6.345818 Inf
sample estimates:
mean of x mean of y
92.13333 88.56250
Región de rechazo:
-Inf -1.243323
Región de rechazo:
1.243323 Inf
No hay suficiente evidencia para rechazar \(H_o\), pero vemos que \(p-value\) no es mayor al 25%, por lo que podríamos aceptar la \(H_a\), y concluir que el entrenamiento ha sido parcialmente efectivo.
\(H_o: \sigma_{a}^2 \le \sigma_{d}^2\)
\(H_a: \sigma_{a}^2 > \sigma_{d}^2\)
F test to compare two variances
data: x1 and x2
F = 1.2282, num df = 14, denom df = 15, p-value = 0.348
alternative hypothesis: true ratio of variances is greater than 1
99 percent confidence interval:
0.344616 Inf
sample estimates:
ratio of variances
1.228192
El entrenador podría empezar en el programa siempre y cuando no esté él sol, pues podría tener mejores resultados con apoyo de otro entrenador.