Taller 2
Estadística Inferencial
Fecha de entrega: viernes 19 de abril, 2024
Intervalos de confianza y pruebas de hipótesis

Autor

Roberto Trespalacios

Observaciones

  • El taller puede hacerse en grupo de tres estudiantes.
  • Se debe subir a SAVIO un archivo pdf con la solución de los problemas a mano y un archivo html con la solución en R.
  • Solo un estudiante debe subir el taller y en el encabezado de cada archivo deben estar los nombres y apellidos de los integrantes del grupo.
  • El archivo debe tener el nombre siguiente:

Nombre_Apellido_estudiante1_Nombre_Apellido_Estudiante2_Nombre_Apellido_Estudiante3_taller_2_codigo_curso.pdf

Nombre_Apellido_estudiante1_Nombre_Apellido_Estudiante2_Nombre_Apellido_Estudiante3_taller_2_codigo_curso.html

Intervalos de confianza

  1. De una población normalmente distribuida, se selecciona una muestra aleatoria simple de tamaño 25, encontrando que el promedio y la desviación estandar de la muestra son: 108 y 10, respectivamente.
  1. ¿Cuál es el margen de error para un intervalo al nivel de confianza del 98%?
  2. Encuentre los límites superior e inferior para construir un intervalo de confianza para el inciso a.
  3. ¿Cuál es el intervalo de confianza de acuerdo a los incisos a. y b.
  4. Construya un intervalo de confianza al 95% para la media. Interprete.
  5. Construya un intervalo de confianza al 90% para la media.
  6. Compare sus resultados en c., d. y e. ¿Qué sucede con el margen de error cuando se disminuye el nivel de confianza?
  1. Las puntuaciones en un test que mide la variable creatividad en la población general e un centro escolar que ha implantado un programa de estimulación de adolescentes, sigue una distribución normal. Se toma una muestra de 20 alumnos que proporsionan las siguientes puntuaciones:

11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23

A un nivel de confianza del 95%, calcule un intervalo de confianza para la puntuación media del test. Interprete el resultado. Interprete.

  1. Se estima que el tiempo de reacción a un estímulo de cierto dispositivo electrónico está distribuido normalmente con desviación estándar de 0.05 segundos. ¿Cuál es el número de mediciones temporales que deberá hacerse para que la confianza de que el error de la estimación de la esperanza no exceda de 0.01 sea del 95%?. Interprete.

  2. En una muestra de 9 preparados de jugo de tomate se ha obtenido una media de 22 mg/100 cc y una cuasidesviación típica de 6.3 mg/100 cc. Supuesto que el contenido de vitamina C del jugo de tomate se distribuye normalmente. Se pide:

  1. Estimar el contenido medio, en vitamina C, del jugo de tomate
  2. Calcular un intervalo de confianza al 95% para dicha cantidad.
  3. Interprete el intervalo del inciso b.
  1. La puntuación media de una muestra de 20 jueces de gimnasia rítmica, elegidos al azar, para una misma prueba, presentó una desviación típica muestral de 0.0965. Calcular un intervalo de confianza con un 98% para la varianza. Suponga que la variable que mide la puntuación sigue una distribución normal.

  2. Se espera que un procedimiento estandarizado produzca arandelas con muy pequeña desviación en su espesor. Suponga que se eligen al azar 10 de tales arandelas y se mide su espesor obteniéndose en pulgadas: 0.123, 0.124, 0.126, 0.120, 0.130, 0.133, 0.125, 0.128, 0.124, 0.126. Interesa calcular un intervalo del 90% de confianza para el desvío del grosor de las arandelas producidas por este procedimiento.

  3. Se quieren comparar los efectos \(X\) de un nuevo medicamento con \(Y\) , los de otro ya comercializado. Se administran ambos a 14 personas con insuficiencia respiratoria, asignando aleatoriamente a cada paciente un tratamiento, y manteniéndolo durante un mes. Luego se le da el tratamiento alternativo durante otro mes. En la cuarta semana de cada tratamiento se observa la FEV1 (forced expiratory volume), el volumen de aire que un paciente expulsa en un segundo, tras una inhalación profunda.

Paciente X Y D Paciente X Y D
1 2.9 3.9 -1 8 3.9 2.4 1.5
2 4 3.9 0.1 9 2.5 3.6 -1.1
3 3.4 3.3 0.1 10 6.5 2.1 4.4
4 3.2 4.3 -1.1 11 5.5 4 1.5
5 3.8 3.2 0.6 12 4 3.9 0.1
6 5.2 3.5 1.7 13 5.3 4 1.3
7 3.9 2.7 1.2 14 4.3 2.3 2
  1. Calcule un intervalo de confianza para la diferencia de medias de la fuerza respiratoria de los pacientes antes y despues de la administración del medicamento.
  2. ¿Qué se concluye apartir del intervalo encontrado?
  1. La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de nicotina de dos marcas de cigarrillos.
Marca A Marca B
\(n_i\) 10 8
\(x_i\) 3.1 2.7
\(S_i\) 0.5 0.7

Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas y diferentes, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las dos marcas.

  1. Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de éstos se somete a una tensión hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centímetro cuadrado:
Proceso estándar 446 401 476 421 459 438 481 411 456 427 459 445
Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447

Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e independientes(diferentes), obtener los intervalos de confianza estimados del 95% y 99% para la diferencia entre los dos procesos. Interprete los resultados.

  1. Se piensa que la concentración del ingrediente activo de un detergente líquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se realizan 10 observaciones con cada catalizador, y se obtienen los datos siguientes:
  • Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0

  • Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8

Asumiendo que ambas muestras fueron extraídas de poblaciones normales e independientes, y con varianzas iguales.

  1. Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concentraciones activas para los dos catalizadores.
  2. ¿Existe alguna evidencia que indique que las concentraciones activas medias dependen del catalizador utilizado?
  1. Una muestra de 6 soldaduras de un tipo tenía promedio de prueba final de resistencia de 83.2 ksi y desviación estándar de 5.2. Y una muestra de 10 soldaduras de otro tipo tenía resistencia promedio de 71.3 ksi y desviación estándar de 3.1. supongamos que ambos conjuntos de soldaduras son muestras aleatorias de poblaciones normales. Se desea encontrar un intervalo de confianza de 95% para la diferencia entre las medias de las resistencias de los dos tipos de soldaduras.

  2. Los desórdenes musculoesqueléticos del cuello y hombro son comunes entre empleados de oficina que realizan tareas repetitivas mediante pantallas de visualización. Se reportaron los datos de un estudio para determinar si condiciones de trabajo más variadas habrían tenido algún impacto en el movimiento del brazo. Los datos que siguen se obtuvieron de una muestra de \(n=16\) sujetos. Cada observación es la cantidad de tiempo, expresada como una proporción de tiempo total observado, durante el cual la elevación del brazo fue de menos de 30 grados. Las dos mediciones de cada sujeto se obtuvieron con una separación de 18 meses. Durante este período, las condiciones de trabajo cambiaron y se permitió que los sujetos realizaran una variedad más amplia de tareas. ¿Sugieren los datos que el tiempo promedio verdadero durante el cual la elevación es de menos de 30 grados luego del cambio difiere de lo que era antes? Calcular un intervalo de confianza del 95% para responder la pregunta.

Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Antes 81 87 86 82 90 86 96 73 74 75 72 80 66 72 56 82
Después 78 91 78 78 84 67 92 70 58 62 70 58 66 60 65 73
Diferencia 3 -4 8 4 6 19 4 3 16 13 2 22 0 12 -9 9
  1. En cierto instituto de Enseñanza Secundaria hay matriculados 800 alumnos. A una muestra seleccionada aleatoriamente de un 15% de ellos, se les preguntó si utilizaban la cafetería del instituto. Contestaron negativamente un total de 24 alumnos. Halla el intervalo de confianza del 99% para estimar la proporción de alumnos que utilizan la cafetería del instituto. Interprete.

  2. Un fabricante de componentes compra un lote de dispositivos de segunda mano y desea saber la proporción de la población que están fallados. Con ese fin experimenta con 140 dispositivos elegidos al azar y encuentra que 35 de ellos están fallados.

  1. Calcular un intervalo de confianza del 99% para la proporción poblacional p. Interprete.
  2. ¿De qué tamaño deberá extraerse la muestra a fin de que la proporción muestral no difiera de la proporción poblacional en más de 0.03 con un 95% de confianza?
  1. Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se administra la vacuna a una muestra aleatoria de 3000 sujetos, y de ese grupo 13 contraen gripe. Como grupo de control se seleccionan al azar 2500 sujetos, a los cuales no se les administra la vacuna, y de ese grupo 170 contraen gripe. Construya un intervalo de confianza de nivel 0.95 para la diferencia entre las verdaderas proporciones de individuos que contraen gripe.

Pruebas de hipótesis

Una media

  1. Se sabe por experiencia, que un fármaco para la ansiedad, tiene una efectividad media de 26 puntos (según un determinado test que mide la ansiedad). Con objeto de averiguar el grado de efectividad media de un nuevo fármaco que contiene un 0.01% más de ingrediente activo, se seleccionó una muestra de 37 sujetos con dicho trastorno. Después de una semana de administración del fármaco, se observó una media de bajada de la ansiedad de 30 puntos, con una desviación típica de 5 (según un determinado test). Con un nivel de significancia del 1%, ¿Podemos decir que el nivel medio de efectividad es mayor para el nuevo medicamento?

  2. Tras preguntar a una muestra de 37 personas por su nivel de satisfacción con su operador de telefonía móvil, hemos encontrado un nivel medio de 45 (en una escala de 0 a 100) y una desviación tipo de 10 puntos. Con un nivel de significancia del 3% ¿puede afirmarse que la satisfacción media de la población es exactamente central, es decir de 50 puntos?

  3. Datos de diferentes titulaciones universitarias hacen suponer que la media de años que se requieren para culminar los estudios de psicología es de 7. Para comprobarlo se obtiene una muestra aleatoria simple de 50 expedientes, encontrándose una media de 6 años y una desviación tipo de 4 años. Con un nivel de significacia de 0.05 ¿puede mantenerse la afirmación inicial de los siete años?

  4. La vida útil de un foco es de 5000 horas. Un nuevo diseño se piensa incremente esta vida. Se prueban \(n=25\) focos con fusión a \(\bar{x}=5117\), \(s= 1886\). Concluir para un nivel alfa del 5%, si en efecto el nivel de vida útil es el mensionado.

  5. Se escoge a 17 individuos al azar y se les mide. Resultando que su estatura media es 1.71 metros y que la desviación típica es 0.02 metros. Contrastar la hipótesis de que la estatura media nacional sea 1.75 con un nivel de significación del 5%.

  6. Las horas tomadas para plantar un árbol mediano son las siguientes. Probar a un 5% si el tiempo es > 2 hrs. Los tiempos son los siguientes: 1.9, 1.7, 2.8, 2.4, 2.6, 2.5, 2.8, 3.2, 1.6, 2.5.

Una proporción

  1. Midwest planea comercializar un producto sólo si por lo menos el 40% del público lo prefiere. En una muestra de 500 personas encuentra que 225 lo prefieren. ¿A un nivel alfa de 2%, Midwest debe comercializar el producto?

  2. Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias. El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia, probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia.

  3. Midlakes canceló sus vuelos ya que se estimó que más del 18% involucraba aviones con fallas mecánicas. ¿Este estimado se confirma a un nivel alfa del 0.05 si 24 aviones de 120 tenían fallas?

Dos medias

  1. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Se afirma que el cemento con plomo tiene niveles de calcio superiores a los del cemento estandar. ¿Es correcta esta afirmación al nivel de significancia del 5%?. Suponga que las dos poblaciones son normales y tienen la misma desviación estándar.

  2. Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Un médico afirma que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo es menor con el medicamento B. Suponga, que los tiempos se distribuyen normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre.

¿Podemos afirmar que en efecto, es valida la afirmación del médico; con una significancia del 5%. Suponga varianzas iguales.

Medicamento A Medicamento B
\(n_1=12\) \(n_2=12\)
\(\bar{x}_1=26.8\) \(\bar{x}_2=32.6\)
\(s_1^2=15.57\) \(s_2^2=17.54\)
  1. Se estudia el efecto que la presencia de un moderador puede tener en el número de ideas generadas en un grupo de trabajo. Se observan grupos de cuatro personas, con y sin moderador. En una muestra aleatoria de cuatro grupos con moderador el número promedio de ideas generadas por grupo fue 78.0, con cuasi desviación típica muestral de 24.4. Para una muestra independiente de cuatro grupos sin moderador el promedio de ideas generadas fue 63.5, y su cuasi desviación típica fue 20.2. Suponiendo que distribuciones normales con varianzas iguales, contraste la hipótesis nula (para \(\alpha = 0.1\)) de igualdad de medias, frente a la alternativa de que la media de la población es mayor para grupos con moderador.

  2. Once individuos participaron en un experimento para estudiar la efectividad de cierta dieta combinada con ejercicio para la reducción de los niveles de colesterol en suero. Los niveles de colesterol en suero antes y después del programa se muestran en la siguiente tabla.

Individuo Antes Después
1 200 190
2 199 209
3 239 230
4 240 220
5 205 198
6 198 190
7 234 238
8 209 201
9 189 189
10 245 250
11 200 200

¿Proporcionan los datos evidencia suficiente para concluir que el programa es efectivo en la reducción de los niveles de colesterol?

Dos proporciones

  1. En Investigación de Mercados, es importante conseguir un porcentaje de respuestas elevado para las encuestas. Para mejorar este porcentaje se puede incluir una pregunta inicial de motivación que aumente el interés del encuestado por completarlo. Se han enviado cuestionarios con pregunta de motivación sobre la mejora los espacios de ocio en una ciudad, a una muestra de 250 hogares, obteniendo 101 respuestas. Otros cuestionarios idénticos sin pregunta de motivación se han enviado a otra muestra independiente de 250 hogares, obteniendo 75 respuestas. Contraste la hipótesis nula de que las dos proporciones poblacionales sean iguales, frente a la alternativa de que la tasa de respuestas sea más elevada cuando se incluye pregunta de motivación.

  2. Realizar un contraste sobre la influencia del nivel de estudios de los padres en el hijo mayor con 123 padres universitarios y 52 con estudios primarios, resultando que el hijo mayor había realizado estudios universitarios en 78 y 36 familias respectivamente. ¿Se puede admitir que la proporción de universitarios es igual?

  3. Con el fin de realizar un estudio sobre la eficiencia de medicamentos para la infección en vías urinarias, se toman muestras de dos grupos de 100 individuos. La proporción en el grupo en cual se usa fosfomicina/trometamol fue 0.92 y para trimetoprim/sulfametoxazol fue 0.61. Diga al nivel del 5%, si los medicamentos tienen la misma eficiencia.

  4. Un ejecutivo de una compañia celular ha recibido múltiples quejas acerca de un nuevo modelo de celular. Dos plantas producen el mismo celular y él sospecha que una de ellas es la que está produciendo los celulares defectuosos. Para probar esta hipótesis, el ejecutivo selecciona una muestra de 200 celulares de cada planta y cuenta el número de celulares defectuosos de cada una. En la planta 1 encontró 10 celulares defectuosos y en la planta 2 encontró 15. Prueba o rechaza la hipótesis del ejecutivo de que existe una diferencia en la proporción de celulares defectuosos de las dos plantas con un nivel de significancia de 0.1.

Una varianza

  1. Los datos del costo(miles de millones) de la electricidad para 8 ciudades diferentes son los siguientes.
Ciudad Costo en electricidad (miles de millones)
A
      47
B
      50
C
      53
D
      45
E
      40
F
      43
G
      39
H
      37

Asumiendo que los datos siguen una distribución normal, y con un nivel de significancia \(\alpha =0.01\), a. ¿Es valida la afirmación de que la varianza poblacional del costo del consumo de electricidad en las ciudades es igual a 6.5? b. ¿Son los costos medios historicos de todas las ciudades sueriores a 42.4?

  1. Se supone que los diámetros de cierta marca de válvulas están distribuidos normalmente con una varianza poblacional de 0.2 pulgadas\(^2\), pero se cree que últimamente la varianza ha aumentado. Se toma una muestra aleatoria de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas:

5.5, 5.4, 5.4, 5.6, 5.8, 5.4, 5.5, 5.4, 5.6, 5.7.

Con ésta información, pruebe si lo que se cree es cierto.

  1. Se desea contrastar si puede suponerse razonablemente que en un nuevo proceso de fabricación de filamentos la varianza del grosor es de 4 milímetros. Para ello se toma una muestra de 28 filamentos que arroja una varianza muestral de 2 milímetro. Suponiendo la variable normal, contrastar la hipótesis en los grosores de los filamentos a un nivel de significación de 0.05.

Dos varianzas

  1. (Manualmente) Contrastar la hipótesis de que dos poblaciones tienen la misma dispersión con un nivel de significación del 1% y sabiendo que la desviación típica de una muestra realizada sobre la primera población era 12 con un tamaño muestral de 25 y que en una muestra sobre la segunda de tamaño 30 la desviación típica resultó ser 7. Considérese que ambas poblaciones son normales.

  2. Se administra un medicamento para la ansiedad a 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya son habituales de ella. La droga produjo en el primer grupo sueños de duración 11,12,13,16,17 y 15 horas, mientras que en el segundo grupo 8,7,9,10,6,7,9 y 8 horas. Asumiendo distribución normal de los tiempos. Se pide:

    1. Media y desviación típica de cada grupo.
    2. Para un \(\alpha\) de 5%, ¿Son las desviaciones estandar poblacionales iguales?
    3. ¿Son los promedios del tiempo de sueño iguales en cada grupo?
  3. Para una muestra de 17 bonos industriales emitidos recientemente con calificación AAA, la cuasi varianza de sus vencimientos (en años al cuadrado) fue de 123.35. Para otra muestra independiente de 11 bonos industriales emitidos con calificación CCC, la cuasi varianza de sus vencimientos fue de 8.02. Si se denotan las correspondientes varianzas poblacionales como \(\sigma_1^2\) y \(\sigma_2^2\), lleve a cabo un contraste bilateral para compararlas al 5%.

  4. Se observa la eficiencia de dos departamentos asignándole a cada uno de ellos diez tareas y midiendo su rendimiento en ellas. Los resultados están a continuación:

Departamento 1 0.6 1.2 0.9 1.9 2.0 0.6 0.9 2.0 0.8 1.0
Departamento 2 0.4 1.3 1.1 2.1 1.9 0.5 1.1 1.7 0.8 1.1

Suponiendo las puntuaciones como variables normales, a. A qué nivel de significancia se puede afirmar que las varianzas pobacionales son iguales. b. Puedemos afirmar que las medias del rendimiento son iguales.