title: "TALLER 42" author: "Dana Chelsy Torres Martínez" date: "2022-10-24" output: pdf_document ---

{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE)

MÓDULO 4 - UNIDAD 4.2

PROBLEMA 1

Encuentre e interprete un intervalo de confianza del 95% para una media poblacional μ para los valores:

{r, echo=FALSE} 13.1+c(-1,1)*qnorm(1-0.05/2)*sqrt(3.42)/sqrt(36) 2.73+c(-1,1)*qnorm(1-0.05/2)*sqrt(0.1047)/sqrt(64) var = (replicate (10000,mean(rnorm(125,0.84,sqrt(0.086)/sqrt(125))))) quantile (var,c(0.025, 0.975))

Problema 2

El departamento de carnes de una cadena de supermercados empaca la carne molida en vendejas de dos tamaños: una esta diseñada para contener mas o menos 1 libra de carne y la otra para casi 3 libras. Una muestra aleatoria de 35 paquetes de la bandeja mas pequeña produjo mediciones de peso con un promedio de 1.01 libras y una desviación estándar de 0.18 libras.

{r, echo=FALSE} 1.01+c(-1,1)*qnorm(1-0.01/2)*(0.18)/sqrt(35) El intervalo de confianza del 99% para el promedio de los paquetes mas pequeños es de (0.931629 a 1.088371). Por lo que el departamento de control de calidad de esta cadena de supermercados si se debe preocupar por la calidad el resultado obtenido para el IC(99%), ya que se encuentra en el limite del intervalo de confianza.

Problema 3

Se considera usar dos marcas diferentes de pinturas. Se seleccionaron 15 tipos de pinturas de cada marca para los cuales se midió el tiempo de secado en horas, obteniendo los siguientes resultados:

{r, echo=FALSE} A=c(3.5,2.7, 3.9, 4.2, 3.6, 2.7, 3.3, 5.2, 4.2, 2.9, 4.4, 5.2, 4.0, 4.1, 3.4) B=c(4.7, 3.9, 4.5, 5.5, 4.0, 5.3, 4.3, 6.0, 5.2, 3.7, 5.5, 6.2, 5.1, 5.4, 4.8) boxplot(data.frame(A,B), col=c("#264653", "#f4a261"), las=1, main="Tiempo de secado por tipo de pintura") grid()

Suponga que el tiempo de secado se distribuye normal . Calcule un intervalo de confianza para la diferencia de medias e interprete su resultado.

{r, echo=FALSE} A=c(3.5,2.7, 3.9, 4.2, 3.6, 2.7, 3.3, 5.2, 4.2, 2.9, 4.4, 5.2, 4.0, 4.1, 3.4) B=c(4.7, 3.9, 4.5, 5.5, 4.0, 5.3, 4.3, 6.0, 5.2, 3.7, 5.5, 6.2, 5.1, 5.4, 4.8) var.test(A,B)$conf.int

{r, echo=FALSE} A=c(3.5,2.7, 3.9, 4.2, 3.6, 2.7, 3.3, 5.2, 4.2, 2.9, 4.4, 5.2, 4.0, 4.1, 3.4) B=c(4.7, 3.9, 4.5, 5.5, 4.0, 5.3, 4.3, 6.0, 5.2, 3.7, 5.5, 6.2, 5.1, 5.4, 4.8) t.test(A,B, var.equal=T,paired=F)$conf.int De acuerdo con el resultado anterior, se puede afirmar el intervalo de confianza es del 95%, y los intervalos resultantes son -1.69 y -0.55 por lo que μA<μB . Razon por la cual se recomienda comprar la marca A.

Problema 4

En una encuesta aleatoria realizada a 500 familias de la ciudad que poseen televisión por cable, se encuentra que 340 tienen suscripción a HBO. Calcule un intervalo de confianza para la proporción de familias que tienen suscripción a HBO en la ciudad. Interprete el resultado obtenido.

{r, echo=FALSE} prop.test(340,500)$conf.int De acuerdo con el resultado anterior, se puede afirmar que con un intervalo de confianza del 95% que entre el porcentaje de 63.7% - 72.0% de las familias tienen una suscripción a HBO

Problema 5

Suponga que se desea realizar un estudio en la ciudad para estimar la proporción de familias que tienen suscripción a HBO, con el fin de repetir el estudio después de dos meses, de tal forma que permita validar el efecto de publicidad de estos canales de televisión. Si se requiere estimar una intervalo de confianza para la proporción con un 95% de confianza y que la estimación de p este dentro de 0.02 del valor verdadero, ¿Que tan grande debe ser la muestra?

{r, echo=FALSE} qnorm(1-0.05)^2*0.0196/0.02 La muestra debe de ser de 2.651433.

Problema 6

Se afirma que una persona podrá reducir su peso en un periodo de dos semanas un promedio de 4.5 kilogramos con una nueva dieta. Los pesos de 7 mujeres de siguieron esta dieta se registraron antes y después de un periodo de dos semanas.

{r, echo=FALSE} pesant=c(58.2, 60.3, 61.3, 69.0, 64.0, 62.6, 56.7) pesdes=c(60.0, 54.9, 58.1, 62.1, 58.5, 59.9, 54.4)

Pruebe la afirmacion sobrela dieta calculando un intervalo de confianza del 95% para la diferencia de medias . Suponga que las diferencias de los pesos se distribuyen aproximadamente normal.

{r, echo=FALSE} pesant=c(58.2, 60.3, 61.3, 69.0, 64.0, 62.6, 56.7) pesdes=c(60.0, 54.9, 58.1, 62.1, 58.5, 59.9, 54.4) t.test(pesant,pesdes, paired = TRUE, conf.level = 0.95)$conf.int

Para un intervalo de confianza de 95%, se reduce entre el intervalo (0.80 y 6.11) kilogramos por lo que la afirmacion si es cierta, ya que la dieta si genero resultados ya que ambos valores del intervalo es positiva.

Problema 7

El conjunto de datos de iris (de Fisher o Anderson) contiene las medidas en centímetros de las variables longitud y ancho del sépalo y largo y ancho del pétalo, respectivamente, para 50 flores de cada una de las 3 especies de iris : setosa, versicolor y virginica.

{r, echo=FALSE} data(iris) head(iris)

Determine intervalos de confianza para cada una de las caracteristicas por espacies. Existen diferencias entre los promedio del largo de los sepalos de las especies setosa y virginica?

{r, echo=FALSE} sl = mean(iris$Sepal.Length) sw = mean(iris$Sepal.Width) pl = mean(iris$Petal.Length) pw = mean(iris$Petal.Width) sls = sd(iris$Sepal.Length) sws = sd(iris$Sepal.Width) pls = sd(iris$Petal.Length) pws = sd(iris$Petal.Width) sl + c(-1,1)*qnorm(1-0.05/2)*(sls)/sqrt(150) sw + c(-1,1)*qnorm(1-0.05/2)*(sws)/sqrt(150) pl + c(-1,1)*qnorm(1-0.05/2)*(pls)/sqrt(150) pw + c(-1,1)*qnorm(1-0.05/2)*(pws)/sqrt(150)

Los intervalos de confianza para cada una de las caracteristicas por espacies son: Sepal.Length (5.710818 a 5.975849), Sepal.Width (2.987581 a 3.127085), Petal.Length (3.475499 a 4.040501) y Petal.Width (1.077352 a 1.321315). Y si existe una diferencia entre los promedios.

Problema 8

Cuántos artículos deben incluirse en una muestra para estimar la proporción de defectuosos con un error no mayor del 2% y confiabilidad del 95%

{r, echo=FALSE} qnorm(1-0.05)^2*0.25/0.02 La cantidad de articulos que deben incluirse en una muestra para estimar la proporcion de defectuosos conun error no mayor del 2% y confiabilidad del 95% son 33.81929.

Problema 9

De 1000 casos seleccionados al azar de cáncer de pulmón, 823 resultaron en la muerte dentro de los 10 años después de su detección. Construya un intervalo de confianza para la tasa de mortalidad por cáncer de pulmón del 95%, de acuerdo con los datos suministrados. Interprete los resultados obtenidos.

{r, echo=FALSE} prop.test(823,1000)$conf.int

El para un nivel de confianza del 95%, la tasa de mortalidad es de (0.7975972 a 0.8458786) dentro de los 10 años despues de su deteccion.

Problema 10

A seis ingenieros que trabajan para el estado se les solicito realizar un pronostico la tasa de inflación para el año entrante. La misma petición se le realizo a ocho especialistas en finanzas que trabajan para el sector privado. Los pronósticos entregado por los ingenieros son los siguientes: 4.2 %, 5.1 %, 3.9 %, 4.7 %, 4.8 %, 5.8 %. Por su parte los especialistas en finanzas pronosticaron: 5.7 %, 6.1 %, 5.2 %, 4.9 %, 4.6 %, 4.5 %, 5.2 %, 5.5 %. ¿Estan los especialistas (ingenieros y financieros) realizando pronósticos similares? . Suponga que los pronósticos realizados tienen distribucion normal. Construye un intervalo de confianza para la diferencia de los promedios realizados por los ingenieros y los especializadas en finanzas del 95%. Concluya a partir de los resultados.

{r, echo=FALSE} infing=c(4.2, 5.1, 3.9, 4.7, 4.8, 5.8) inffin=c(5.7, 6.1, 5.2, 4.9, 4.6, 4.5, 5.2, 5.5) par(mfrow = c(1, 2)) boxplot(infing, las=1, col=2, ylim=c(3,6)); grid() boxplot(inffin, las=1, col=3, ylim=c(3,6)); grid()

{r, echo=FALSE} var.test(infing, inffin)$conf.int

{r, echo=FALSE} t.test(infing, inffin, paired = FALSE, var.equal = TRUE, conf.level = 0.95)$conf.int

Con una confianza del 95%, el pronostico la tasa de inflación para el año entrante y la realizada por los especialistas esta en el intervalo de (-1.1704541 y 0.2454541) por lo que las estimaciones promedio son similares. Las varianzas son iguales, ya que el intervirlo tiene contenido a 1.

Problema 11

Los siguientes datos corresponden a las notas finales del curso de matematicas fundamentales.

{r, echo=FALSE} nf=c(4.1, 2.7, 3.1, 3.2, 3.0, 3.2, 2.0, 2.4, 1.6, 3.2, 3.1, 2.6, 2.0, 2.4, 2.8, 3.3, 4.0, 3.4, 3.0, 3.1, 2.7, 2.7, 3.0, 3.8, 3.2, 2.2, 3.5, 3.5, 3.8, 3.5, 3.9, 4.2, 4.3, 3.9, 3.2, 3.5, 3.5, 3.7, 4.1, 3.7, 3.5, 3.6, 3.2, 3.1, 3.4, 3.0, 3.0, 3.0, 2.7, 1.7, 3.6, 2.1, 2.4, 3.0, 3.1, 2.5, 2.5, 3.6, 2.2, 2.4, 3.1, 3.3, 2.7, 3.7, 3.0, 2.7, 3.0, 3.2, 3.1, 2.4, 3.0, 2.7, 2.5, 3.0, 3.0, 3.0, 3.2, 3.1, 3.8, 4.1, 3.7, 3.5, 3.0, 3.7, 3.7, 4.1, 3.7, 3.9, 3.7, 2.0)

Construya un intervalo del 95% confianza para el promedio de la nota final del curso de matematicas fundamentales. Interprete su resultado

{r, echo=FALSE} nf=c(4.1, 2.7, 3.1, 3.2, 3.0, 3.2, 2.0, 2.4, 1.6, 3.2, 3.1, 2.6, 2.0, 2.4, 2.8, 3.3, 4.0, 3.4, 3.0, 3.1, 2.7, 2.7, 3.0, 3.8, 3.2, 2.2, 3.5, 3.5, 3.8, 3.5, 3.9, 4.2, 4.3, 3.9, 3.2, 3.5, 3.5, 3.7, 4.1, 3.7, 3.5, 3.6, 3.2, 3.1, 3.4, 3.0, 3.0, 3.0, 2.7, 1.7, 3.6, 2.1, 2.4, 3.0, 3.1, 2.5, 2.5, 3.6, 2.2, 2.4, 3.1, 3.3, 2.7, 3.7, 3.0, 2.7, 3.0, 3.2, 3.1, 2.4, 3.0, 2.7, 2.5, 3.0, 3.0, 3.0, 3.2, 3.1, 3.8, 4.1, 3.7, 3.5, 3.0, 3.7, 3.7, 4.1, 3.7, 3.9, 3.7, 2.0) t.test(nf)$conf.int

Con una confianza del 95%, el promedio de la nota final del curso de matematicas fundamentales esta en el intervalo de (3.012243 a 3.261091) por lo que las estimaciones promedio son similares.

Problema 12

Una muestra de siete bloques de concreto tienen la siguiente fuerza de compresión medida en MPa . Los resultados obtenidos son:

{r, echo=FALSE} x=c(1367.6, 1411.5, 1318.7, 1193.6, 1406.2, 1425.7, 1572.4)

Estime un intervalo de confianza del 95% para la media de la fuerza de compresion de los bloques de concreto

{r, echo=FALSE} x=c(1367.6, 1411.5, 1318.7, 1193.6, 1406.2, 1425.7, 1572.4) t.test(x)$conf.int

Con una confianza del 95%, la media dla media de la fuerza de compresion de los bloques de concreto esta en el intervalo de (1278.804 a 1491.396) por lo que las estimaciones promedio son similares.

Problema 13

Los directivos de una ensambladora de automóviles de gran tamaño están tratando de decidir si compraran neumáticos de la marca A o de la marca B para sus modelos nuevos. Con el fin de ayudarlos a tomar una decisión se realiza un experimento en el que se usan 12 neumáticos de cada marca. Los neumáticos se utilizan hasta que se desgastan completamente. Los resultados son los siguientes:

{r, echo=FALSE} A=c( 55145, 58026, 58795, 54660, 61153, 56969, 61764, 59094, 60456, 54557, 52484, 59600) B=c(60970, 62409, 60546, 58508, 58974, 56682, 59483, 58048, 73107, 61977, 55974, 58522)

¿Que marca de neumáticos escogería entre las dos opciones de acuerdo a la anterior informacion? Suponga que las poblaciones se distribuyen de forma aproximadamente normal.

```{r, echo=FALSE} A=c( 55145, 58026, 58795, 54660, 61153, 56969, 61764, 59094, 60456, 54557, 52484, 59600) B=c(60970, 62409, 60546, 58508, 58974, 56682, 59483, 58048, 73107, 61977, 55974, 58522)

var.test(A,B)$conf.int t.test(A,B, var.equal=T,paired=F)$conf.int

```

De acuerdo con el resultado anterior, se puede afirmar el intervalo de confianza es del 95%, y los intervalos resultantes son -5904.261 y 488.094 por lo que μA=μB. Razon por la cual se recomienda comprar la marca B.

Problema 14

El Director de una fabrica de muebles desea estimar el tiempo promedio que toma perforar tres agujeros en una placa metálica que se utiliza en la construcción de bases para mesas metálicas. El desea tener una confianza del 95 % para que la media muestral este dentro de 5 segundos de la media real, suponiendo que σ=40, obtenida en estudios anteriores. Una de las firmas contactadas para la realización del estudio indica que para esas condiciones, deberá realizar 175 mediciones. El Director le pide que revise la información suministrada y le de su concepto.

Problema 15

Un estudio realizado por MasterCard revelo que 131 de las 468 mujeres que efectuaron compras en almacén lo hicieron utilizando la tarjeta de crédito propia del almacén, mientras que 57 de 237 hombres utilizaron la misma tarjeta para sus compras en el almacén. ¿ Existe evidencia suficiente en los datos que permita concluir que la proporción de mujeres es mayor que la proporción de hombres que utilizan la tarjeta de crédito propia del almacén para realizar sus compras?