PROBLEMA 2.13

En un problema similar al del ejercicio 11, es necesario garantizar que la resistencia mínima que tiene un envase de plástico en posición vertical sea de 20 kg. Para evaluar esto se han obtenido los siguientes datos mediante pruebas destructivas:

x=c(28.3,26.8,26.6,26.5,28.1,24.8,27.4,26.2,29.4,28.6,24.9,25.2,30.4,27.7,27.0,26.1,28.1,26.9,28.0,27.6,25.6,29.5,27.6,27.3,26.2,27.7,27.2,25.9,26.5,28.3,26.5,29.1,23.7,29.7,26.8,29.5,28.4,26.3,28.1,28.7,27.0,25.5,26.9,27.2,27.6,25.5,28.3,27.4,28.8,25.0,25.3,27.7,25.2,28.6,27.9,28.7)
n=length(x)
n
## [1] 56
media=mean(x)
std=sd(x)

hist(x, freq = FALSE, col="red")

tmin=qt(0.025,n-1)
tmax=qt(0.975,n-1)
tmin
## [1] -2.004045
tmax
## [1] 2.004045
media+tmin*std/sqrt(n)
## [1] 26.86335
media+tmax*std/sqrt(n)
## [1] 27.6295
(n-1)*var(x)/qchisq(0.025,n-1)
## [1] 3.091899
(n-1)*var(x)/qchisq(0.975,n-1)
## [1] 1.454363

Conclusiones

  1. Esta variable, forzosamente tiene que evaluarse mediante muestreo y no al 100%, ¿por qué?

Si debe evaluarse mediante muestreo, porque implica la destrucción de una unidad cada vez que se realiza el experimento, por lo que no se va a destruir la totalidad de la población por un experimento.

  1. Haga un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos).

Vemos que la distribución indica que la resistencia media se encuentra entre 26 y 28 kilogramos y la media entre 26.5 y 27.5

  1. Estime, con una confianza de 95%, ¿cuál es la resistencia promedio de los envases?

Podemos estimar con un 95% de confianza que el promedio de resistencia mínima de cada envase se encuentra entre 26.86 como mínimo y 27.63 como máximo.

  1. Antes del estudio se suponía que µ = 25. Dada la evidencia de los datos, ¿tal supuesto es correcto?

No es correcto puesto que la evidencia indica que el promedio se encuentra mayor a 25

  1. Con los datos anteriores estime, con una confianza de 95%, ¿cuál es la desviación estándar poblacional (del proceso)?

La desviación del proceso es de entre 3.09≥ S2 ≥1.45

PROBLEMA 2.16

En la fabricación de discos compactos una variable de interés es la densidad mínima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. Se sabe por experiencia que la densidad mínima del metal casi siempre ocurre en los radios 24 y 57, aunque en el método actual también se miden los radios 32, 40 y 48. Se hacen siete lecturas en cada radio dando un total de 35 lecturas, de las cuales sólo se usa la mínima. A continuación se presenta una muestra histórica de 18 densidades mínimas.

x=c(1.81,1.97,1.93,1.97,1.85,1.99,1.95,1.93,1.85,1.87,1.98,1.93,1.96,2.02,2.07,1.92,1.99,1.93)
n=length(x)
n
## [1] 18
media=mean(x)
std=sd(x)
tmin=qt(0.025,n-1)
tmax=qt(0.975,n-1)
tmin
## [1] -2.109816
tmax
## [1] 2.109816
media+tmin*std/sqrt(n)
## [1] 1.907862
media+tmax*std/sqrt(n)
## [1] 1.972138
tmin=qt(0.005,n-1)
tmax=qt(0.995,n-1)
tmin
## [1] -2.898231
tmax
## [1] 2.898231
media+tmin*std/sqrt(n)
## [1] 1.895853
media+tmax*std/sqrt(n)
## [1] 1.984147
(n-1)*var(x)/qchisq(0.005,n-1)
## [1] 0.01246222
(n-1)*var(x)/qchisq(0.995,n-1)
## [1] 0.001987767
boxplot(x,col=("#990000"))

Conclusiones

  1. Argumente estadísticamente si las densidades mínimas individuales cumplen con la especificación de 1.5 micras.

Las densidades mínimas se ecuentran por arriba de 1.5 micras. Con un intervalo de confianza de 95% (1.91 ≤ X ≤ 1.97)º

  1. Encuentre un intervalo de confianza de 99% para la media de la densidad mínima.

El intervalo para 99% sería 1.89 ≤ X ≤ 1.98

  1. Dé un intervalo de confianza de 99% para la desviación estándar.

El intervalo para la desviación estándar con un intervalo de confianza de 99% serñia 0.012 ≥ S2 ≥ 0.002

  1. Dibuje el diagrama de cajas para estos datos. Interprete lo que observa.

Observamos de valor atípico fuera de lo normal en 1.81, la media se enecuentra en 1.94, cin un rango de datos entre 1.85 y 2.08 micras de grosor lo que da un margen de 0.21 micras

Problema 2.23

En un laboratorio bajo condiciones controladas, se evaluó, para 10 hombres y 10 mujeres, la temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los siguientes:

Tabla 2.23

mujer=c(75,77,78,79,77,73,78,79,78,80)
hombre=c(74,72,77,76,76,73,75,73,74,75)
df=data.frame(mujer=mujer,hombre=hombre)
df=stack(df)
names(df)=c("Y","Trat")
df
##     Y   Trat
## 1  75  mujer
## 2  77  mujer
## 3  78  mujer
## 4  79  mujer
## 5  77  mujer
## 6  73  mujer
## 7  78  mujer
## 8  79  mujer
## 9  78  mujer
## 10 80  mujer
## 11 74 hombre
## 12 72 hombre
## 13 77 hombre
## 14 76 hombre
## 15 76 hombre
## 16 73 hombre
## 17 75 hombre
## 18 73 hombre
## 19 74 hombre
## 20 75 hombre
boxplot(Y~Trat,data=df,col="#009999")

meanmujer=mean(mujer)
meanmujer
## [1] 77.4
meanhombre=mean(hombre)
meanhombre
## [1] 74.5
nmujer=length(mujer)
nmujer
## [1] 10
nhombre=length(hombre)
nhombre
## [1] 10
stdmujer=sd(mujer)
stdmujer
## [1] 2.065591
stdhombre=sd(hombre)
stdhombre
## [1] 1.581139
varcom=(nmujer-1)*stdmujer^2+(nhombre-1)*stdhombre^2/nmujer+nhombre-2
varcom
## [1] 48.65
t0=(meanmujer-meanhombre)/sqrt(varcom)*sqrt(1/nmujer)+(1/nhombre)
t0
## [1] 0.2314791
t.test(mujer,hombre)
## 
##  Welch Two Sample t-test
## 
## data:  mujer and hombre
## t = 3.5254, df = 16.851, p-value = 0.002626
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.163304 4.636696
## sample estimates:
## mean of x mean of y 
##      77.4      74.5

Conclusiones

  1. ¿Cuáles son en realidad los tratamientos que se comparan en este estudio?

Los tratamientos a comparar son los hombres y mujeres

  1. ¿Las muestras son dependientes o independientes? Explique.

Son independientes porque no tenemos una relacion entre un tratamiento y otro

  1. ¿La temperatura promedio más confortable es igual para hombres que para mujeres? Pruebe la hipótesis adecuada.

La H0: La media de sensación térmica confortable para hombres es igual a la media sensación térmica confortable para muejres La Ha: La media de sensación térmica confortable para hombres es diferente a la media sensación térmica confortable para muejres

Si calculamos esto en base a un error del 5% e intervalo de confianza del 95% obtenemos una p menor de 0.05 (p=0.002626) por lo que rechazamos la hipñotesis nula y nos quedamos con la hipótesis alterna donde es diferente a la media sensación térmica confortable para mujeres y hombres

Problema 2.24

Se prueban 10 partes diferentes en cada nivel de temperatura y se mide el encogimiento sufrido en unidades de porcentaje multiplicado por 10. Los resultados son:

Tabla 2.24

tb=c(17.2,17.5,18.6,15.9,16.4,17.3,16.8,18.4,16.7,17.6)
ta=c(21.4,20.9,19.8,20.4,20.6,21,20.8,19.9,21.1,20.3)
df=data.frame(tb=tb,ta=ta)
df
##      tb   ta
## 1  17.2 21.4
## 2  17.5 20.9
## 3  18.6 19.8
## 4  15.9 20.4
## 5  16.4 20.6
## 6  17.3 21.0
## 7  16.8 20.8
## 8  18.4 19.9
## 9  16.7 21.1
## 10 17.6 20.3
df=stack(df)
df
##    values ind
## 1    17.2  tb
## 2    17.5  tb
## 3    18.6  tb
## 4    15.9  tb
## 5    16.4  tb
## 6    17.3  tb
## 7    16.8  tb
## 8    18.4  tb
## 9    16.7  tb
## 10   17.6  tb
## 11   21.4  ta
## 12   20.9  ta
## 13   19.8  ta
## 14   20.4  ta
## 15   20.6  ta
## 16   21.0  ta
## 17   20.8  ta
## 18   19.9  ta
## 19   21.1  ta
## 20   20.3  ta
names(df)=c("encogimiento","Trat")
df
##    encogimiento Trat
## 1          17.2   tb
## 2          17.5   tb
## 3          18.6   tb
## 4          15.9   tb
## 5          16.4   tb
## 6          17.3   tb
## 7          16.8   tb
## 8          18.4   tb
## 9          16.7   tb
## 10         17.6   tb
## 11         21.4   ta
## 12         20.9   ta
## 13         19.8   ta
## 14         20.4   ta
## 15         20.6   ta
## 16         21.0   ta
## 17         20.8   ta
## 18         19.9   ta
## 19         21.1   ta
## 20         20.3   ta
boxplot(encogimiento~Trat,data=df,col=("brown"))

t.test(tb,ta)
## 
##  Welch Two Sample t-test
## 
## data:  tb and ta
## t = -10.797, df = 14.995, p-value = 1.811e-08
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -4.047267 -2.712733
## sample estimates:
## mean of x mean of y 
##     17.24     20.62
var(tb)
## [1] 0.7093333
var(ta)
## [1] 0.2706667
var.test(tb,ta)
## 
##  F test to compare two variances
## 
## data:  tb and ta
## F = 2.6207, num df = 9, denom df = 9, p-value = 0.1674
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   0.6509422 10.5508812
## sample estimates:
## ratio of variances 
##            2.62069

Conclusiones

  1. ¿La temperatura tiene algún efecto en el encogimiento? Plantee las hipótesis estadísticas correspondientes a esta interrogante.

La H0: EncogimientoAltas = EncogimientoBajas La Ha: EncogimientoAltas ≠ EngogimientoBajas

  1. Dé un intervalo de confianza para la diferencia de medias.

Si calculamos esto en base a un error del 5% e intervalo de confianza del 95% obtenemos un intervalo de -4.047267 ≤ µD ≤ -2.712733

  1. ¿Cuál temperatura provoca un encogimiento menor?

Las menores temperaturas segun el diagrama de cajas

  1. Compare las varianzas en cada temperatura.

S2 Temp baja = 0.7093333 S2 Temp alta = 0.2706667

La s2 de temp altas presenta menos varianzas lo que nos indica que las mediciones son mas constantes y hay menos alteraciones de encogimiento respecto a las temperaturas altas

  1. Dibuje los diagramas de cajas simultáneos e interprete.

No hay superposición de datos, ambos son totalmente distintos y observamos que a temperaturas bajas hay menor nivel de encogimiento y a temperaturas altas el nivel de encogimiento es mayor

Problema 3.11

Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación.

Tabla 3.11

df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/c3p11.csv")
df
##    Spray  Y
## 1      1 72
## 2      2 55
## 3      3 64
## 4      1 65
## 5      2 59
## 6      3 74
## 7      1 67
## 8      2 68
## 9      3 61
## 10     1 75
## 11     2 70
## 12     3 58
## 13     1 62
## 14     2 53
## 15     3 51
## 16     1 73
## 17     2 50
## 18     3 69
str(df)
## 'data.frame':    18 obs. of  2 variables:
##  $ Spray: int  1 2 3 1 2 3 1 2 3 1 ...
##  $ Y    : int  72 55 64 65 59 74 67 68 61 75 ...
df$Spray=as.factor(df$Spray)
str(df)
## 'data.frame':    18 obs. of  2 variables:
##  $ Spray: Factor w/ 3 levels "1","2","3": 1 2 3 1 2 3 1 2 3 1 ...
##  $ Y    : int  72 55 64 65 59 74 67 68 61 75 ...
boxplot(Y~Spray,data = df, col=("orange"))

modelo=aov(Y~Spray,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## Spray        2  296.3  148.17   2.793 0.0931 .
## Residuals   15  795.7   53.04                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Spray, data = df)
## 
## $Spray
##          diff        lwr       upr     p adj
## 2-1 -9.833333 -20.755528  1.088861 0.0808333
## 3-1 -6.166667 -17.088861  4.755528 0.3340612
## 3-2  3.666667  -7.255528 14.588861 0.6654850
plot(tk)

1-pf(2.793,2,15)
## [1] 0.09308821
qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.96797, p-value = 0.7589
library("car")
## Loading required package: carData
leveneTest(Y~Spray,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.5288 0.5999
##       15
plot(modelo$residuals)
abline(h=0)

plot(df$Spray,modelo$residuals)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

Conclusiones

  1. Formule la hipótesis adecuada y el modelo estadístico.

Modelo ANOVA DCA (Diseño Completamente al azar) es un solo factor a comparar con dos tratamientos

H0: µ1 = µ2 = µ3 = µ; no hay diferencias entre el uso de los spray HA: µi ≠ µj para algún i ≠ j; al menos uno de los spray muestra diferencia

  1. ¿Existe diferencia entre la efectividad promedio de los productos en spray?

Por la prueba de Tukey no encontramos diferencia ya que todas las p se encuentran mayor a 0.05

  1. ¿Hay algún spray mejor? Argumente su respuesta. ANOVA muestra F0=2.793 <Fα, k-1/N-k=3.682, no hay diferencia significativa entre un spray y otro

  2. Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.

con IC 95% obtenemos los siguientses iC

diff lwr upr p adj 2-1 -9.833333 -20.755528 1.088861 0.0808333 3-1 -6.166667 -17.088861 4.755528 0.3340612 3-2 3.666667 -7.255528 14.588861 0.6654850

  1. Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.

Observamos valores muy similares entre las cajas, a simple viste observamos que no hay diferencia y en el diagrama de tukey todas las diferencias de media tocan el 0 por lo que no hay diferencia entre ellas

f ) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Los datos se corroboran mediante prueba de Shapiro Wilk que arroja p-value = 0.7589. siendo p>0.05, y aceptamos asñi que los datos se distribuyen de manera normal y la prueba de levene p mayor a 0.05 (0.7589) por lo que las varianzas son iguales

Problema 3.12

En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla:

Tabla 3.12

df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/c3p12.csv")
df
##       Trat   Y
## 1  Control 213
## 2  Control 214
## 3  Control 204
## 4  Control 208
## 5  Control 212
## 6  Control 200
## 7  Control 207
## 8       T2  76
## 9       T2  85
## 10      T2  74
## 11      T2  78
## 12      T2  82
## 13      T2  75
## 14      T2  82
## 15      T3  57
## 16      T3  67
## 17      T3  55
## 18      T3  64
## 19      T3  61
## 20      T3  63
## 21      T3  63
## 22      T4  84
## 23      T4  82
## 24      T4  85
## 25      T4  92
## 26      T4  87
## 27      T4  79
## 28      T4  90
str(df)
## 'data.frame':    28 obs. of  2 variables:
##  $ Trat: chr  "Control" "Control" "Control" "Control" ...
##  $ Y   : int  213 214 204 208 212 200 207 76 85 74 ...
df$Trat=as.factor(df$Trat)
str(df)
## 'data.frame':    28 obs. of  2 variables:
##  $ Trat: Factor w/ 4 levels "Control","T2",..: 1 1 1 1 1 1 1 2 2 2 ...
##  $ Y   : int  213 214 204 208 212 200 207 76 85 74 ...
boxplot(Y~Trat,data = df, main="comparacion del tiempo de coccion con/n diferentes tratamientos")

modelo=aov(Y~Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)    
## Trat         3  95041   31680    1559 <2e-16 ***
## Residuals   24    488      20                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Trat, data = df)
## 
## $Trat
##                   diff           lwr        upr     p adj
## T2-Control -129.428571 -136.07568671 -122.78146 0.0000000
## T3-Control -146.857143 -153.50425813 -140.21003 0.0000000
## T4-Control -122.714286 -129.36140099 -116.06717 0.0000000
## T3-T2       -17.428571  -24.07568671  -10.78146 0.0000010
## T4-T2         6.714286    0.06717044   13.36140 0.0471059
## T4-T3        24.142857   17.49574187   30.78997 0.0000000
plot(tk, col=("purple"))

T3=c(57,67,55,64,61,63,63)
media=mean(T3)

1-pf(1559,3,24)
## [1] 0
shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.95991, p-value = 0.3469
qqnorm(modelo$residuals)
qqline(modelo$residuals)

library("car")
leveneTest(Y~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1631 0.9201
##       24
plot(modelo$residuals)
abline(h=0)

plot(df$Trat,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

Conclusiones

  1. ¿De qué manera el experimentador debe aleatorizar los experimentos y el material experimental?

Este experimento es completamente al azar, todas las corridas son aleatorias al realizarse en total N pruebas, éstas se corren al azar, así que los posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los tratamientos.

  1. Dé ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y las conclusiones.

Temperatura, tipo de frijol, características del recipiente, calidad del agua y su cantidad. son factores que no se controlan pero que pueden causas una alteración

  1. Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.

H0: µcontrol = µ2 = µ3 = µ4= µ5; la media de los tratamientos es igual HA: µi ≠ µj para algún i ≠ j; existe al menos 1 tratamiento con resultado diferente

Con valor de p=<2e-16, es menor a 0.05. Se rechaza H0, se puede concluir que existen por lo menos 2 tratamientos con resultados diferentes.

  1. Obtenga el diagrama de caja y el gráfico de medias, después interprételos.

Al comparar los 3 tratamientos con el control, todos tienen efecto en disminuir el tiempo de cocción y el tratamiento 3 es el que presenta menor tiempo de cocción. , ninguna grñafica incluye el cero por lo que todos los tratamientos son diferentes segun tukey

  1. ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento?

el T3 de remojar con agua con sal común es el mejor. con un tiempo de cocción medio de 61,4

f ) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.

al ser utilizada mucha sal, puede tener un grave impacto en el sabor, y por otro lado y no menos importante en la salud del paciente, pudiendo empeorar problemas como la hipertensión.

  1. ¿Se cumplen los supuestos del modelo? Verifique gráficamente.

Shapiro: p-valor = 0.3469, se acepta H0 con p-valor menor 0.05, podemos concluir que los datos proceden de una distribución normal

  1. Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que corresponde a un supuesto).

La prueba de Levene indica con un 95% de confianza que las varianzas son iguales, con una p-valor=0.9201 (p>0.05), se acepta H0 de que las varianzas son iguales

Problema 3.13

Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se someten a un envejecimiento acelerado durante 100 horas a determinada temperatura, y como variable de interés se mide la intensidad de corriente que circula entre dos puntos, cuyos valores aumentan con el deterioro. Se probaron 20 módulos repartidos de manera equitativamente en cinco temperaturas y los resultados obtenidos fueron los siguientes

Tabla 3.13

df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/Cap3_Prob13.csv")
df
##    Trat Corriente
## 1    20        15
## 2    20        18
## 3    20        13
## 4    20        12
## 5    40        17
## 6    40        21
## 7    40        11
## 8    40        16
## 9    60        23
## 10   60        19
## 11   60        25
## 12   60        22
## 13   80        28
## 14   80        32
## 15   80        34
## 16   80        31
## 17  100        45
## 18  100        51
## 19  100        57
## 20  100        48
str(df)
## 'data.frame':    20 obs. of  2 variables:
##  $ Trat     : int  20 20 20 20 40 40 40 40 60 60 ...
##  $ Corriente: int  15 18 13 12 17 21 11 16 23 19 ...
df$Trat=factor(df$Trat)
str(df)
## 'data.frame':    20 obs. of  2 variables:
##  $ Trat     : Factor w/ 5 levels "20","40","60",..: 1 1 1 1 2 2 2 2 3 3 ...
##  $ Corriente: int  15 18 13 12 17 21 11 16 23 19 ...
boxplot(Corriente~Trat,data=df)

modelo=aov(Corriente~Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Trat         4   3412   853.0   68.06 1.96e-09 ***
## Residuals   15    188    12.5                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Corriente ~ Trat, data = df)
## 
## $Trat
##         diff         lwr       upr     p adj
## 40-20   1.75 -5.98009744  9.480097 0.9535481
## 60-20   7.75  0.01990256 15.480097 0.0492648
## 80-20  16.75  9.01990256 24.480097 0.0000612
## 100-20 35.75 28.01990256 43.480097 0.0000000
## 60-40   6.00 -1.73009744 13.730097 0.1696046
## 80-40  15.00  7.26990256 22.730097 0.0002059
## 100-40 34.00 26.26990256 41.730097 0.0000000
## 80-60   9.00  1.26990256 16.730097 0.0190664
## 100-60 28.00 20.26990256 35.730097 0.0000001
## 100-80 19.00 11.26990256 26.730097 0.0000141
plot(tk,col="green")

qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.97113, p-value = 0.7785
library("car")
leveneTest(Corriente~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.6808  0.616
##       15
plot(modelo$residuals)
abline(h=0)

plot(df$Trat,modelo$residuals)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

Conclusiones

  1. Formule la hipótesis y el modelo estadístico para el problema.

Utilizamos ANOVA Ho: m20°C = m40°C = m60°C = m80°C= m; la intensidad de corriente no se altera según la temperatura HA: mi ≠ mj; hay diferencia en la intensidad de corriente en al menos una medición.

  1. Realice el análisis de varianza para estos datos, a fin de estudiar si la temperaturaafecta la intensidad de corriente promedio.

H0: La varianza de los grupos son iguales. Ha: La varianza de los grupos son diferentes.

Levene nos dindica con un 95% de confianza que la p es mayor a 0.05 (0.616) y aceptamos la H0 de que las varianzas son iguales

  1. ¿La temperatura afecta la variabilidad de las intensidades? Es decir, verifique si hay igual varianza entre los diferentes tratamientos.

La variabilidad de las intensidades de corriente es estadísticamente significativa a 80°C y 100°C.

Problema 3.14

En una empresa de manufactura se propone un tratamiento para reducir el porcentaje de productos defectuosos. Para validar esta propuesta se diseñó un experimento en el que se producía con o sin la propuesta de mejora. Cada corrida experimental consistió en producir un lote y la variable de respuesta es el porcentaje de producto defectuoso. Se hicieron 25 réplicas para cada tratamiento. Los datos obtenidos se muestran a continuación:

df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/c3p14.csv")
df
##       Trat PPDef
## 1  ConTrat   5.3
## 2  ConTrat   2.2
## 3  ConTrat   4.0
## 4  ConTrat   1.1
## 5  ConTrat   4.0
## 6  ConTrat   2.0
## 7  ConTrat   4.0
## 8  ConTrat   3.0
## 9  ConTrat   2.6
## 10 ConTrat   3.1
## 11 ConTrat   2.1
## 12 ConTrat   2.1
## 13 ConTrat   5.1
## 14 ConTrat   1.2
## 15 ConTrat   4.1
## 16 ConTrat   3.3
## 17 ConTrat   4.1
## 18 ConTrat   2.1
## 19 ConTrat   3.2
## 20 ConTrat   4.0
## 21 ConTrat   5.1
## 22 ConTrat   2.0
## 23 ConTrat   2.2
## 24 ConTrat   3.0
## 25 ConTrat   4.1
## 26 SinTrat   8.0
## 27 SinTrat   8.7
## 28 SinTrat  13.2
## 29 SinTrat  11.3
## 30 SinTrat   7.2
## 31 SinTrat   4.5
## 32 SinTrat   8.2
## 33 SinTrat   6.6
## 34 SinTrat   9.1
## 35 SinTrat   9.2
## 36 SinTrat   6.7
## 37 SinTrat  10.2
## 38 SinTrat  12.2
## 39 SinTrat  10.6
## 40 SinTrat  16.3
## 41 SinTrat  13.3
## 42 SinTrat   9.2
## 43 SinTrat   5.2
## 44 SinTrat   6.4
## 45 SinTrat   6.2
## 46 SinTrat   7.2
## 47 SinTrat   8.0
## 48 SinTrat  17.2
## 49 SinTrat   4.8
## 50 SinTrat  12.3
str(df)
## 'data.frame':    50 obs. of  2 variables:
##  $ Trat : chr  "ConTrat" "ConTrat" "ConTrat" "ConTrat" ...
##  $ PPDef: num  5.3 2.2 4 1.1 4 2 4 3 2.6 3.1 ...
df$Trat=as.factor(df$Trat)
boxplot(PPDef~Trat, data=df, col="yellow")

SinTrat=c(8.0,8.7,13.2,11.3,7.2,4.5,8.2,6.6,9.1,9.2,6.7,10.2,12.2,10.6,16.3,13.3,9.2,5.2,6.4,6.2,7.2,8.0,17.2,4.8,12.3)
media=mean(SinTrat)

modelo=aov(PPDef~Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Trat         1  467.0   467.0   73.14 3.27e-11 ***
## Residuals   48  306.5     6.4                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = PPDef ~ Trat, data = df)
## 
## $Trat
##                  diff      lwr      upr p adj
## SinTrat-ConTrat 6.112 4.675016 7.548984     0
plot(tk)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.94382, p-value = 0.01913
qqnorm(modelo$residuals)
qqline(modelo$residuals)

library("car")
leveneTest(PPDef~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value    Pr(>F)    
## group  1  12.969 0.0007491 ***
##       48                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(modelo$residuals)
abline(h=0)

plot(df$Trat,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

Conclusiones

  1. ¿Las diferencias son significativas estadísticamente?

H0: mcontrat = msintrat = m HA: mi ≠ mj

Obtenemos una p menor a 0.05 (3.27e-11), rechazamos la H0, por lo que los tratamientos son distintos, sin embargo al comprobar los supuestos obtenemos que no se cumple la normalidad, varianza e independecia, estamos ante una prueba inválida o que necesita de otro tipo de análisis.

  1. ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?

En promedio el error sin tratamientos es de 9.3%, y al aplicarle la reducción del 6.1% se espera un porcetaje de defectuosos con el nuevo tratamiento de 3.2% solamente

  1. Cuantifique el nivel de reducción que se logró con el tratamiento propuesto.

La reducción sobre el tratamiento es de 6.1%