En un problema similar al del ejercicio 11, es necesario garantizar que la resistencia mínima que tiene un envase de plástico en posición vertical sea de 20 kg. Para evaluar esto se han obtenido los siguientes datos mediante pruebas destructivas:
x=c(28.3,26.8,26.6,26.5,28.1,24.8,27.4,26.2,29.4,28.6,24.9,25.2,30.4,27.7,27.0,26.1,28.1,26.9,28.0,27.6,25.6,29.5,27.6,27.3,26.2,27.7,27.2,25.9,26.5,28.3,26.5,29.1,23.7,29.7,26.8,29.5,28.4,26.3,28.1,28.7,27.0,25.5,26.9,27.2,27.6,25.5,28.3,27.4,28.8,25.0,25.3,27.7,25.2,28.6,27.9,28.7)
n=length(x)
n
## [1] 56
media=mean(x)
std=sd(x)
hist(x, freq = FALSE, col="red")
tmin=qt(0.025,n-1)
tmax=qt(0.975,n-1)
tmin
## [1] -2.004045
tmax
## [1] 2.004045
media+tmin*std/sqrt(n)
## [1] 26.86335
media+tmax*std/sqrt(n)
## [1] 27.6295
(n-1)*var(x)/qchisq(0.025,n-1)
## [1] 3.091899
(n-1)*var(x)/qchisq(0.975,n-1)
## [1] 1.454363
Si debe evaluarse mediante muestreo, porque implica la destrucción de una unidad cada vez que se realiza el experimento, por lo que no se va a destruir la totalidad de la población por un experimento.
Vemos que la distribución indica que la resistencia media se encuentra entre 26 y 28 kilogramos y la media entre 26.5 y 27.5
Podemos estimar con un 95% de confianza que el promedio de resistencia mínima de cada envase se encuentra entre 26.86 como mínimo y 27.63 como máximo.
No es correcto puesto que la evidencia indica que el promedio se encuentra mayor a 25
La desviación del proceso es de entre 3.09≥ S2 ≥1.45
En la fabricación de discos compactos una variable de interés es la densidad mínima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. Se sabe por experiencia que la densidad mínima del metal casi siempre ocurre en los radios 24 y 57, aunque en el método actual también se miden los radios 32, 40 y 48. Se hacen siete lecturas en cada radio dando un total de 35 lecturas, de las cuales sólo se usa la mínima. A continuación se presenta una muestra histórica de 18 densidades mínimas.
x=c(1.81,1.97,1.93,1.97,1.85,1.99,1.95,1.93,1.85,1.87,1.98,1.93,1.96,2.02,2.07,1.92,1.99,1.93)
n=length(x)
n
## [1] 18
media=mean(x)
std=sd(x)
tmin=qt(0.025,n-1)
tmax=qt(0.975,n-1)
tmin
## [1] -2.109816
tmax
## [1] 2.109816
media+tmin*std/sqrt(n)
## [1] 1.907862
media+tmax*std/sqrt(n)
## [1] 1.972138
tmin=qt(0.005,n-1)
tmax=qt(0.995,n-1)
tmin
## [1] -2.898231
tmax
## [1] 2.898231
media+tmin*std/sqrt(n)
## [1] 1.895853
media+tmax*std/sqrt(n)
## [1] 1.984147
(n-1)*var(x)/qchisq(0.005,n-1)
## [1] 0.01246222
(n-1)*var(x)/qchisq(0.995,n-1)
## [1] 0.001987767
boxplot(x,col=("#990000"))
Las densidades mínimas se ecuentran por arriba de 1.5 micras. Con un intervalo de confianza de 95% (1.91 ≤ X ≤ 1.97)º
El intervalo para 99% sería 1.89 ≤ X ≤ 1.98
El intervalo para la desviación estándar con un intervalo de confianza de 99% serñia 0.012 ≥ S2 ≥ 0.002
Observamos de valor atípico fuera de lo normal en 1.81, la media se enecuentra en 1.94, cin un rango de datos entre 1.85 y 2.08 micras de grosor lo que da un margen de 0.21 micras
En un laboratorio bajo condiciones controladas, se evaluó, para 10 hombres y 10 mujeres, la temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los siguientes:
Tabla 2.23
mujer=c(75,77,78,79,77,73,78,79,78,80)
hombre=c(74,72,77,76,76,73,75,73,74,75)
df=data.frame(mujer=mujer,hombre=hombre)
df=stack(df)
names(df)=c("Y","Trat")
df
## Y Trat
## 1 75 mujer
## 2 77 mujer
## 3 78 mujer
## 4 79 mujer
## 5 77 mujer
## 6 73 mujer
## 7 78 mujer
## 8 79 mujer
## 9 78 mujer
## 10 80 mujer
## 11 74 hombre
## 12 72 hombre
## 13 77 hombre
## 14 76 hombre
## 15 76 hombre
## 16 73 hombre
## 17 75 hombre
## 18 73 hombre
## 19 74 hombre
## 20 75 hombre
boxplot(Y~Trat,data=df,col="#009999")
meanmujer=mean(mujer)
meanmujer
## [1] 77.4
meanhombre=mean(hombre)
meanhombre
## [1] 74.5
nmujer=length(mujer)
nmujer
## [1] 10
nhombre=length(hombre)
nhombre
## [1] 10
stdmujer=sd(mujer)
stdmujer
## [1] 2.065591
stdhombre=sd(hombre)
stdhombre
## [1] 1.581139
varcom=(nmujer-1)*stdmujer^2+(nhombre-1)*stdhombre^2/nmujer+nhombre-2
varcom
## [1] 48.65
t0=(meanmujer-meanhombre)/sqrt(varcom)*sqrt(1/nmujer)+(1/nhombre)
t0
## [1] 0.2314791
t.test(mujer,hombre)
##
## Welch Two Sample t-test
##
## data: mujer and hombre
## t = 3.5254, df = 16.851, p-value = 0.002626
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 1.163304 4.636696
## sample estimates:
## mean of x mean of y
## 77.4 74.5
Los tratamientos a comparar son los hombres y mujeres
Son independientes porque no tenemos una relacion entre un tratamiento y otro
La H0: La media de sensación térmica confortable para hombres es igual a la media sensación térmica confortable para muejres La Ha: La media de sensación térmica confortable para hombres es diferente a la media sensación térmica confortable para muejres
Si calculamos esto en base a un error del 5% e intervalo de confianza del 95% obtenemos una p menor de 0.05 (p=0.002626) por lo que rechazamos la hipñotesis nula y nos quedamos con la hipótesis alterna donde es diferente a la media sensación térmica confortable para mujeres y hombres
Se prueban 10 partes diferentes en cada nivel de temperatura y se mide el encogimiento sufrido en unidades de porcentaje multiplicado por 10. Los resultados son:
Tabla 2.24
tb=c(17.2,17.5,18.6,15.9,16.4,17.3,16.8,18.4,16.7,17.6)
ta=c(21.4,20.9,19.8,20.4,20.6,21,20.8,19.9,21.1,20.3)
df=data.frame(tb=tb,ta=ta)
df
## tb ta
## 1 17.2 21.4
## 2 17.5 20.9
## 3 18.6 19.8
## 4 15.9 20.4
## 5 16.4 20.6
## 6 17.3 21.0
## 7 16.8 20.8
## 8 18.4 19.9
## 9 16.7 21.1
## 10 17.6 20.3
df=stack(df)
df
## values ind
## 1 17.2 tb
## 2 17.5 tb
## 3 18.6 tb
## 4 15.9 tb
## 5 16.4 tb
## 6 17.3 tb
## 7 16.8 tb
## 8 18.4 tb
## 9 16.7 tb
## 10 17.6 tb
## 11 21.4 ta
## 12 20.9 ta
## 13 19.8 ta
## 14 20.4 ta
## 15 20.6 ta
## 16 21.0 ta
## 17 20.8 ta
## 18 19.9 ta
## 19 21.1 ta
## 20 20.3 ta
names(df)=c("encogimiento","Trat")
df
## encogimiento Trat
## 1 17.2 tb
## 2 17.5 tb
## 3 18.6 tb
## 4 15.9 tb
## 5 16.4 tb
## 6 17.3 tb
## 7 16.8 tb
## 8 18.4 tb
## 9 16.7 tb
## 10 17.6 tb
## 11 21.4 ta
## 12 20.9 ta
## 13 19.8 ta
## 14 20.4 ta
## 15 20.6 ta
## 16 21.0 ta
## 17 20.8 ta
## 18 19.9 ta
## 19 21.1 ta
## 20 20.3 ta
boxplot(encogimiento~Trat,data=df,col=("brown"))
t.test(tb,ta)
##
## Welch Two Sample t-test
##
## data: tb and ta
## t = -10.797, df = 14.995, p-value = 1.811e-08
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -4.047267 -2.712733
## sample estimates:
## mean of x mean of y
## 17.24 20.62
var(tb)
## [1] 0.7093333
var(ta)
## [1] 0.2706667
var.test(tb,ta)
##
## F test to compare two variances
##
## data: tb and ta
## F = 2.6207, num df = 9, denom df = 9, p-value = 0.1674
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.6509422 10.5508812
## sample estimates:
## ratio of variances
## 2.62069
La H0: EncogimientoAltas = EncogimientoBajas La Ha: EncogimientoAltas ≠ EngogimientoBajas
Si calculamos esto en base a un error del 5% e intervalo de confianza del 95% obtenemos un intervalo de -4.047267 ≤ µD ≤ -2.712733
Las menores temperaturas segun el diagrama de cajas
S2 Temp baja = 0.7093333 S2 Temp alta = 0.2706667
La s2 de temp altas presenta menos varianzas lo que nos indica que las mediciones son mas constantes y hay menos alteraciones de encogimiento respecto a las temperaturas altas
No hay superposición de datos, ambos son totalmente distintos y observamos que a temperaturas bajas hay menor nivel de encogimiento y a temperaturas altas el nivel de encogimiento es mayor
Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación.
Tabla 3.11
df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/c3p11.csv")
df
## Spray Y
## 1 1 72
## 2 2 55
## 3 3 64
## 4 1 65
## 5 2 59
## 6 3 74
## 7 1 67
## 8 2 68
## 9 3 61
## 10 1 75
## 11 2 70
## 12 3 58
## 13 1 62
## 14 2 53
## 15 3 51
## 16 1 73
## 17 2 50
## 18 3 69
str(df)
## 'data.frame': 18 obs. of 2 variables:
## $ Spray: int 1 2 3 1 2 3 1 2 3 1 ...
## $ Y : int 72 55 64 65 59 74 67 68 61 75 ...
df$Spray=as.factor(df$Spray)
str(df)
## 'data.frame': 18 obs. of 2 variables:
## $ Spray: Factor w/ 3 levels "1","2","3": 1 2 3 1 2 3 1 2 3 1 ...
## $ Y : int 72 55 64 65 59 74 67 68 61 75 ...
boxplot(Y~Spray,data = df, col=("orange"))
modelo=aov(Y~Spray,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Spray 2 296.3 148.17 2.793 0.0931 .
## Residuals 15 795.7 53.04
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Spray, data = df)
##
## $Spray
## diff lwr upr p adj
## 2-1 -9.833333 -20.755528 1.088861 0.0808333
## 3-1 -6.166667 -17.088861 4.755528 0.3340612
## 3-2 3.666667 -7.255528 14.588861 0.6654850
plot(tk)
1-pf(2.793,2,15)
## [1] 0.09308821
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96797, p-value = 0.7589
library("car")
## Loading required package: carData
leveneTest(Y~Spray,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.5288 0.5999
## 15
plot(modelo$residuals)
abline(h=0)
plot(df$Spray,modelo$residuals)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
Modelo ANOVA DCA (Diseño Completamente al azar) es un solo factor a comparar con dos tratamientos
H0: µ1 = µ2 = µ3 = µ; no hay diferencias entre el uso de los spray HA: µi ≠ µj para algún i ≠ j; al menos uno de los spray muestra diferencia
Por la prueba de Tukey no encontramos diferencia ya que todas las p se encuentran mayor a 0.05
¿Hay algún spray mejor? Argumente su respuesta. ANOVA muestra F0=2.793 <Fα, k-1/N-k=3.682, no hay diferencia significativa entre un spray y otro
Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.
con IC 95% obtenemos los siguientses iC
diff lwr upr p adj 2-1 -9.833333 -20.755528 1.088861 0.0808333 3-1 -6.166667 -17.088861 4.755528 0.3340612 3-2 3.666667 -7.255528 14.588861 0.6654850
Observamos valores muy similares entre las cajas, a simple viste observamos que no hay diferencia y en el diagrama de tukey todas las diferencias de media tocan el 0 por lo que no hay diferencia entre ellas
f ) Verifique los supuestos de normalidad y de igual varianza entre las marcas.
Los datos se corroboran mediante prueba de Shapiro Wilk que arroja p-value = 0.7589. siendo p>0.05, y aceptamos asñi que los datos se distribuyen de manera normal y la prueba de levene p mayor a 0.05 (0.7589) por lo que las varianzas son iguales
En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla:
Tabla 3.12
df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/c3p12.csv")
df
## Trat Y
## 1 Control 213
## 2 Control 214
## 3 Control 204
## 4 Control 208
## 5 Control 212
## 6 Control 200
## 7 Control 207
## 8 T2 76
## 9 T2 85
## 10 T2 74
## 11 T2 78
## 12 T2 82
## 13 T2 75
## 14 T2 82
## 15 T3 57
## 16 T3 67
## 17 T3 55
## 18 T3 64
## 19 T3 61
## 20 T3 63
## 21 T3 63
## 22 T4 84
## 23 T4 82
## 24 T4 85
## 25 T4 92
## 26 T4 87
## 27 T4 79
## 28 T4 90
str(df)
## 'data.frame': 28 obs. of 2 variables:
## $ Trat: chr "Control" "Control" "Control" "Control" ...
## $ Y : int 213 214 204 208 212 200 207 76 85 74 ...
df$Trat=as.factor(df$Trat)
str(df)
## 'data.frame': 28 obs. of 2 variables:
## $ Trat: Factor w/ 4 levels "Control","T2",..: 1 1 1 1 1 1 1 2 2 2 ...
## $ Y : int 213 214 204 208 212 200 207 76 85 74 ...
boxplot(Y~Trat,data = df, main="comparacion del tiempo de coccion con/n diferentes tratamientos")
modelo=aov(Y~Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 3 95041 31680 1559 <2e-16 ***
## Residuals 24 488 20
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Trat, data = df)
##
## $Trat
## diff lwr upr p adj
## T2-Control -129.428571 -136.07568671 -122.78146 0.0000000
## T3-Control -146.857143 -153.50425813 -140.21003 0.0000000
## T4-Control -122.714286 -129.36140099 -116.06717 0.0000000
## T3-T2 -17.428571 -24.07568671 -10.78146 0.0000010
## T4-T2 6.714286 0.06717044 13.36140 0.0471059
## T4-T3 24.142857 17.49574187 30.78997 0.0000000
plot(tk, col=("purple"))
T3=c(57,67,55,64,61,63,63)
media=mean(T3)
1-pf(1559,3,24)
## [1] 0
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.95991, p-value = 0.3469
qqnorm(modelo$residuals)
qqline(modelo$residuals)
library("car")
leveneTest(Y~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.1631 0.9201
## 24
plot(modelo$residuals)
abline(h=0)
plot(df$Trat,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
Este experimento es completamente al azar, todas las corridas son aleatorias al realizarse en total N pruebas, éstas se corren al azar, así que los posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los tratamientos.
Temperatura, tipo de frijol, características del recipiente, calidad del agua y su cantidad. son factores que no se controlan pero que pueden causas una alteración
H0: µcontrol = µ2 = µ3 = µ4= µ5; la media de los tratamientos es igual HA: µi ≠ µj para algún i ≠ j; existe al menos 1 tratamiento con resultado diferente
Con valor de p=<2e-16, es menor a 0.05. Se rechaza H0, se puede concluir que existen por lo menos 2 tratamientos con resultados diferentes.
Al comparar los 3 tratamientos con el control, todos tienen efecto en disminuir el tiempo de cocción y el tratamiento 3 es el que presenta menor tiempo de cocción. , ninguna grñafica incluye el cero por lo que todos los tratamientos son diferentes segun tukey
el T3 de remojar con agua con sal común es el mejor. con un tiempo de cocción medio de 61,4
f ) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.
al ser utilizada mucha sal, puede tener un grave impacto en el sabor, y por otro lado y no menos importante en la salud del paciente, pudiendo empeorar problemas como la hipertensión.
Shapiro: p-valor = 0.3469, se acepta H0 con p-valor menor 0.05, podemos concluir que los datos proceden de una distribución normal
La prueba de Levene indica con un 95% de confianza que las varianzas son iguales, con una p-valor=0.9201 (p>0.05), se acepta H0 de que las varianzas son iguales
Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se someten a un envejecimiento acelerado durante 100 horas a determinada temperatura, y como variable de interés se mide la intensidad de corriente que circula entre dos puntos, cuyos valores aumentan con el deterioro. Se probaron 20 módulos repartidos de manera equitativamente en cinco temperaturas y los resultados obtenidos fueron los siguientes
Tabla 3.13
df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/Cap3_Prob13.csv")
df
## Trat Corriente
## 1 20 15
## 2 20 18
## 3 20 13
## 4 20 12
## 5 40 17
## 6 40 21
## 7 40 11
## 8 40 16
## 9 60 23
## 10 60 19
## 11 60 25
## 12 60 22
## 13 80 28
## 14 80 32
## 15 80 34
## 16 80 31
## 17 100 45
## 18 100 51
## 19 100 57
## 20 100 48
str(df)
## 'data.frame': 20 obs. of 2 variables:
## $ Trat : int 20 20 20 20 40 40 40 40 60 60 ...
## $ Corriente: int 15 18 13 12 17 21 11 16 23 19 ...
df$Trat=factor(df$Trat)
str(df)
## 'data.frame': 20 obs. of 2 variables:
## $ Trat : Factor w/ 5 levels "20","40","60",..: 1 1 1 1 2 2 2 2 3 3 ...
## $ Corriente: int 15 18 13 12 17 21 11 16 23 19 ...
boxplot(Corriente~Trat,data=df)
modelo=aov(Corriente~Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 4 3412 853.0 68.06 1.96e-09 ***
## Residuals 15 188 12.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Corriente ~ Trat, data = df)
##
## $Trat
## diff lwr upr p adj
## 40-20 1.75 -5.98009744 9.480097 0.9535481
## 60-20 7.75 0.01990256 15.480097 0.0492648
## 80-20 16.75 9.01990256 24.480097 0.0000612
## 100-20 35.75 28.01990256 43.480097 0.0000000
## 60-40 6.00 -1.73009744 13.730097 0.1696046
## 80-40 15.00 7.26990256 22.730097 0.0002059
## 100-40 34.00 26.26990256 41.730097 0.0000000
## 80-60 9.00 1.26990256 16.730097 0.0190664
## 100-60 28.00 20.26990256 35.730097 0.0000001
## 100-80 19.00 11.26990256 26.730097 0.0000141
plot(tk,col="green")
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.97113, p-value = 0.7785
library("car")
leveneTest(Corriente~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.6808 0.616
## 15
plot(modelo$residuals)
abline(h=0)
plot(df$Trat,modelo$residuals)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
Utilizamos ANOVA Ho: m20°C = m40°C = m60°C = m80°C= m; la intensidad de corriente no se altera según la temperatura HA: mi ≠ mj; hay diferencia en la intensidad de corriente en al menos una medición.
H0: La varianza de los grupos son iguales. Ha: La varianza de los grupos son diferentes.
Levene nos dindica con un 95% de confianza que la p es mayor a 0.05 (0.616) y aceptamos la H0 de que las varianzas son iguales
La variabilidad de las intensidades de corriente es estadísticamente significativa a 80°C y 100°C.
En una empresa de manufactura se propone un tratamiento para reducir el porcentaje de productos defectuosos. Para validar esta propuesta se diseñó un experimento en el que se producía con o sin la propuesta de mejora. Cada corrida experimental consistió en producir un lote y la variable de respuesta es el porcentaje de producto defectuoso. Se hicieron 25 réplicas para cada tratamiento. Los datos obtenidos se muestran a continuación:
df=read.csv("https://raw.githubusercontent.com/vicentem19md/Cap3/main/c3p14.csv")
df
## Trat PPDef
## 1 ConTrat 5.3
## 2 ConTrat 2.2
## 3 ConTrat 4.0
## 4 ConTrat 1.1
## 5 ConTrat 4.0
## 6 ConTrat 2.0
## 7 ConTrat 4.0
## 8 ConTrat 3.0
## 9 ConTrat 2.6
## 10 ConTrat 3.1
## 11 ConTrat 2.1
## 12 ConTrat 2.1
## 13 ConTrat 5.1
## 14 ConTrat 1.2
## 15 ConTrat 4.1
## 16 ConTrat 3.3
## 17 ConTrat 4.1
## 18 ConTrat 2.1
## 19 ConTrat 3.2
## 20 ConTrat 4.0
## 21 ConTrat 5.1
## 22 ConTrat 2.0
## 23 ConTrat 2.2
## 24 ConTrat 3.0
## 25 ConTrat 4.1
## 26 SinTrat 8.0
## 27 SinTrat 8.7
## 28 SinTrat 13.2
## 29 SinTrat 11.3
## 30 SinTrat 7.2
## 31 SinTrat 4.5
## 32 SinTrat 8.2
## 33 SinTrat 6.6
## 34 SinTrat 9.1
## 35 SinTrat 9.2
## 36 SinTrat 6.7
## 37 SinTrat 10.2
## 38 SinTrat 12.2
## 39 SinTrat 10.6
## 40 SinTrat 16.3
## 41 SinTrat 13.3
## 42 SinTrat 9.2
## 43 SinTrat 5.2
## 44 SinTrat 6.4
## 45 SinTrat 6.2
## 46 SinTrat 7.2
## 47 SinTrat 8.0
## 48 SinTrat 17.2
## 49 SinTrat 4.8
## 50 SinTrat 12.3
str(df)
## 'data.frame': 50 obs. of 2 variables:
## $ Trat : chr "ConTrat" "ConTrat" "ConTrat" "ConTrat" ...
## $ PPDef: num 5.3 2.2 4 1.1 4 2 4 3 2.6 3.1 ...
df$Trat=as.factor(df$Trat)
boxplot(PPDef~Trat, data=df, col="yellow")
SinTrat=c(8.0,8.7,13.2,11.3,7.2,4.5,8.2,6.6,9.1,9.2,6.7,10.2,12.2,10.6,16.3,13.3,9.2,5.2,6.4,6.2,7.2,8.0,17.2,4.8,12.3)
media=mean(SinTrat)
modelo=aov(PPDef~Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 1 467.0 467.0 73.14 3.27e-11 ***
## Residuals 48 306.5 6.4
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = PPDef ~ Trat, data = df)
##
## $Trat
## diff lwr upr p adj
## SinTrat-ConTrat 6.112 4.675016 7.548984 0
plot(tk)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94382, p-value = 0.01913
qqnorm(modelo$residuals)
qqline(modelo$residuals)
library("car")
leveneTest(PPDef~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 12.969 0.0007491 ***
## 48
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(modelo$residuals)
abline(h=0)
plot(df$Trat,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
H0: mcontrat = msintrat = m HA: mi ≠ mj
Obtenemos una p menor a 0.05 (3.27e-11), rechazamos la H0, por lo que los tratamientos son distintos, sin embargo al comprobar los supuestos obtenemos que no se cumple la normalidad, varianza e independecia, estamos ante una prueba inválida o que necesita de otro tipo de análisis.
En promedio el error sin tratamientos es de 9.3%, y al aplicarle la reducción del 6.1% se espera un porcetaje de defectuosos con el nuevo tratamiento de 3.2% solamente
La reducción sobre el tratamiento es de 6.1%