PROBLEMA 1

Una joven, que acababa de seguir un curso de tres días en diseño experimental decidió intentar aplicar su conocimiento adquirido para analizar el efecto de los reactivos sobre la viscosidad de una mezcla de reacción. En primer momento detectó tres variables que podrían haber sido relevantes: eran las cantidades de tres reactivos (llamémoslos A, B y C). La formulación original era de 10 g de A, 4 g de B y 10 g de C. Decidió mantener este escenario experimental como punto de partida y para explorar sus alrededores. Dado que el número de experimentos posibles fue bastante limitado, decidió aplicar un Diseño Factorial 2^3, requiriendo un total de ocho experimentos.

df<-read.csv("C:\\Users\\usuario\\Downloads\\PARCIAL 1\\PROBLEMA 1.csv")
df
##    A   B  C    Y
## 1  9 3.6  9 51.8
## 2 11 3.6  9 51.6
## 3  9 4.4  9 51.0
## 4 11 4.4  9 42.4
## 5  9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7  9 4.4 11 52.0
## 8 11 4.4 11 50.0
df$A<-factor(df$A)
df$B<-factor(df$B)
df$C<-factor(df$C)
df$Y<-as.numeric(df$Y)
df
##    A   B  C    Y
## 1  9 3.6  9 51.8
## 2 11 3.6  9 51.6
## 3  9 4.4  9 51.0
## 4 11 4.4  9 42.4
## 5  9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7  9 4.4 11 52.0
## 8 11 4.4 11 50.0

HIPOTESIS

Tenemos que nuestras Ho, son: T = 0 B = 0 T*B = 0

Tenemos que nuestras Ha, son:

T diferentes de 0, para al menos una B diferentes de 0, para al menos una T*B diferentes de 0, para al menos un par

Modelo Estadístico

modelo<-lm(Y~A*B*C,data = df)
fit.aov<-aov(modelo)
summary(fit.aov)
##             Df Sum Sq Mean Sq
## A            1  25.92   25.92
## B            1   2.88    2.88
## C            1   0.50    0.50
## A:B          1   5.78    5.78
## A:C          1   1.28    1.28
## B:C          1  28.88   28.88
## A:B:C        1  12.50   12.50

R= Al realizar el modelo no muestra la significancia en P, por lo que realizare un segundo modelo. Considerando el error del problema es que el diseño 2^3 requiere un numero de experimentos(Y) de al menos el doble de resultados que tenemos en este problema.

Modelo 2

modelo2<-lm(Y~A+B+C+A:B+B:C+C:A,data = df)
anova<-aov(modelo2)
summary(anova)
##             Df Sum Sq Mean Sq F value Pr(>F)
## A            1  25.92   25.92   2.074  0.386
## B            1   2.88    2.88   0.230  0.715
## C            1   0.50    0.50   0.040  0.874
## A:B          1   5.78    5.78   0.462  0.620
## B:C          1  28.88   28.88   2.310  0.370
## A:C          1   1.28    1.28   0.102  0.803
## Residuals    1  12.50   12.50

R= Debido a que los P para cada factor es mayor que 0.05, no son significativos.

VISUALIZACION DE LOS DATOS

Prueba de Normalidad de los residuales

qqnorm(anova$residuals)
qqline(anova$residuals)

shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.66466, p-value = 0.0008917

R= No es normal ya que p-value es menor que alpha = 0.05. Se rechaza la Ho, se observa en el grafico qqplot y el shapiro nos lo confirma.

Prueba de igualdad de varianza: Homoscedasticidad

HIPOTESIS

Ho: Todas las varianzas son iguales Ha: Al menos un par de varianzas son diferentes entre si.

library(car)
## Loading required package: carData
leveneTest(Y~A,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  1  6.1375 0.04797 *
##        6                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
df
##    A   B  C    Y
## 1  9 3.6  9 51.8
## 2 11 3.6  9 51.6
## 3  9 4.4  9 51.0
## 4 11 4.4  9 42.4
## 5  9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7  9 4.4 11 52.0
## 8 11 4.4 11 50.0
leveneTest(Y~B,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.2416 0.6405
##        6
df
##    A   B  C    Y
## 1  9 3.6  9 51.8
## 2 11 3.6  9 51.6
## 3  9 4.4  9 51.0
## 4 11 4.4  9 42.4
## 5  9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7  9 4.4 11 52.0
## 8 11 4.4 11 50.0
leveneTest(Y~C,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.2317 0.6474
##        6
df
##    A   B  C    Y
## 1  9 3.6  9 51.8
## 2 11 3.6  9 51.6
## 3  9 4.4  9 51.0
## 4 11 4.4  9 42.4
## 5  9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7  9 4.4 11 52.0
## 8 11 4.4 11 50.0

R= Con la prueba de levene para B y C, ambos la p>0.05, lo que nos indica que hay varianzas constantes, a diferencia de A que aunque se encuentra el valor 0.047 es aún menor al p(0.05) su varianza no es constante.

Prueba gráfica de independencia de los Residuales

plot(anova$residuals)
abline(h=0)

R= Al observar la gráfica de residuos contra factores, se aprecia que hay dispersión a los extremos entre el positivo y el negativo.

par(mfrow=c(1,2))
interaction.plot(df$A,df$B,df$Y)
interaction.plot(df$B,df$A,df$Y)

interaction.plot(df$A,df$C,df$Y)
interaction.plot(df$C,df$A,df$Y)

interaction.plot(df$C,df$B,df$Y)
interaction.plot(df$B,df$C,df$Y)

R= Algunas de las interacciones entre los factores A, B y C. En el primer par de gráficos de interacción se aprecia que el reactivo B con 4.4 g y el reactivo A con 9 g brindan mejor viscosidad. En el segundo par de gráficos de interacción se aprecia que el reactivo C con A interactuan y que el reactivo C con 9 g y el reactivo A con 9 g brindan mejor viscosidad. En el tercer par de gráficos hay interacción entre reactivo B con C y que el reactivo B con 3.6 g brinda mejor viscosidad.

CONCLUSION

Para los efectos de interacción ABC, no es posible ya que se requiere según mi análisis mayor replica de Y(viscosidad); No hay influencia de B ni C, dado que el valor de p es mayor que p(0.05) y se encuentra activo en menor medida el efecto de A.

PROBLEMA 2

Se desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas: A y B. La tabla muestra la reducción conseguida después de dos meses.

A<-c(51.3,39.4,26.3,39.0,48.1,34.2,69.8,31.3,45.2,46.4)
B<-c(29.6,47.0,25.9,13.0,33.1,22.1,34.1,19.5,43.8,24.9)
var.test(A,B,alternative = c("greater"))
## 
##  F test to compare two variances
## 
## data:  A and B
## F = 1.3441, num df = 9, denom df = 9, p-value = 0.3333
## alternative hypothesis: true ratio of variances is greater than 1
## 95 percent confidence interval:
##  0.422818      Inf
## sample estimates:
## ratio of variances 
##           1.344093

HOMOGENEIDAD DE LAS VARIANZAS (F test)

HIPOTESIS

Ho: var1=var2 Ha: var1 diferente a var2

R = El valor de p es mayor que a nuestro nivel de significanza de 0.05, razón por la que se acepta la Ho, y concluimos que las varianzas son relativamente similares. Como Hipótesis alternativa: la verdadera razón de varianzas es mayor que 1.

En vista de esto, aplicare una prueba de T pareada.

Verificamos que los datos tienen distribución normal

shapiro.test(A)
## 
##  Shapiro-Wilk normality test
## 
## data:  A
## W = 0.94064, p-value = 0.5602
shapiro.test(B)
## 
##  Shapiro-Wilk normality test
## 
## data:  B
## W = 0.96974, p-value = 0.8884
shapiro.test(A*B)           
## 
##  Shapiro-Wilk normality test
## 
## data:  A * B
## W = 0.9261, p-value = 0.4106
t.test(A,B,conf.level = 0.95,var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  A and B
## t = 2.6965, df = 18, p-value = 0.01476
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   3.048013 24.551987
## sample estimates:
## mean of x mean of y 
##      43.1      29.3

HIPOTESIS

Ho: uA = uB Ha: uA no es = uB

R = El p es menor que 0.05, por lo que se rechaza la Ho. La hipótsis alternativa: la verdadera diferencia de medias no es, igual a 0. Las medias son significativamente diferentes.

CONCLUSION

La dieta B en consecuencia estaria brindando a los pacientes una mayor reducción del colesterol en sangre

PROBLEMA 3

Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas.

A<-c(229.1,253.7,241.3,254.7,237.2,241.3)
B<-c(233.4,233.0,219.2,200.0,224.3,202.0)
C<-c(211.1,223.1,217.5,211.8,207.6,213.7)
D<-c(270.4,248.6,230.0,250.7,230.0,245.8)

df<-data.frame(A=A,B=B,C=C,D=D)

df<-stack(df)
names(df)<-c("Y","Trat")
str(df)
## 'data.frame':    24 obs. of  2 variables:
##  $ Y   : num  229 254 241 255 237 ...
##  $ Trat: Factor w/ 4 levels "A","B","C","D": 1 1 1 1 1 1 2 2 2 2 ...

HIPOTESIS

Ho las medias de las semillas A,B,C y D son iguales, (Ho: u1=u2=u3=u4) H1 al menos un par de las medias de las semillas A,B,C y D son diferentes

#VISUALIZACION DE GRAFICOS DE DATOS

boxplot(Y~Trat,data=df)

R= Visualizamos que no hay valores atípicos en los datos del los conjuntos de datos de cada semilla.

Análisis de Varianza ANOVA

modelo<-aov(Y~Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Trat         3   4796  1598.5   11.22 0.000156 ***
## Residuals   20   2850   142.5                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R= Al aplicar el ANOVA nos indica que p es menor al p(0.05), por lo que se rechaza la Ho y aceptamos que hay diferencia significativa entre las medias de las semillas.

Prueba de Tukey HSD

¿Cuáles son los pares de medias que son diferentes y cuáles son semejantes?

tk<-TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Trat, data = df)
## 
## $Trat
##           diff       lwr       upr     p adj
## B-A -24.233333 -43.52416 -4.942506 0.0107428
## C-A -28.750000 -48.04083 -9.459173 0.0024478
## D-A   3.033333 -16.25749 22.324160 0.9707614
## C-B  -4.516667 -23.80749 14.774160 0.9124326
## D-B  27.266667   7.97584 46.557494 0.0039938
## D-C  31.783333  12.49251 51.074160 0.0008966

R = Al ver los resultados de p adj cuando el valor es <p(0.05) en el caso de las semillas (B-A),(C-A),(D-B) y (D-C) se rechaza la Ho y son diferentes. Y estariamos aceptando la Ho para los tratamientos (D-A) y (C-B) puesto que su p adj es >p(0.05)

plot(tk)

Prueba de Normalidad

Hipotesis Ho : Los datos proceden de una distribución normal. Ha : Los datos no proceden de una distribución normal.

qqnorm(modelo$residuals)
qqline(modelo$residuals)

R= El gráfico muestra normalidad de los datos.

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.96731, p-value = 0.6012

R= Hay normalidad ya que p-value es mayor que alpha = 0.05. Se acepta la Ho, en el grafico qqplot se observa el comportamiento normal, y la prueba de shapiro nos confirma.

Prueba de homogeneidad de varianza (Comprobación de la homocedasticidad)

Ho: Todas las varianzas son iguales. Ha: Al menos un par de varianzas son diferentes entre si.

library(car)
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.3745 0.2793
##       20

R= La prueba de levene nos da como resultado que p es >0.05, por lo que aceptamos la Ho, las varianzas son iguales.

Pruebas de independencia

plot(modelo$residuals)
abline(h=0)

plot(df$Trat,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

CONCLUSION

El rendimiento de las semillas que realmente difieren son el B y el A, el C y el A, el D y el B, más el D y el C, finalmente, la semilla C es la que presenta menor rendimiento y la semilla D es la que presenta mayor rendimiento.

PROBLEMA 4

Se ha realizado un experimento para medir el tiempo de combustión de unas muestras de cuatro fibras diferentes. En la tabla siguiente se proporcionan los resultados obtenidos (en segundos). Haga un análisis de anova de estos resultados.

F1<-c(17.8,16.2,17.5,17.4,15.0)
F2<-c(11.2,11.4,15.8,10.0,10.4)
F3<-c(11.8,11.0,10.0,9.2,9.2)
F4<-c(14.9,10.8,12.8,10.7,10.7)

df<-data.frame(F1=F1,F2=F2,F3=F3,F4=F4)

df<-stack(df)
names(df)<-c("Y","Trat")
str(df)
## 'data.frame':    20 obs. of  2 variables:
##  $ Y   : num  17.8 16.2 17.5 17.4 15 11.2 11.4 15.8 10 10.4 ...
##  $ Trat: Factor w/ 4 levels "F1","F2","F3",..: 1 1 1 1 1 2 2 2 2 2 ...

HIPOTESIS

Ho las medias de F1,F2,F3 y F4 son iguales, (Ho: u1=u2=u3=u4) H1 al menos una de las medias de F1,F2,F3 y F4 es diferente.

Ho Todas las fibras son iguales Ha al menos una de las fibras es distinta

#VISUALIZACION DE GRAFICOS DE DATOS

boxplot(Y~Trat,data=df)

R= En el gráfico podemos visualizar que el mayor tiempo de combustión, significativamente distinto a los anteriores: F1. En media la F3 es la que tiene menor tiempo de combustión, pero no significativamente distinta a la F2 y F4.

Análisis de Varianza ANOVA

modelo<-aov(Y~Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Trat         3 120.50   40.17   13.89 0.000102 ***
## Residuals   16  46.26    2.89                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R= Al aplicar el ANOVA nos indica que p es menor al p(0.05), por lo que se rechaza la Ho (de que todas las fibras sean iguales) y aceptamos la Ha que hay diferencia significativa entre las fibras (alguna es distinta).

Prueba de Tukey HSD

tk<-TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Trat, data = df)
## 
## $Trat
##        diff      lwr      upr     p adj
## F2-F1 -5.02 -8.09676 -1.94324 0.0013227
## F3-F1 -6.54 -9.61676 -3.46324 0.0000851
## F4-F1 -4.80 -7.87676 -1.72324 0.0019981
## F3-F2 -1.52 -4.59676  1.55676 0.5094118
## F4-F2  0.22 -2.85676  3.29676 0.9968426
## F4-F3  1.74 -1.33676  4.81676 0.3968476

R = Al ver los resultados de p adj cuando el valor es <p(0.05) en el caso de los tratamientos (F2-F1),(F3-F1) y (F4-F1) se rechaza la Ho y son diferentes. Y estariamos aceptando la Ho para los tratamientos (F3-F2), (F4-F2) y (F4-F3) puesto que su p adj es >p(0.05).

plot(tk)

Prueba de Normalidad

Hipotesis Ho : Los datos proceden de una distribución normal. Ha : Los datos no proceden de una distribución normal.

qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.88926, p-value = 0.02606

R=

Prueba de homogeneidad de varianza

(Comprobación de la homocedasticidad)

library(car)
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1788 0.9092
##       16

R=

Pruebas de independencia

plot(modelo$residuals)
abline(h=0)

plot(df$Trat,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

CONCLUSION

PROBLEMA 5

Se ha medido el tiempo hasta la descarga de dos marcas de pilas y se desea contrastar si en base a esta variable las dos marcas son distintas. Para lo cual definire E a Energizer y U a Ultracell. Realice el análisis de ANOVA correspondiente.

E<-c(1.40,1.39,1.35,1.38,1.35,1.36,1.31,1.26,1.37)
U<-c(1.56,1.54,1.53,1.54,1.54,1.47,1.49,1.54,1.50)
var.test(E,U,alternative = c("greater"))
## 
##  F test to compare two variances
## 
## data:  E and U
## F = 2.1651, num df = 8, denom df = 8, p-value = 0.1476
## alternative hypothesis: true ratio of variances is greater than 1
## 95 percent confidence interval:
##  0.6297311       Inf
## sample estimates:
## ratio of variances 
##           2.165079

R = El valor de p es mayor que 0.05, razón por la que se rechaza la Ho. Como Hipótesis alternativa: la verdadera razón de varianzas es mayor que 1. En vista de esto, aplicare una prueba de T no pareada.

t.test(E,U,conf.level = 0.95,var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  E and U
## t = -9.7545, df = 16, p-value = 3.878e-08
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.2082981 -0.1339241
## sample estimates:
## mean of x mean of y 
##  1.352222  1.523333

HIPOTESIS

Ho: uA = uB Ha: uA no es = uB

R = El p es menor que 0.05, por lo que se rechaza la Ho. La hipótsis alternativa: la verdadera diferencia de medias no es, igual a 0.

boxplot(E,U)

R= Al observar el gráfico para la pila E, hay un valor sospechoso que se encuentra fuera de la media.

CONCLUSION

PROBLEMA 6

Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un químico hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos han sido:

L1<-c(23.46,23.48,23.56,23.39,23.40)
L2<-c(23.59,23.46,23.42,23.49,23.50)
L3<-c(23.51,23.64,23.46,23.52,23.49)
L4<-c(23.28,23.40,23.37,23.46,23.29)
L5<-c(23.29,23.46,23.37,23.32,23.38)

df<-data.frame(L1=L1,L2=L2,L3=L3,L4=L4,L5=L5)

df<-stack(df)
names(df)<-c("Y","Trat")
str(df)
## 'data.frame':    25 obs. of  2 variables:
##  $ Y   : num  23.5 23.5 23.6 23.4 23.4 ...
##  $ Trat: Factor w/ 5 levels "L1","L2","L3",..: 1 1 1 1 1 2 2 2 2 2 ...

HIPOTESIS

Ho las medias de L1,L2,L3,L4 y L5 son iguales, (Ho: u1=u2=u3=u4) H1 al menos un par de medias de L1,L2,L3,L4 y L5 es diferente.

summary(df)
##        Y         Trat  
##  Min.   :23.28   L1:5  
##  1st Qu.:23.38   L2:5  
##  Median :23.46   L3:5  
##  Mean   :23.44   L4:5  
##  3rd Qu.:23.49   L5:5  
##  Max.   :23.64

#VISUALIZACION DE GRAFICOS DE DATOS

boxplot(Y~Trat,data=df)

R= el gráfico nos muestra que el lote 2 y Lote 3, presentan cada uno al menos (1) un dato discordante del resto de los obtenidos.

Análisis de Varianza ANOVA

modelo<-aov(Y~Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Trat         4 0.1113 0.02782   5.945 0.00255 **
## Residuals   20 0.0936 0.00468                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R= Al aplicar el ANOVA nos indica que p es menor al p(0.05), por lo que se rechaza la Ho y aceptamos que hay diferencia significativa entre al menos un par de medias. Al menos un par de lotes son diferentes.

Prueba de Tukey HSD

¿Cuáles son los pares de medias que son diferentes y cuáles son semejantes? Para esto se realiza una prueba de Tukey.

tk<-TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Trat, data = df)
## 
## $Trat
##         diff         lwr          upr     p adj
## L2-L1  0.034 -0.09546992  0.163469919 0.9317655
## L3-L1  0.066 -0.06346992  0.195469919 0.5588335
## L4-L1 -0.098 -0.22746992  0.031469919 0.1973481
## L5-L1 -0.094 -0.22346992  0.035469919 0.2301147
## L3-L2  0.032 -0.09746992  0.161469919 0.9444731
## L4-L2 -0.132 -0.26146992 -0.002530081 0.0443369
## L5-L2 -0.128 -0.25746992  0.001469919 0.0535881
## L4-L3 -0.164 -0.29346992 -0.034530081 0.0089982
## L5-L3 -0.160 -0.28946992 -0.030530081 0.0110449
## L5-L4  0.004 -0.12546992  0.133469919 0.9999819

R = Al ver los resultados de p adj cuando el valor es <p(0.05) en el caso de los lotes (L4-L2),(L4-L3) y (L5-L3) se rechaza la Ho y son significativamente diferentes. Y estariamos aceptando la Ho para los tratamientos (L2-L1),(L3-L1), (L4-L1), (L5-L1), (L3-L2), (L5-L2) y (L5-L4) puesto que su p adj es >p(0.05).

plot(tk)

Prueba de Normalidad

Hipotesis Ho : Los datos proceden de una distribución normal. Ha : Los datos no proceden de una distribución normal.

qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.90316, p-value = 0.02151

R= No es normal ya que p-value es menor que alpha = 0.05. Se rechaza la Ho, en el grafico qqplot se observa el comportamiento anormal, en los extremos hay valores que se dispersan y la prueba de shapiro nos confirma.

Prueba de homogeneidad de varianza (Comprobación de la homocedasticidad)

Ho: Todas las varianzas son iguales. Ha: Al menos un par de varianzas son diferentes entre si.

library(car)
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.1186 0.9743
##       20

R= La prueba de levene nos da como resultado que p es >0.05, por lo que aceptamos la Ho, las varianzas son iguales.

Pruebas de independencia

plot(modelo$residuals)
abline(h=0)

R= Este gráfico no muestra tendencia alguna en los residuales, con respecto al número de hilera o fila (suponiendo que la fila indica la secuencia temporal en la que se colectan los datos), lo que demuestra que se cumple el supuesto de independencia.

plot(df$Trat,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

R= Este gráfico de residuales no muestra algún patrón que ponga en duda el cumplimiento del supuesto de normalidad y de homogeneidad de varianzas, ya que no hay tendencias de valores positivos o negativos, no hay “curvaturas” ni tampoco se presentan “embudos” en los datos.

CONCLUSION

Los lotes que realmente difieren son el 5 y el 3, el 5 y el 2, y el 4 y el 3, finalmente, el lote 5 es el que menos contenido de calcio tiene y el lote 3 es el que presenta mayor contenido de calcio.

PROBLEMA 7

Se analiza el efecto de tres venenos y cuatro antídotos en el tiempo de supervivencia de unas ratas. A partir de los siguientes resultados, realice un análisis de anova.

Y<-c(0.31,0.45,0.46,0.43,0.82,1.10,0.88,0.72,0.43,0.45,0.63,0.72,0.45,0.71,0.66,0.62,0.36,0.29,0.40,0.23,0.92,0.61,0.49,1.24,0.44,0.35,0.31,0.40,0.56,1.02,0.71,0.38,0.22,0.21,0.18,0.23,0.30,0.37,0.38,0.29,0.23,0.25,0.24,0.22,0.30,0.36,0.31,0.33)

Es un modelo con dos factores: el veneno (con tres niveles) y el antídoto (con cuatro niveles). La variable que va a medir las diferencias entre los tratamientos es el tiempo que sobreviven los animales. Se combinan todos los niveles de los dos factores por lo que tenemos en total doce tratamientos.

Variable respuesta: Tiempo de supervivencia

Factor: Tipo de veneno que tiene tres niveles. Es un factor de efectos fijos ya que viene decidido qué niveles concretos se van a utilizar.

Factor: Tipo de antídoto que tiene cuatro niveles. Es un factor de efectos fijos ya que viene decidido qué niveles concretos se van a utilizar. Tamaño del experimento: Número total de observaciones (48).

library(lme4)
## Loading required package: Matrix
Venenos<-rep(1:3,each=16)
Antídoto<-rep(1:4,each=4)
df<-data.frame(Venenos=as.factor(Venenos),Antídoto=as.factor(Antídoto),Y)
modelo<-lmer(Y~(1|Venenos)+(1|Antídoto)+(1|Venenos:Antídoto),data=df)
summary(modelo)
## Linear mixed model fit by REML ['lmerMod']
## Formula: Y ~ (1 | Venenos) + (1 | Antídoto) + (1 | Venenos:Antídoto)
##    Data: df
## 
## REML criterion at convergence: -24.4
## 
## Scaled residuals: 
##     Min      1Q  Median      3Q     Max 
## -1.8252 -0.5137 -0.0265  0.2277  3.2489 
## 
## Random effects:
##  Groups           Name        Variance Std.Dev.
##  Venenos:Antídoto (Intercept) 0.004846 0.06961 
##  Antídoto         (Intercept) 0.022349 0.14950 
##  Venenos          (Intercept) 0.029361 0.17135 
##  Residual                     0.021848 0.14781 
## Number of obs: 48, groups:  Venenos:Antídoto, 12; Antídoto, 4; Venenos, 3
## 
## Fixed effects:
##             Estimate Std. Error t value
## (Intercept)   0.4785     0.1274   3.756
with(df, interaction.plot(x.factor = Venenos, trace.factor = Antídoto, 
                              response = Y))

modelo1<-lm(Y~Venenos*Antídoto,data=df)
fit<-aov(modelo1)
summary(fit)
##                  Df Sum Sq Mean Sq F value   Pr(>F)    
## Venenos           2 1.0220  0.5110  23.390 3.10e-07 ***
## Antídoto          3 0.9283  0.3094  14.162 2.97e-06 ***
## Venenos:Antídoto  6 0.2474  0.0412   1.887     0.11    
## Residuals        36 0.7865  0.0218                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
qqnorm(modelo1$residuals)
qqline(modelo1$residuals)

shapiro.test(modelo1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo1$residuals
## W = 0.91113, p-value = 0.001467
plot(modelo1$residuals)
abline(h=0)

plot(df$Venenos,modelo1$residuals)
abline(h=0)

plot(modelo1$fitted.values,modelo1$residuals)
abline(h=0)

CONCLUSION

PROBLEMA 8

Se ha realizado un experimento para estudiar el efecto de la temperatura (T) y tiempo de exposición (E) sobre la cantidad absorbida de un compuesto químico por un material sumergido en él. En el estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiempos de exposición (E1, E2, E3): cada tratamiento se ha replicado tres veces.

Y<-c(35.5,29.7,31.5,91.2,100.7,82.4,70.1,64.1,70.1,52.5,53.3,55.0,71.0,77.0,75.6,79.4,77.7,75.1,85.9,85.2,80.2,87.0,86.1,88.1,83.0,87.0,78.5)
library(lme4)
Tiempos<-rep(1:3,each=9)
Temperaturas<-rep(1:3,each=3)
df<-data.frame(Tiempos=as.factor(Tiempos),Temperaturas=as.factor(Temperaturas),Y)
model<-lmer(Y~(1|Tiempos)+(1|Temperaturas)+(1|Tiempos:Temperaturas),data=df)
summary(model)
## Linear mixed model fit by REML ['lmerMod']
## Formula: Y ~ (1 | Tiempos) + (1 | Temperaturas) + (1 | Tiempos:Temperaturas)
##    Data: df
## 
## REML criterion at convergence: 182.7
## 
## Scaled residuals: 
##      Min       1Q   Median       3Q      Max 
## -2.12877 -0.44155  0.06328  0.46906  2.36129 
## 
## Random effects:
##  Groups               Name        Variance Std.Dev.
##  Tiempos:Temperaturas (Intercept) 219.83   14.827  
##  Temperaturas         (Intercept) 128.97   11.356  
##  Tiempos              (Intercept)  42.25    6.500  
##  Residual                          16.61    4.076  
## Number of obs: 27, groups:  
## Tiempos:Temperaturas, 9; Temperaturas, 3; Tiempos, 3
## 
## Fixed effects:
##             Estimate Std. Error t value
## (Intercept)   72.330      9.062   7.982
with(df, interaction.plot(x.factor = Tiempos, trace.factor = Temperaturas, 
                              response = Y))

with(df, interaction.plot(x.factor = Temperaturas, trace.factor = Tiempos, 
                              response = Y))

model1<-lm(Y~Tiempos*Temperaturas,data=df)
fit<-aov(model1)
summary(fit)
##                      Df Sum Sq Mean Sq F value   Pr(>F)    
## Tiempos               2   2113  1056.3   63.59 6.92e-09 ***
## Temperaturas          2   3674  1836.8  110.58 7.75e-11 ***
## Tiempos:Temperaturas  4   2704   676.1   40.70 8.74e-09 ***
## Residuals            18    299    16.6                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

CONCLUSION