Una joven, que acababa de seguir un curso de tres días en diseño experimental decidió intentar aplicar su conocimiento adquirido para analizar el efecto de los reactivos sobre la viscosidad de una mezcla de reacción. En primer momento detectó tres variables que podrían haber sido relevantes: eran las cantidades de tres reactivos (llamémoslos A, B y C). La formulación original era de 10 g de A, 4 g de B y 10 g de C. Decidió mantener este escenario experimental como punto de partida y para explorar sus alrededores. Dado que el número de experimentos posibles fue bastante limitado, decidió aplicar un Diseño Factorial 2^3, requiriendo un total de ocho experimentos.
df<-read.csv("C:\\Users\\usuario\\Downloads\\PARCIAL 1\\PROBLEMA 1.csv")
df
## A B C Y
## 1 9 3.6 9 51.8
## 2 11 3.6 9 51.6
## 3 9 4.4 9 51.0
## 4 11 4.4 9 42.4
## 5 9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7 9 4.4 11 52.0
## 8 11 4.4 11 50.0
df$A<-factor(df$A)
df$B<-factor(df$B)
df$C<-factor(df$C)
df$Y<-as.numeric(df$Y)
df
## A B C Y
## 1 9 3.6 9 51.8
## 2 11 3.6 9 51.6
## 3 9 4.4 9 51.0
## 4 11 4.4 9 42.4
## 5 9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7 9 4.4 11 52.0
## 8 11 4.4 11 50.0
Tenemos que nuestras Ho, son: T = 0 B = 0 T*B = 0
Tenemos que nuestras Ha, son:
T diferentes de 0, para al menos una B diferentes de 0, para al menos una T*B diferentes de 0, para al menos un par
modelo<-lm(Y~A*B*C,data = df)
fit.aov<-aov(modelo)
summary(fit.aov)
## Df Sum Sq Mean Sq
## A 1 25.92 25.92
## B 1 2.88 2.88
## C 1 0.50 0.50
## A:B 1 5.78 5.78
## A:C 1 1.28 1.28
## B:C 1 28.88 28.88
## A:B:C 1 12.50 12.50
R= Al realizar el modelo no muestra la significancia en P, por lo que realizare un segundo modelo. Considerando el error del problema es que el diseño 2^3 requiere un numero de experimentos(Y) de al menos el doble de resultados que tenemos en este problema.
modelo2<-lm(Y~A+B+C+A:B+B:C+C:A,data = df)
anova<-aov(modelo2)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 25.92 25.92 2.074 0.386
## B 1 2.88 2.88 0.230 0.715
## C 1 0.50 0.50 0.040 0.874
## A:B 1 5.78 5.78 0.462 0.620
## B:C 1 28.88 28.88 2.310 0.370
## A:C 1 1.28 1.28 0.102 0.803
## Residuals 1 12.50 12.50
R= Debido a que los P para cada factor es mayor que 0.05, no son significativos.
qqnorm(anova$residuals)
qqline(anova$residuals)
shapiro.test(anova$residuals)
##
## Shapiro-Wilk normality test
##
## data: anova$residuals
## W = 0.66466, p-value = 0.0008917
R= No es normal ya que p-value es menor que alpha = 0.05. Se rechaza la Ho, se observa en el grafico qqplot y el shapiro nos lo confirma.
HIPOTESIS
Ho: Todas las varianzas son iguales Ha: Al menos un par de varianzas son diferentes entre si.
library(car)
## Loading required package: carData
leveneTest(Y~A,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 6.1375 0.04797 *
## 6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
df
## A B C Y
## 1 9 3.6 9 51.8
## 2 11 3.6 9 51.6
## 3 9 4.4 9 51.0
## 4 11 4.4 9 42.4
## 5 9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7 9 4.4 11 52.0
## 8 11 4.4 11 50.0
leveneTest(Y~B,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.2416 0.6405
## 6
df
## A B C Y
## 1 9 3.6 9 51.8
## 2 11 3.6 9 51.6
## 3 9 4.4 9 51.0
## 4 11 4.4 9 42.4
## 5 9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7 9 4.4 11 52.0
## 8 11 4.4 11 50.0
leveneTest(Y~C,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.2317 0.6474
## 6
df
## A B C Y
## 1 9 3.6 9 51.8
## 2 11 3.6 9 51.6
## 3 9 4.4 9 51.0
## 4 11 4.4 9 42.4
## 5 9 3.6 11 50.2
## 6 11 3.6 11 46.6
## 7 9 4.4 11 52.0
## 8 11 4.4 11 50.0
R= Con la prueba de levene para B y C, ambos la p>0.05, lo que nos indica que hay varianzas constantes, a diferencia de A que aunque se encuentra el valor 0.047 es aún menor al p(0.05) su varianza no es constante.
plot(anova$residuals)
abline(h=0)
R= Al observar la gráfica de residuos contra factores, se aprecia que hay dispersión a los extremos entre el positivo y el negativo.
par(mfrow=c(1,2))
interaction.plot(df$A,df$B,df$Y)
interaction.plot(df$B,df$A,df$Y)
interaction.plot(df$A,df$C,df$Y)
interaction.plot(df$C,df$A,df$Y)
interaction.plot(df$C,df$B,df$Y)
interaction.plot(df$B,df$C,df$Y)
R= Algunas de las interacciones entre los factores A, B y C. En el primer par de gráficos de interacción se aprecia que el reactivo B con 4.4 g y el reactivo A con 9 g brindan mejor viscosidad. En el segundo par de gráficos de interacción se aprecia que el reactivo C con A interactuan y que el reactivo C con 9 g y el reactivo A con 9 g brindan mejor viscosidad. En el tercer par de gráficos hay interacción entre reactivo B con C y que el reactivo B con 3.6 g brinda mejor viscosidad.
Para los efectos de interacción ABC, no es posible ya que se requiere según mi análisis mayor replica de Y(viscosidad); No hay influencia de B ni C, dado que el valor de p es mayor que p(0.05) y se encuentra activo en menor medida el efecto de A.
Se desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas: A y B. La tabla muestra la reducción conseguida después de dos meses.
A<-c(51.3,39.4,26.3,39.0,48.1,34.2,69.8,31.3,45.2,46.4)
B<-c(29.6,47.0,25.9,13.0,33.1,22.1,34.1,19.5,43.8,24.9)
var.test(A,B,alternative = c("greater"))
##
## F test to compare two variances
##
## data: A and B
## F = 1.3441, num df = 9, denom df = 9, p-value = 0.3333
## alternative hypothesis: true ratio of variances is greater than 1
## 95 percent confidence interval:
## 0.422818 Inf
## sample estimates:
## ratio of variances
## 1.344093
HIPOTESIS
Ho: var1=var2 Ha: var1 diferente a var2
R = El valor de p es mayor que a nuestro nivel de significanza de 0.05, razón por la que se acepta la Ho, y concluimos que las varianzas son relativamente similares. Como Hipótesis alternativa: la verdadera razón de varianzas es mayor que 1.
En vista de esto, aplicare una prueba de T pareada.
shapiro.test(A)
##
## Shapiro-Wilk normality test
##
## data: A
## W = 0.94064, p-value = 0.5602
shapiro.test(B)
##
## Shapiro-Wilk normality test
##
## data: B
## W = 0.96974, p-value = 0.8884
shapiro.test(A*B)
##
## Shapiro-Wilk normality test
##
## data: A * B
## W = 0.9261, p-value = 0.4106
t.test(A,B,conf.level = 0.95,var.equal = TRUE)
##
## Two Sample t-test
##
## data: A and B
## t = 2.6965, df = 18, p-value = 0.01476
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.048013 24.551987
## sample estimates:
## mean of x mean of y
## 43.1 29.3
Ho: uA = uB Ha: uA no es = uB
R = El p es menor que 0.05, por lo que se rechaza la Ho. La hipótsis alternativa: la verdadera diferencia de medias no es, igual a 0. Las medias son significativamente diferentes.
La dieta B en consecuencia estaria brindando a los pacientes una mayor reducción del colesterol en sangre
Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas.
A<-c(229.1,253.7,241.3,254.7,237.2,241.3)
B<-c(233.4,233.0,219.2,200.0,224.3,202.0)
C<-c(211.1,223.1,217.5,211.8,207.6,213.7)
D<-c(270.4,248.6,230.0,250.7,230.0,245.8)
df<-data.frame(A=A,B=B,C=C,D=D)
df<-stack(df)
names(df)<-c("Y","Trat")
str(df)
## 'data.frame': 24 obs. of 2 variables:
## $ Y : num 229 254 241 255 237 ...
## $ Trat: Factor w/ 4 levels "A","B","C","D": 1 1 1 1 1 1 2 2 2 2 ...
Ho las medias de las semillas A,B,C y D son iguales, (Ho: u1=u2=u3=u4) H1 al menos un par de las medias de las semillas A,B,C y D son diferentes
#VISUALIZACION DE GRAFICOS DE DATOS
boxplot(Y~Trat,data=df)
R= Visualizamos que no hay valores atípicos en los datos del los conjuntos de datos de cada semilla.
modelo<-aov(Y~Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 3 4796 1598.5 11.22 0.000156 ***
## Residuals 20 2850 142.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R= Al aplicar el ANOVA nos indica que p es menor al p(0.05), por lo que se rechaza la Ho y aceptamos que hay diferencia significativa entre las medias de las semillas.
¿Cuáles son los pares de medias que son diferentes y cuáles son semejantes?
tk<-TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Trat, data = df)
##
## $Trat
## diff lwr upr p adj
## B-A -24.233333 -43.52416 -4.942506 0.0107428
## C-A -28.750000 -48.04083 -9.459173 0.0024478
## D-A 3.033333 -16.25749 22.324160 0.9707614
## C-B -4.516667 -23.80749 14.774160 0.9124326
## D-B 27.266667 7.97584 46.557494 0.0039938
## D-C 31.783333 12.49251 51.074160 0.0008966
R = Al ver los resultados de p adj cuando el valor es <p(0.05) en el caso de las semillas (B-A),(C-A),(D-B) y (D-C) se rechaza la Ho y son diferentes. Y estariamos aceptando la Ho para los tratamientos (D-A) y (C-B) puesto que su p adj es >p(0.05)
plot(tk)
Hipotesis Ho : Los datos proceden de una distribución normal. Ha : Los datos no proceden de una distribución normal.
qqnorm(modelo$residuals)
qqline(modelo$residuals)
R= El gráfico muestra normalidad de los datos.
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96731, p-value = 0.6012
R= Hay normalidad ya que p-value es mayor que alpha = 0.05. Se acepta la Ho, en el grafico qqplot se observa el comportamiento normal, y la prueba de shapiro nos confirma.
Ho: Todas las varianzas son iguales. Ha: Al menos un par de varianzas son diferentes entre si.
library(car)
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 1.3745 0.2793
## 20
R= La prueba de levene nos da como resultado que p es >0.05, por lo que aceptamos la Ho, las varianzas son iguales.
plot(modelo$residuals)
abline(h=0)
plot(df$Trat,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
El rendimiento de las semillas que realmente difieren son el B y el A, el C y el A, el D y el B, más el D y el C, finalmente, la semilla C es la que presenta menor rendimiento y la semilla D es la que presenta mayor rendimiento.
Se ha realizado un experimento para medir el tiempo de combustión de unas muestras de cuatro fibras diferentes. En la tabla siguiente se proporcionan los resultados obtenidos (en segundos). Haga un análisis de anova de estos resultados.
F1<-c(17.8,16.2,17.5,17.4,15.0)
F2<-c(11.2,11.4,15.8,10.0,10.4)
F3<-c(11.8,11.0,10.0,9.2,9.2)
F4<-c(14.9,10.8,12.8,10.7,10.7)
df<-data.frame(F1=F1,F2=F2,F3=F3,F4=F4)
df<-stack(df)
names(df)<-c("Y","Trat")
str(df)
## 'data.frame': 20 obs. of 2 variables:
## $ Y : num 17.8 16.2 17.5 17.4 15 11.2 11.4 15.8 10 10.4 ...
## $ Trat: Factor w/ 4 levels "F1","F2","F3",..: 1 1 1 1 1 2 2 2 2 2 ...
Ho las medias de F1,F2,F3 y F4 son iguales, (Ho: u1=u2=u3=u4) H1 al menos una de las medias de F1,F2,F3 y F4 es diferente.
Ho Todas las fibras son iguales Ha al menos una de las fibras es distinta
#VISUALIZACION DE GRAFICOS DE DATOS
boxplot(Y~Trat,data=df)
R= En el gráfico podemos visualizar que el mayor tiempo de combustión, significativamente distinto a los anteriores: F1. En media la F3 es la que tiene menor tiempo de combustión, pero no significativamente distinta a la F2 y F4.
modelo<-aov(Y~Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 3 120.50 40.17 13.89 0.000102 ***
## Residuals 16 46.26 2.89
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R= Al aplicar el ANOVA nos indica que p es menor al p(0.05), por lo que se rechaza la Ho (de que todas las fibras sean iguales) y aceptamos la Ha que hay diferencia significativa entre las fibras (alguna es distinta).
tk<-TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Trat, data = df)
##
## $Trat
## diff lwr upr p adj
## F2-F1 -5.02 -8.09676 -1.94324 0.0013227
## F3-F1 -6.54 -9.61676 -3.46324 0.0000851
## F4-F1 -4.80 -7.87676 -1.72324 0.0019981
## F3-F2 -1.52 -4.59676 1.55676 0.5094118
## F4-F2 0.22 -2.85676 3.29676 0.9968426
## F4-F3 1.74 -1.33676 4.81676 0.3968476
R = Al ver los resultados de p adj cuando el valor es <p(0.05) en el caso de los tratamientos (F2-F1),(F3-F1) y (F4-F1) se rechaza la Ho y son diferentes. Y estariamos aceptando la Ho para los tratamientos (F3-F2), (F4-F2) y (F4-F3) puesto que su p adj es >p(0.05).
plot(tk)
Hipotesis Ho : Los datos proceden de una distribución normal. Ha : Los datos no proceden de una distribución normal.
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.88926, p-value = 0.02606
R=
(Comprobación de la homocedasticidad)
library(car)
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.1788 0.9092
## 16
R=
plot(modelo$residuals)
abline(h=0)
plot(df$Trat,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
Se ha medido el tiempo hasta la descarga de dos marcas de pilas y se desea contrastar si en base a esta variable las dos marcas son distintas. Para lo cual definire E a Energizer y U a Ultracell. Realice el análisis de ANOVA correspondiente.
E<-c(1.40,1.39,1.35,1.38,1.35,1.36,1.31,1.26,1.37)
U<-c(1.56,1.54,1.53,1.54,1.54,1.47,1.49,1.54,1.50)
var.test(E,U,alternative = c("greater"))
##
## F test to compare two variances
##
## data: E and U
## F = 2.1651, num df = 8, denom df = 8, p-value = 0.1476
## alternative hypothesis: true ratio of variances is greater than 1
## 95 percent confidence interval:
## 0.6297311 Inf
## sample estimates:
## ratio of variances
## 2.165079
R = El valor de p es mayor que 0.05, razón por la que se rechaza la Ho. Como Hipótesis alternativa: la verdadera razón de varianzas es mayor que 1. En vista de esto, aplicare una prueba de T no pareada.
t.test(E,U,conf.level = 0.95,var.equal = TRUE)
##
## Two Sample t-test
##
## data: E and U
## t = -9.7545, df = 16, p-value = 3.878e-08
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.2082981 -0.1339241
## sample estimates:
## mean of x mean of y
## 1.352222 1.523333
Ho: uA = uB Ha: uA no es = uB
R = El p es menor que 0.05, por lo que se rechaza la Ho. La hipótsis alternativa: la verdadera diferencia de medias no es, igual a 0.
boxplot(E,U)
R= Al observar el gráfico para la pila E, hay un valor sospechoso que se encuentra fuera de la media.
Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un químico hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos han sido:
L1<-c(23.46,23.48,23.56,23.39,23.40)
L2<-c(23.59,23.46,23.42,23.49,23.50)
L3<-c(23.51,23.64,23.46,23.52,23.49)
L4<-c(23.28,23.40,23.37,23.46,23.29)
L5<-c(23.29,23.46,23.37,23.32,23.38)
df<-data.frame(L1=L1,L2=L2,L3=L3,L4=L4,L5=L5)
df<-stack(df)
names(df)<-c("Y","Trat")
str(df)
## 'data.frame': 25 obs. of 2 variables:
## $ Y : num 23.5 23.5 23.6 23.4 23.4 ...
## $ Trat: Factor w/ 5 levels "L1","L2","L3",..: 1 1 1 1 1 2 2 2 2 2 ...
Ho las medias de L1,L2,L3,L4 y L5 son iguales, (Ho: u1=u2=u3=u4) H1 al menos un par de medias de L1,L2,L3,L4 y L5 es diferente.
summary(df)
## Y Trat
## Min. :23.28 L1:5
## 1st Qu.:23.38 L2:5
## Median :23.46 L3:5
## Mean :23.44 L4:5
## 3rd Qu.:23.49 L5:5
## Max. :23.64
#VISUALIZACION DE GRAFICOS DE DATOS
boxplot(Y~Trat,data=df)
R= el gráfico nos muestra que el lote 2 y Lote 3, presentan cada uno al menos (1) un dato discordante del resto de los obtenidos.
modelo<-aov(Y~Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 4 0.1113 0.02782 5.945 0.00255 **
## Residuals 20 0.0936 0.00468
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R= Al aplicar el ANOVA nos indica que p es menor al p(0.05), por lo que se rechaza la Ho y aceptamos que hay diferencia significativa entre al menos un par de medias. Al menos un par de lotes son diferentes.
¿Cuáles son los pares de medias que son diferentes y cuáles son semejantes? Para esto se realiza una prueba de Tukey.
tk<-TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Trat, data = df)
##
## $Trat
## diff lwr upr p adj
## L2-L1 0.034 -0.09546992 0.163469919 0.9317655
## L3-L1 0.066 -0.06346992 0.195469919 0.5588335
## L4-L1 -0.098 -0.22746992 0.031469919 0.1973481
## L5-L1 -0.094 -0.22346992 0.035469919 0.2301147
## L3-L2 0.032 -0.09746992 0.161469919 0.9444731
## L4-L2 -0.132 -0.26146992 -0.002530081 0.0443369
## L5-L2 -0.128 -0.25746992 0.001469919 0.0535881
## L4-L3 -0.164 -0.29346992 -0.034530081 0.0089982
## L5-L3 -0.160 -0.28946992 -0.030530081 0.0110449
## L5-L4 0.004 -0.12546992 0.133469919 0.9999819
R = Al ver los resultados de p adj cuando el valor es <p(0.05) en el caso de los lotes (L4-L2),(L4-L3) y (L5-L3) se rechaza la Ho y son significativamente diferentes. Y estariamos aceptando la Ho para los tratamientos (L2-L1),(L3-L1), (L4-L1), (L5-L1), (L3-L2), (L5-L2) y (L5-L4) puesto que su p adj es >p(0.05).
plot(tk)
Hipotesis Ho : Los datos proceden de una distribución normal. Ha : Los datos no proceden de una distribución normal.
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.90316, p-value = 0.02151
R= No es normal ya que p-value es menor que alpha = 0.05. Se rechaza la Ho, en el grafico qqplot se observa el comportamiento anormal, en los extremos hay valores que se dispersan y la prueba de shapiro nos confirma.
Ho: Todas las varianzas son iguales. Ha: Al menos un par de varianzas son diferentes entre si.
library(car)
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.1186 0.9743
## 20
R= La prueba de levene nos da como resultado que p es >0.05, por lo que aceptamos la Ho, las varianzas son iguales.
plot(modelo$residuals)
abline(h=0)
R= Este gráfico no muestra tendencia alguna en los residuales, con respecto al número de hilera o fila (suponiendo que la fila indica la secuencia temporal en la que se colectan los datos), lo que demuestra que se cumple el supuesto de independencia.
plot(df$Trat,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
R= Este gráfico de residuales no muestra algún patrón que ponga en duda el cumplimiento del supuesto de normalidad y de homogeneidad de varianzas, ya que no hay tendencias de valores positivos o negativos, no hay “curvaturas” ni tampoco se presentan “embudos” en los datos.
Los lotes que realmente difieren son el 5 y el 3, el 5 y el 2, y el 4 y el 3, finalmente, el lote 5 es el que menos contenido de calcio tiene y el lote 3 es el que presenta mayor contenido de calcio.
Se analiza el efecto de tres venenos y cuatro antídotos en el tiempo de supervivencia de unas ratas. A partir de los siguientes resultados, realice un análisis de anova.
Y<-c(0.31,0.45,0.46,0.43,0.82,1.10,0.88,0.72,0.43,0.45,0.63,0.72,0.45,0.71,0.66,0.62,0.36,0.29,0.40,0.23,0.92,0.61,0.49,1.24,0.44,0.35,0.31,0.40,0.56,1.02,0.71,0.38,0.22,0.21,0.18,0.23,0.30,0.37,0.38,0.29,0.23,0.25,0.24,0.22,0.30,0.36,0.31,0.33)
Es un modelo con dos factores: el veneno (con tres niveles) y el antídoto (con cuatro niveles). La variable que va a medir las diferencias entre los tratamientos es el tiempo que sobreviven los animales. Se combinan todos los niveles de los dos factores por lo que tenemos en total doce tratamientos.
Variable respuesta: Tiempo de supervivencia
Factor: Tipo de veneno que tiene tres niveles. Es un factor de efectos fijos ya que viene decidido qué niveles concretos se van a utilizar.
Factor: Tipo de antídoto que tiene cuatro niveles. Es un factor de efectos fijos ya que viene decidido qué niveles concretos se van a utilizar. Tamaño del experimento: Número total de observaciones (48).
library(lme4)
## Loading required package: Matrix
Venenos<-rep(1:3,each=16)
Antídoto<-rep(1:4,each=4)
df<-data.frame(Venenos=as.factor(Venenos),Antídoto=as.factor(Antídoto),Y)
modelo<-lmer(Y~(1|Venenos)+(1|Antídoto)+(1|Venenos:Antídoto),data=df)
summary(modelo)
## Linear mixed model fit by REML ['lmerMod']
## Formula: Y ~ (1 | Venenos) + (1 | Antídoto) + (1 | Venenos:Antídoto)
## Data: df
##
## REML criterion at convergence: -24.4
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -1.8252 -0.5137 -0.0265 0.2277 3.2489
##
## Random effects:
## Groups Name Variance Std.Dev.
## Venenos:Antídoto (Intercept) 0.004846 0.06961
## Antídoto (Intercept) 0.022349 0.14950
## Venenos (Intercept) 0.029361 0.17135
## Residual 0.021848 0.14781
## Number of obs: 48, groups: Venenos:Antídoto, 12; Antídoto, 4; Venenos, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 0.4785 0.1274 3.756
with(df, interaction.plot(x.factor = Venenos, trace.factor = Antídoto,
response = Y))
modelo1<-lm(Y~Venenos*Antídoto,data=df)
fit<-aov(modelo1)
summary(fit)
## Df Sum Sq Mean Sq F value Pr(>F)
## Venenos 2 1.0220 0.5110 23.390 3.10e-07 ***
## Antídoto 3 0.9283 0.3094 14.162 2.97e-06 ***
## Venenos:Antídoto 6 0.2474 0.0412 1.887 0.11
## Residuals 36 0.7865 0.0218
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
qqnorm(modelo1$residuals)
qqline(modelo1$residuals)
shapiro.test(modelo1$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo1$residuals
## W = 0.91113, p-value = 0.001467
plot(modelo1$residuals)
abline(h=0)
plot(df$Venenos,modelo1$residuals)
abline(h=0)
plot(modelo1$fitted.values,modelo1$residuals)
abline(h=0)
Se ha realizado un experimento para estudiar el efecto de la temperatura (T) y tiempo de exposición (E) sobre la cantidad absorbida de un compuesto químico por un material sumergido en él. En el estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiempos de exposición (E1, E2, E3): cada tratamiento se ha replicado tres veces.
Y<-c(35.5,29.7,31.5,91.2,100.7,82.4,70.1,64.1,70.1,52.5,53.3,55.0,71.0,77.0,75.6,79.4,77.7,75.1,85.9,85.2,80.2,87.0,86.1,88.1,83.0,87.0,78.5)
library(lme4)
Tiempos<-rep(1:3,each=9)
Temperaturas<-rep(1:3,each=3)
df<-data.frame(Tiempos=as.factor(Tiempos),Temperaturas=as.factor(Temperaturas),Y)
model<-lmer(Y~(1|Tiempos)+(1|Temperaturas)+(1|Tiempos:Temperaturas),data=df)
summary(model)
## Linear mixed model fit by REML ['lmerMod']
## Formula: Y ~ (1 | Tiempos) + (1 | Temperaturas) + (1 | Tiempos:Temperaturas)
## Data: df
##
## REML criterion at convergence: 182.7
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.12877 -0.44155 0.06328 0.46906 2.36129
##
## Random effects:
## Groups Name Variance Std.Dev.
## Tiempos:Temperaturas (Intercept) 219.83 14.827
## Temperaturas (Intercept) 128.97 11.356
## Tiempos (Intercept) 42.25 6.500
## Residual 16.61 4.076
## Number of obs: 27, groups:
## Tiempos:Temperaturas, 9; Temperaturas, 3; Tiempos, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 72.330 9.062 7.982
with(df, interaction.plot(x.factor = Tiempos, trace.factor = Temperaturas,
response = Y))
with(df, interaction.plot(x.factor = Temperaturas, trace.factor = Tiempos,
response = Y))
model1<-lm(Y~Tiempos*Temperaturas,data=df)
fit<-aov(model1)
summary(fit)
## Df Sum Sq Mean Sq F value Pr(>F)
## Tiempos 2 2113 1056.3 63.59 6.92e-09 ***
## Temperaturas 2 3674 1836.8 110.58 7.75e-11 ***
## Tiempos:Temperaturas 4 2704 676.1 40.70 8.74e-09 ***
## Residuals 18 299 16.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1