#DFCA: primer diseño del parcial 2
#COMPLETAMENTE AL AZAR #EN BLOQUES AL AZAR #EN BLOQUES GENERALIZADOS AL AZAR #FC+ covariable analisis de covarianza
#Cultivo tomate
set.seed(123)
#Factor1
aporque <- gl(2,60, 120,c("Con_A", "Sin_A"))
#Factor2
variedad <- gl(3, 20, 120, c('v1', 'v2', 'v3'))
#rta
peso_fresco <- rnorm(n = 120, mean = 3, sd = 0.3)
df = data.frame(aporque, variedad, peso_fresco)
df$peso_fresco[1]=3.5
df$peso_fresco[81]=2.5
library(collapsibleTree)
collapsibleTreeSummary(df = df, hierarchy = c('variedad', 'aporque', 'peso_fresco'), collapsed = F, fontSize = 16)
#analisis descriptivo
library(lattice)
bwplot(peso_fresco ~ variedad, df,
panel =function(...)
{panel.bwplot(...,groups=df$variedad, fill=c('red','blue','green'))})
#Grafico con aporque
library(lattice)
bwplot(peso_fresco ~ aporque, df,
panel =function(...)
{panel.bwplot(...,groups=df$aporque, fill=c('red','blue'))})
#Grafico donde se contiene ambas graaficas #esta grafica involucra ambas
variables, un mejor analisis
library(lattice)
bwplot(peso_fresco~aporque|variedad,df)
tb=tapply(df$peso_fresco, list(df$aporque, df$variedad), mean);tb
## v1 v2 v3
## Con_A 3.075894 2.984623 3.031946
## Sin_A 2.964025 3.087442 2.892186
addmargins(tb, FUN = mean)
## Margins computed over dimensions
## in the following order:
## 1:
## 2:
## v1 v2 v3 mean
## Con_A 3.075894 2.984623 3.031946 3.030821
## Sin_A 2.964025 3.087442 2.892186 2.981218
## mean 3.019960 3.036032 2.962066 3.006019
mean(df$peso_fresco)
## [1] 3.006019
#estudiar estas medias como un promedio total, no aporta verdad, se debe mirar el conjunto de todos los datos
#analisis inferencial \[H_0:\mu_1=\mu_2=\mu_3\\H_2: \mu_{aporque} = \mu_{No aporque}\\ H_3: \text{no hay inreracción entre aporque y variedad}\] #no seguir las mayorias, tener criterio, la forma “como todo el mundo lo hace” y como “se debe hacer segun la teoria”
#modelo \[y_{ijk}= \mu+ +\tau_{i}+ \delta_{j}+ (\tau\delta)_{j}+ \epsilon_{ijk}\\i: 1,2,3\\ j: 1,2\\ k: 1,2\]
\[H_{0_1}: \tau_{v1} = \tau_{v2} = \tau_{v3} = 0\] \[H_{0_2}:\delta_A = \delta_{\bar{A}}\] \[H_{0_3}:(\tau\sigma)_{ij}) = 0; \forall_{i,j}\] #FCCA
mod1=aov(peso_fresco~variedad+aporque+
variedad*aporque,df)
summary(mod1)
## Df Sum Sq Mean Sq F value Pr(>F)
## variedad 2 0.121 0.06054 0.813 0.4461
## aporque 1 0.074 0.07381 0.991 0.3216
## variedad:aporque 2 0.352 0.17619 2.366 0.0985 .
## Residuals 114 8.491 0.07448
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mo=anova(mod1);mo
## Analysis of Variance Table
##
## Response: peso_fresco
## Df Sum Sq Mean Sq F value Pr(>F)
## variedad 2 0.1211 0.060541 0.8128 0.44615
## aporque 1 0.0738 0.073815 0.9911 0.32159
## variedad:aporque 2 0.3524 0.176189 2.3656 0.09849 .
## Residuals 114 8.4907 0.074480
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#cuando no hay inreracción se puede analizar cada factor por separado, variedad y aporque(lo correcto)
#interpretación p_valor>0.05% no se rechaza H_0, NO HAY INTERACCIÓN ahora se puede analizar, felizmente se debe analizar cada una #cuando hay interacción se debe hacer un grafico de interacción
#hipotesis de aporque #p_valor= 0.3115= no se rechaza la hipotesis >5%= efecto de aporque nulo, aporcar y no aporcar no hay diferencia estadisitca en los pesos frescos promedio entre ellos
#hipotesis de variedad #p_valor 0.44615=44.6%>5% = no rechazo la hipotesis, no hay difertencia estadisticamente entre las 3 variedades y el peso fresco promedio
#______se puede seguir con probar los supuestos….._____
#cuando si hay interacción (problema)
#Cultivo tomate
set.seed(123)
#Factor1
aporque <- gl(2,60, 120,c("Con_A", "Sin_A"))
#Factor2
variedad <- gl(3, 20, 120, c('v1', 'v2', 'v3'))
#rta
peso_fresco <- c(rnorm(n = 40, mean = 3, sd = 0.3),
rnorm(n = 80, mean = 4, sd = 0.4))
df1 = data.frame(aporque, variedad, peso_fresco)
df$peso_fresco[1] = 3.5
df$peso_fresco[81] = 2.5
library(collapsibleTree)
collapsibleTreeSummary(df1,
c("variedad","aporque", "peso_fresco"), F)
mod2 = aov(peso_fresco ~ variedad + aporque +
variedad*aporque, df1)
summary(mod2)
## Df Sum Sq Mean Sq F value Pr(>F)
## variedad 2 4.738 2.369 22.42 6.13e-09 ***
## aporque 1 11.890 11.890 112.54 < 2e-16 ***
## variedad:aporque 2 10.312 5.156 48.81 4.87e-16 ***
## Residuals 114 12.044 0.106
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#si hay interaccion el p_valor <al 5%, rechaza la hipotesis H_0 de interacción entre variedad y aporque, se procede #Hay suficiente evidecia estadistica en contra la hipótesis, no se puede realizar una revision de supuestos #hacer el grafico de interacción: con este decidir que hacer
library(ggplot2)
ggplot(data= df1,
aes(aporque,peso_fresco, colour= variedad, group= variedad))+
stat_summary(fun= mean, geom="point")+
labs(y="mean(peso)")+
theme_bw()
ggplot(df1,
aes(variedad, peso_fresco,
colour = aporque, group = aporque))+
stat_summary(fun = mean, geom = 'point', size = 4)+
stat_summary(fun = mean, geom = 'line', linetype = 2, size = 2)+
theme_bw()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
#La conclusion agronomicamente es NO APORCAR las variedade 1 y 2 y si desea aporcar tomar la variedad 3 #ambos factores influyen en la decision al mismo tiempo.