#DFCA: primer diseño del parcial 2

#COMPLETAMENTE AL AZAR #EN BLOQUES AL AZAR #EN BLOQUES GENERALIZADOS AL AZAR #FC+ covariable analisis de covarianza

#Cultivo tomate
set.seed(123)
#Factor1
aporque <- gl(2,60, 120,c("Con_A", "Sin_A"))

#Factor2
variedad <- gl(3, 20, 120, c('v1', 'v2', 'v3'))

#rta
peso_fresco <- rnorm(n = 120, mean = 3, sd = 0.3)

df = data.frame(aporque, variedad, peso_fresco)
df$peso_fresco[1]=3.5
df$peso_fresco[81]=2.5
library(collapsibleTree)
collapsibleTreeSummary(df = df, hierarchy = c('variedad', 'aporque', 'peso_fresco'), collapsed = F, fontSize = 16)

#analisis descriptivo

library(lattice)
bwplot(peso_fresco ~ variedad, df,
       panel =function(...)
{panel.bwplot(...,groups=df$variedad, fill=c('red','blue','green'))})

#Grafico con aporque

library(lattice)
bwplot(peso_fresco ~ aporque, df,
       panel =function(...)
{panel.bwplot(...,groups=df$aporque, fill=c('red','blue'))})

#Grafico donde se contiene ambas graaficas #esta grafica involucra ambas variables, un mejor analisis

library(lattice)
bwplot(peso_fresco~aporque|variedad,df)

tb=tapply(df$peso_fresco, list(df$aporque, df$variedad), mean);tb
##             v1       v2       v3
## Con_A 3.075894 2.984623 3.031946
## Sin_A 2.964025 3.087442 2.892186
addmargins(tb, FUN = mean)
## Margins computed over dimensions
## in the following order:
## 1: 
## 2:
##             v1       v2       v3     mean
## Con_A 3.075894 2.984623 3.031946 3.030821
## Sin_A 2.964025 3.087442 2.892186 2.981218
## mean  3.019960 3.036032 2.962066 3.006019
mean(df$peso_fresco)
## [1] 3.006019
#estudiar estas medias como un promedio total, no aporta verdad, se debe mirar el conjunto de todos los datos

#analisis inferencial \[H_0:\mu_1=\mu_2=\mu_3\\H_2: \mu_{aporque} = \mu_{No aporque}\\ H_3: \text{no hay inreracción entre aporque y variedad}\] #no seguir las mayorias, tener criterio, la forma “como todo el mundo lo hace” y como “se debe hacer segun la teoria”

#modelo \[y_{ijk}= \mu+ +\tau_{i}+ \delta_{j}+ (\tau\delta)_{j}+ \epsilon_{ijk}\\i: 1,2,3\\ j: 1,2\\ k: 1,2\]

\[H_{0_1}: \tau_{v1} = \tau_{v2} = \tau_{v3} = 0\] \[H_{0_2}:\delta_A = \delta_{\bar{A}}\] \[H_{0_3}:(\tau\sigma)_{ij}) = 0; \forall_{i,j}\] #FCCA

mod1=aov(peso_fresco~variedad+aporque+
           variedad*aporque,df)
summary(mod1)
##                   Df Sum Sq Mean Sq F value Pr(>F)  
## variedad           2  0.121 0.06054   0.813 0.4461  
## aporque            1  0.074 0.07381   0.991 0.3216  
## variedad:aporque   2  0.352 0.17619   2.366 0.0985 .
## Residuals        114  8.491 0.07448                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mo=anova(mod1);mo
## Analysis of Variance Table
## 
## Response: peso_fresco
##                   Df Sum Sq  Mean Sq F value  Pr(>F)  
## variedad           2 0.1211 0.060541  0.8128 0.44615  
## aporque            1 0.0738 0.073815  0.9911 0.32159  
## variedad:aporque   2 0.3524 0.176189  2.3656 0.09849 .
## Residuals        114 8.4907 0.074480                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#cuando no hay inreracción se puede analizar cada factor por separado, variedad y aporque(lo correcto)

#interpretación p_valor>0.05% no se rechaza H_0, NO HAY INTERACCIÓN ahora se puede analizar, felizmente se debe analizar cada una #cuando hay interacción se debe hacer un grafico de interacción

#hipotesis de aporque #p_valor= 0.3115= no se rechaza la hipotesis >5%= efecto de aporque nulo, aporcar y no aporcar no hay diferencia estadisitca en los pesos frescos promedio entre ellos

#hipotesis de variedad #p_valor 0.44615=44.6%>5% = no rechazo la hipotesis, no hay difertencia estadisticamente entre las 3 variedades y el peso fresco promedio

#______se puede seguir con probar los supuestos….._____

#cuando si hay interacción (problema)

#Cultivo tomate
set.seed(123)
#Factor1 
aporque <- gl(2,60, 120,c("Con_A", "Sin_A"))

#Factor2
variedad <- gl(3, 20, 120, c('v1', 'v2', 'v3'))

#rta
peso_fresco <- c(rnorm(n = 40, mean = 3, sd = 0.3),
                 rnorm(n = 80, mean = 4, sd = 0.4))

df1 = data.frame(aporque, variedad, peso_fresco)
df$peso_fresco[1] = 3.5
df$peso_fresco[81] = 2.5
library(collapsibleTree)

collapsibleTreeSummary(df1,
                       c("variedad","aporque", "peso_fresco"), F)
mod2 = aov(peso_fresco ~ variedad + aporque +
             variedad*aporque, df1)
summary(mod2)
##                   Df Sum Sq Mean Sq F value   Pr(>F)    
## variedad           2  4.738   2.369   22.42 6.13e-09 ***
## aporque            1 11.890  11.890  112.54  < 2e-16 ***
## variedad:aporque   2 10.312   5.156   48.81 4.87e-16 ***
## Residuals        114 12.044   0.106                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#si hay interaccion el p_valor <al 5%, rechaza la hipotesis H_0 de interacción entre variedad y aporque, se procede #Hay suficiente evidecia estadistica en contra la hipótesis, no se puede realizar una revision de supuestos #hacer el grafico de interacción: con este decidir que hacer

library(ggplot2)
ggplot(data= df1,
       aes(aporque,peso_fresco, colour= variedad, group= variedad))+
  stat_summary(fun= mean, geom="point")+

  labs(y="mean(peso)")+
  theme_bw()

ggplot(df1,
       aes(variedad, peso_fresco,
           colour = aporque, group = aporque))+
  stat_summary(fun = mean, geom = 'point', size = 4)+
  stat_summary(fun = mean, geom = 'line', linetype = 2, size = 2)+
  theme_bw()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

#La conclusion agronomicamente es NO APORCAR las variedade 1 y 2 y si desea aporcar tomar la variedad 3 #ambos factores influyen en la decision al mismo tiempo.