Se llevó a cabo un experimento para examinar el efecto de la duración de flores en florero obtenidas en un centro de investigación. “Se eligió un diseño de bloques aleatorizados con tres bloques” de manera tal que el sitio de prueba se eligió como razón de bloqueo. El tiempo de duración se muestra en la Tabla. Analice los datos y extraiga las conclusiones apropiadas. Utilice α = 0,05.

##Instalar readxl para importar datos de excel y cargarlo.
library(readxl)

# Usamos la funcion "file.choose" para encontrar el archivo y lo copiamos en la sig

ruta_excel= ("C:\\Users\\LENOVO\\Desktop\\UN Materias\\Unal 2023-1\\DISEÑO EXPERIMENTOS\\Taller parcial diseño.xlsx")

excel_sheets(ruta_excel)
## [1] "Hoja 1" "Hoja 2" "Hoja 3" "Hoja 4" "Hoja 6" "Hoja 5"
data_excel3= read_excel(ruta_excel, sheet = "Hoja 3")
print(data_excel3)
## # A tibble: 9 × 3
##   Sitio  Blocks Tiempo
##   <chr>   <dbl>  <dbl>
## 1 Norte       1     96
## 2 Norte       2     90
## 3 Norte       3     85
## 4 Centro      1     85
## 5 Centro      2     88
## 6 Centro      3     82
## 7 Sur         1     80
## 8 Sur         2     76
## 9 Sur         3     78
data_excel3$Blocks = factor(data_excel3$Blocks)
data_excel3$Blocks
## [1] 1 2 3 1 2 3 1 2 3
## Levels: 1 2 3
data_excel3$Sitio = factor(data_excel3$Sitio)
data_excel3$Sitio
## [1] Norte  Norte  Norte  Centro Centro Centro Sur    Sur    Sur   
## Levels: Centro Norte Sur

Modelo \[Y_{ij}= \mu+\tau_i+\beta_j+ \epsilon_{ij}\] Arbol de desicion

library(collapsibleTree)
collapsibleTreeSummary(data_excel3, c("Sitio","Blocks","Tiempo"), collapsed = FALSE)
#Incluimos las repeticiones para que muestre todos los datos

ANALISIS DESCRIPTIVO.

Grafico de barras.

-En este representamos el eje x la Sitio, y Tiempo

library(ggplot2)

ggplot(data_excel3)+
  aes(Sitio, Tiempo)+
  geom_point(size=3,
             color='yellow')+
  facet_wrap(~Blocks)+
  theme_dark()

-De esta manera concluimos que el “Tiempo de duracion de flores en un florero” es mayor en el sitio “Norte”

Boxplot

data_excel3$Sitio=as.factor(data_excel3$Sitio)
library(ggplot2)

ggplot(data_excel3)+ aes(Sitio , Tiempo, fill=Sitio)+ 
 geom_boxplot() +
 xlab("Sitio")+ ylab("Tiempo")

Observamos que el “Tiempo de duracion de flores en un florero” es mayor para el sitio “Norte”, además, estos valores presentan distribuación asimétrica.

HIPOTESIS.

Beta=sitio

\[H_0: \mu_{b_1}=\mu_{b_2}=\mu_{b_3}\]

TABLA DE ANOVA.

mod= aov(Tiempo~Blocks+Sitio, data_excel3)
summary(mod)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## Blocks       2  42.89   21.44   1.959 0.2552  
## Sitio        2 229.56  114.78  10.487 0.0257 *
## Residuals    4  43.78   10.94                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor(Pr(>F)) > 5% (7,89%), por tanto, Por lo menos uno de los “sitios” tuvo un efecto en la tiempo. Se rechaza la Hipotesis Nula, por lo tanto podemos asumir estadisticamente que no son iguales

eficiencia de bloqueo en este caso H = 13,04 como H>1 sugiere que si valio la pena bloquear

REVISION DE SUPUESTOS.

prueba de normalidad:

#1. Estraemos los residuales
res_mod=mod$residuals

#2. Prueba de Normalidad
shapiro.test(res_mod)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_mod
## W = 0.84657, p-value = 0.0683

Se cumple supuesto de normalidad debido a p-value > 5%

PRUEBA DE TUKEY.

library(TukeyC)

tt = TukeyC(mod, "Sitio")
plot(tt)

Solo hay diferencias entre el Sur y el Norte TUKEY 2.

TukeyHSD(mod, conf.level = 0.95)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Tiempo ~ Blocks + Sitio, data = data_excel3)
## 
## $Blocks
##          diff       lwr      upr     p adj
## 2-1 -2.333333 -11.96026 7.293591 0.6883491
## 3-1 -5.333333 -14.96026 4.293591 0.2337058
## 3-2 -3.000000 -12.62692 6.626924 0.5576971
## 
## $Sitio
##                    diff        lwr       upr     p adj
## Norte-Centro   5.333333  -4.293591 14.960258 0.2337058
## Sur-Centro    -7.000000 -16.626924  2.626924 0.1241404
## Sur-Norte    -12.333333 -21.960258 -2.706409 0.0223133

Solo hay diferencias entre los tratamientos en el sitio “Sur-Norte”. Ya que el pvalor es menor al 0.05 en esta comparación.

INTERPRETACION BIOLOGICA:

Los Sitios SI influye en el Tiempo de duracion de flores en un florero, los analisis muestran que el “Norte” se generan mayores tiempos de duracion.

REVISION DE DATOS ATIPICOS.

#Instalamos libreria
#Valor #Valor p ≤ α: Existe un valor atípico (Rechaza H0)
library(outliers)
grubbs.test(mod$residuals)
## 
##  Grubbs test for one outlier
## 
## data:  mod$residuals
## G.1 = 1.32994, U = 0.75127, p-value = 0.7728
## alternative hypothesis: highest value 3.11111111111112 is an outlier

En este caso pvalor > 0.05, no existen datos atípicos. No es necesario imputar (ver clase 12).

MODALIDADES DE ANALISIS DE VARIANZA:

Oneway Test.

mod1v = oneway.test(Tiempo~Sitio, data_excel3)
mod1v
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  Tiempo and Sitio
## F = 8.7254, num df = 2.0000, denom df = 3.5819, p-value = 0.04199

Test de Kruskal-Wallis.

mod2v = kruskal.test(Tiempo~Sitio, data_excel3)
mod2v
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Tiempo by Sitio
## Kruskal-Wallis chi-squared = 6.2521, df = 2, p-value = 0.04389

Analisis varianza permutacional.

library(RVAideMemoire)
## *** Package RVAideMemoire v 0.9-82-2 ***
## 
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:TukeyC':
## 
##     cv
perm1<-perm.anova(Tiempo~Blocks+Sitio,data= data_excel3, nperm = 1000, progress = F)
perm1
## Permutation Analysis of Variance Table
## 
## Response: Tiempo
## 1000 permutations
##            Sum Sq Df Mean Sq F value  Pr(>F)  
## Blocks     42.889  2  21.444  1.9594 0.27173  
## Sitio     229.556  2 114.778 10.4873 0.02797 *
## Residuals  43.778  4  10.944                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

CONCLUSIÓN: -Valio la pena bloquear -Estadisticamente no difieren los sitios -Se cumplen los suspuestos del anova