PUNTO 3

Se llevó a cabo un experimento para examinar el efecto de la duración de flores en florero obtenidas en un centro de investigación. Se eligió un diseño de bloques aleatorizados con tres bloques de manera tal que el sitio de prueba se eligió como razón de bloqueo. El tiempo de duración se muestra en la Tabla. Analice los datos y extraiga las conclusiones apropiadas. Utilice α = 0,05.

library(readxl)
data <- read_excel("C:\\Users\\Lenovo\\Desktop\\2023-1\\Diseño\\Datos Taller. pto 3.xlsx")

print(data)
## # A tibble: 9 × 3
##   sitio   time  bloq
##   <chr>  <dbl> <dbl>
## 1 norte     96     1
## 2 norte     90     2
## 3 norte     85     3
## 4 centro    85     1
## 5 centro    88     2
## 6 centro    82     3
## 7 sur       80     1
## 8 sur       76     2
## 9 sur       78     3

ARBOL DE DESICIÓN

library(collapsibleTree)

collapsibleTreeSummary (data, 
                        c("sitio", "bloq", "time"), 
                        collapsed = FALSE)

MODELO \[Y_{ij} = \mu + \tau_i + \beta_j +\epsilon_{ij}\]

ANALISIS DESCRIPTIVO

Grafico de barras

#Grafico base
library(ggplot2)

ggplot(data)+
  aes(sitio, time, fill= sitio)+
  geom_col(position = 'dodge')+
  xlab ("sitio") + ylab ("time") 

Se observa que el sitio en el que el tiempo de duración de florero es mayor es el norte.

Boxplot

library(ggplot2)

ggplot(data)+
  aes(sitio, time, fill = sitio)+
  geom_boxplot()+
  xlab ("sitio") + ylab ("time")

Se observa que el sitio en el que el tiempo de duración de florero es mayor es el norte.

HIPOTESIS \[H_0: \mu_c= \mu_n = \mu_s\] \[H_1: \mu_c ≠ \mu_n ≠ \mu_s\] TABLA DE ANOVA

Según el arbol, time que es la variable a analizar depende de bloq +sitio

mod = aov( time ~ bloq + sitio, data)
summary(mod)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## bloq         1  42.67   42.67   4.848 0.0789 .
## sitio        2 229.56  114.78  13.043 0.0104 *
## Residuals    5  44.00    8.80                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor < 0.05, por tanto se rechaza la hipotesis nula, al menos uno de los sitios tiene efecto en el tiempo de duración. No se mira el de los bloqueos.

REVISION DE SUPUESTOS

Prueba de normalidad

#1. Extraemos los residuales 
res_mod = mod$residuals

#2. Prueba de normalidad
shapiro.test(res_mod)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_mod
## W = 0.85397, p-value = 0.08239

En este caso pvalor > 0.05, se cumple supuesto de normalidad.

Prueba de varianzas iguales

#3.Probando homocedasticidad (varianzas iguales)
bartlett.test(res_mod, data$sitio)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  res_mod and data$sitio
## Bartlett's K-squared = 0.060221, df = 2, p-value = 0.9703

En este caso pvalor> 0.05, se cumple supuesto de varianzas iguales

REVISION DE DATOS ATÍPICOS

#Instalamos libreria 
#Valor p ≤ α: Existe un valor atípico (Rechaza H0)
#
library(outliers)
grubbs.test(mod$residuals)
## 
##  Grubbs test for one outlier
## 
## data:  mod$residuals
## G.1 = 1.27920, U = 0.76989, p-value = 0.8608
## alternative hypothesis: highest value 3.00000000000002 is an outlier

pvalue > 0.05, no se detectaron datos atípicos.

PRUEBA DE TUKEY

library(TukeyC)

tt = TukeyC(mod, "sitio")
plot(tt)

Mayor tiempo de duración en el norte, no existe diferencia significativa entre el centro y el sur

Tukey 2

TukeyHSD(mod, conf.level = 0.95)
## Warning in replications(paste("~", xx), data = mf): non-factors ignored: bloq
## Warning in TukeyHSD.aov(mod, conf.level = 0.95): 'which' specified some
## non-factors which will be dropped
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = time ~ bloq + sitio, data = data)
## 
## $sitio
##                    diff        lwr        upr     p adj
## norte-centro   5.333333  -2.548031 13.2146978 0.1637485
## sur-centro    -7.000000 -14.881364  0.8813645 0.0744269
## sur-norte    -12.333333 -20.214698 -4.4519689 0.0087436

Solo hay diferencias entre sur y norte porque p adj < 0.05