PUNTO 3
Se llevó a cabo un experimento para examinar el efecto de la duración de flores en florero obtenidas en un centro de investigación. Se eligió un diseño de bloques aleatorizados con tres bloques de manera tal que el sitio de prueba se eligió como razón de bloqueo. El tiempo de duración se muestra en la Tabla. Analice los datos y extraiga las conclusiones apropiadas. Utilice α = 0,05.
library(readxl)
data <- read_excel("C:\\Users\\Lenovo\\Desktop\\2023-1\\Diseño\\Datos Taller. pto 3.xlsx")
print(data)
## # A tibble: 9 × 3
## sitio time bloq
## <chr> <dbl> <dbl>
## 1 norte 96 1
## 2 norte 90 2
## 3 norte 85 3
## 4 centro 85 1
## 5 centro 88 2
## 6 centro 82 3
## 7 sur 80 1
## 8 sur 76 2
## 9 sur 78 3
ARBOL DE DESICIÓN
library(collapsibleTree)
collapsibleTreeSummary (data,
c("sitio", "bloq", "time"),
collapsed = FALSE)
MODELO \[Y_{ij} = \mu + \tau_i + \beta_j +\epsilon_{ij}\]
ANALISIS DESCRIPTIVO
Grafico de barras
#Grafico base
library(ggplot2)
ggplot(data)+
aes(sitio, time, fill= sitio)+
geom_col(position = 'dodge')+
xlab ("sitio") + ylab ("time")
Se observa que el sitio en el que el tiempo de duración de florero es
mayor es el norte.
Boxplot
library(ggplot2)
ggplot(data)+
aes(sitio, time, fill = sitio)+
geom_boxplot()+
xlab ("sitio") + ylab ("time")
Se observa que el sitio en el que el tiempo de duración de florero es
mayor es el norte.
HIPOTESIS \[H_0: \mu_c= \mu_n = \mu_s\] \[H_1: \mu_c ≠ \mu_n ≠ \mu_s\] TABLA DE ANOVA
Según el arbol, time que es la variable a analizar depende de bloq +sitio
mod = aov( time ~ bloq + sitio, data)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## bloq 1 42.67 42.67 4.848 0.0789 .
## sitio 2 229.56 114.78 13.043 0.0104 *
## Residuals 5 44.00 8.80
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalor < 0.05, por tanto se rechaza la hipotesis nula, al menos uno de los sitios tiene efecto en el tiempo de duración. No se mira el de los bloqueos.
REVISION DE SUPUESTOS
Prueba de normalidad
#1. Extraemos los residuales
res_mod = mod$residuals
#2. Prueba de normalidad
shapiro.test(res_mod)
##
## Shapiro-Wilk normality test
##
## data: res_mod
## W = 0.85397, p-value = 0.08239
En este caso pvalor > 0.05, se cumple supuesto de normalidad.
Prueba de varianzas iguales
#3.Probando homocedasticidad (varianzas iguales)
bartlett.test(res_mod, data$sitio)
##
## Bartlett test of homogeneity of variances
##
## data: res_mod and data$sitio
## Bartlett's K-squared = 0.060221, df = 2, p-value = 0.9703
En este caso pvalor> 0.05, se cumple supuesto de varianzas iguales
REVISION DE DATOS ATÍPICOS
#Instalamos libreria
#Valor p ≤ α: Existe un valor atípico (Rechaza H0)
#
library(outliers)
grubbs.test(mod$residuals)
##
## Grubbs test for one outlier
##
## data: mod$residuals
## G.1 = 1.27920, U = 0.76989, p-value = 0.8608
## alternative hypothesis: highest value 3.00000000000002 is an outlier
pvalue > 0.05, no se detectaron datos atípicos.
PRUEBA DE TUKEY
library(TukeyC)
tt = TukeyC(mod, "sitio")
plot(tt)
Mayor tiempo de duración en el norte, no existe diferencia significativa
entre el centro y el sur
Tukey 2
TukeyHSD(mod, conf.level = 0.95)
## Warning in replications(paste("~", xx), data = mf): non-factors ignored: bloq
## Warning in TukeyHSD.aov(mod, conf.level = 0.95): 'which' specified some
## non-factors which will be dropped
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = time ~ bloq + sitio, data = data)
##
## $sitio
## diff lwr upr p adj
## norte-centro 5.333333 -2.548031 13.2146978 0.1637485
## sur-centro -7.000000 -14.881364 0.8813645 0.0744269
## sur-norte -12.333333 -20.214698 -4.4519689 0.0087436
Solo hay diferencias entre sur y norte porque p adj < 0.05