Se llevó a cabo un experimento para examinar el efecto de la duración de flores en florero obtenidas en un centro de investigación. “Se eligió un diseño de bloques aleatorizados con tres bloques” de manera tal que el sitio de prueba se eligió como razón de bloqueo. El tiempo de duración se muestra en la Tabla. Analice los datos y extraiga las conclusiones apropiadas. Utilice α = 0,05.
##Instalar readxl para importar datos de excel y cargarlo.
library(readxl)
# Usamos la funcion "file.choose" para encontrar el archivo y lo copiamos en la sig
ruta_excel= ("C:\\Users\\LENOVO\\Desktop\\UN Materias\\Unal 2023-1\\DISEÑO EXPERIMENTOS\\Taller parcial diseño.xlsx")
excel_sheets(ruta_excel)
## [1] "Hoja 1" "Hoja 2" "Hoja 3" "Hoja 4" "Hoja 6" "Hoja 5"
data_excel3= read_excel(ruta_excel, sheet = "Hoja 3")
print(data_excel3)
## # A tibble: 9 × 3
## Sitio Blocks Tiempo
## <chr> <dbl> <dbl>
## 1 Norte 1 96
## 2 Norte 2 90
## 3 Norte 3 85
## 4 Centro 1 85
## 5 Centro 2 88
## 6 Centro 3 82
## 7 Sur 1 80
## 8 Sur 2 76
## 9 Sur 3 78
data_excel3$Blocks = factor(data_excel3$Blocks)
data_excel3$Blocks
## [1] 1 2 3 1 2 3 1 2 3
## Levels: 1 2 3
data_excel3$Sitio = factor(data_excel3$Sitio)
data_excel3$Sitio
## [1] Norte Norte Norte Centro Centro Centro Sur Sur Sur
## Levels: Centro Norte Sur
Modelo \[Y_{ij}= \mu+\tau_i+\beta_j+ \epsilon_{ij}\] Arbol de desicion
library(collapsibleTree)
collapsibleTreeSummary(data_excel3, c("Sitio","Blocks","Tiempo"), collapsed = FALSE)
#Incluimos las repeticiones para que muestre todos los datos
ANALISIS DESCRIPTIVO.
Grafico de barras.
-En este representamos el eje x la Sitio, y Tiempo
library(ggplot2)
ggplot(data_excel3)+
aes(Sitio, Tiempo)+
geom_point(size=3,
color='yellow')+
facet_wrap(~Blocks)+
theme_dark()
-De esta manera concluimos que el “Tiempo de duracion de flores en un florero” es mayor en el sitio “Norte”
Boxplot
data_excel3$Sitio=as.factor(data_excel3$Sitio)
library(ggplot2)
ggplot(data_excel3)+ aes(Sitio , Tiempo, fill=Sitio)+
geom_boxplot() +
xlab("Sitio")+ ylab("Tiempo")
Observamos que el “Tiempo de duracion de flores en un florero” es mayor
para el sitio “Norte”, además, estos valores presentan distribuación
asimétrica.
HIPOTESIS.
Beta=sitio
\[H_0: \mu_{b_1}=\mu_{b_2}=\mu_{b_3}\]
TABLA DE ANOVA.
mod= aov(Tiempo~Blocks+Sitio, data_excel3)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## Blocks 2 42.89 21.44 1.959 0.2552
## Sitio 2 229.56 114.78 10.487 0.0257 *
## Residuals 4 43.78 10.94
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalor(Pr(>F)) > 5% (7,89%), por tanto, Por lo menos uno de los “sitios” tuvo un efecto en la tiempo. Se rechaza la Hipotesis Nula, por lo tanto podemos asumir estadisticamente que no son iguales
eficiencia de bloqueo en este caso H = 13,04 como H>1 sugiere que si valio la pena bloquear
REVISION DE SUPUESTOS.
prueba de normalidad:
#1. Estraemos los residuales
res_mod=mod$residuals
#2. Prueba de Normalidad
shapiro.test(res_mod)
##
## Shapiro-Wilk normality test
##
## data: res_mod
## W = 0.84657, p-value = 0.0683
Se cumple supuesto de normalidad debido a p-value > 5%
PRUEBA DE TUKEY.
library(TukeyC)
tt = TukeyC(mod, "Sitio")
plot(tt)
Solo hay diferencias entre el Sur y el Norte TUKEY 2.
TukeyHSD(mod, conf.level = 0.95)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Tiempo ~ Blocks + Sitio, data = data_excel3)
##
## $Blocks
## diff lwr upr p adj
## 2-1 -2.333333 -11.96026 7.293591 0.6883491
## 3-1 -5.333333 -14.96026 4.293591 0.2337058
## 3-2 -3.000000 -12.62692 6.626924 0.5576971
##
## $Sitio
## diff lwr upr p adj
## Norte-Centro 5.333333 -4.293591 14.960258 0.2337058
## Sur-Centro -7.000000 -16.626924 2.626924 0.1241404
## Sur-Norte -12.333333 -21.960258 -2.706409 0.0223133
Solo hay diferencias entre los tratamientos en el sitio “Sur-Norte”. Ya que el pvalor es menor al 0.05 en esta comparación.
INTERPRETACION BIOLOGICA:
Los Sitios SI influye en el Tiempo de duracion de flores en un florero, los analisis muestran que el “Norte” se generan mayores tiempos de duracion.
REVISION DE DATOS ATIPICOS.
#Instalamos libreria
#Valor #Valor p ≤ α: Existe un valor atípico (Rechaza H0)
library(outliers)
grubbs.test(mod$residuals)
##
## Grubbs test for one outlier
##
## data: mod$residuals
## G.1 = 1.32994, U = 0.75127, p-value = 0.7728
## alternative hypothesis: highest value 3.11111111111112 is an outlier
En este caso pvalor > 0.05, no existen datos atípicos. No es necesario imputar (ver clase 12).
MODALIDADES DE ANALISIS DE VARIANZA:
Oneway Test.
mod1v = oneway.test(Tiempo~Sitio, data_excel3)
mod1v
##
## One-way analysis of means (not assuming equal variances)
##
## data: Tiempo and Sitio
## F = 8.7254, num df = 2.0000, denom df = 3.5819, p-value = 0.04199
Test de Kruskal-Wallis.
mod2v = kruskal.test(Tiempo~Sitio, data_excel3)
mod2v
##
## Kruskal-Wallis rank sum test
##
## data: Tiempo by Sitio
## Kruskal-Wallis chi-squared = 6.2521, df = 2, p-value = 0.04389
Analisis varianza permutacional.
library(RVAideMemoire)
## *** Package RVAideMemoire v 0.9-82-2 ***
##
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:TukeyC':
##
## cv
perm1<-perm.anova(Tiempo~Blocks+Sitio,data= data_excel3, nperm = 1000, progress = F)
perm1
## Permutation Analysis of Variance Table
##
## Response: Tiempo
## 1000 permutations
## Sum Sq Df Mean Sq F value Pr(>F)
## Blocks 42.889 2 21.444 1.9594 0.27173
## Sitio 229.556 2 114.778 10.4873 0.02797 *
## Residuals 43.778 4 10.944
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
CONCLUSIÓN: -Valio la pena bloquear -Estadisticamente no difieren los sitios -Se cumplen los suspuestos del anova