PUNTO 1
Los datos que se presentan se asocian a la respuesta a la fractura (tiempo hasta la fractura) de bloques de madera
a) ¿Afecta el nivel de presión hasta la fractura del bloque de madera?
Importamos los datos
#Instalar readxl para importar datos de excel y cargarlo.
library(readxl)
#usamos la función file.choose para encontrar el archivo y lo copiamos en la siguiente
data <- read_excel ("C:\\Users\\Lenovo\\Desktop\\2023-1\\Diseño\\Datos Taller. pto 1.xlsx")
print(data)
## # A tibble: 12 × 3
## prs rep time
## <dbl> <chr> <dbl>
## 1 0.05 i 0.88
## 2 0.05 ii 0.87
## 3 0.05 iii 0.89
## 4 0.1 i 0.92
## 5 0.1 ii 0.94
## 6 0.1 iii 0.93
## 7 0.2 i 0.95
## 8 0.2 ii 0.94
## 9 0.2 iii 0.95
## 10 0.25 i 0.98
## 11 0.25 ii 0.99
## 12 0.25 iii 0.98
Un factor: presión
una variable respuesta: tiempo de fractura
Por tanto, FSCA Factorial Vectorial simple en arreglos completamente al azar
MODELO
\[Y_{ij} = \mu + \tau_i + \epsilon_{ij}\]
Arbol de desición
library(collapsibleTree)
collapsibleTreeSummary (data,
c("prs", "rep", "time"),
collapsed = FALSE)
#Incluimos las repeticiones para que muestre todos los datos
data$prs = as.factor(data$prs)
ANALISIS DESCRIPTIVO
Grafico de barras
En este representamos en el eje x la presión, y la media del tiempo de fractura
#Grafico base
library(ggplot2)
ggplot(data)+
aes(prs, time, fill= prs)+
geom_col(position = 'dodge')+
xlab ("presion") + ylab ("tiempo de fractura")
De este concluimos que: el tiempo hasta la fractura es bloques de madera
es mayor bajo la presión 0.25, demoran más en romparse.
Boxplot
data$prs = as.factor(data$prs)
library(ggplot2)
ggplot(data)+
aes(prs, time, fill = prs)+
geom_boxplot()+
xlab ("presion") + ylab ("tiempo de fractura")
Observamos que el tiempo de fractura es mayor para la presión de 0.25,
además, estos valores presentan distribuación asimétrica.
HIPOTESIS \[H_0: \mu_{prs1}= \mu_{prs2} = \mu_{prs3}= \mu_{prs4} \] \[ H_l: \mu_{prs1}≠ \mu_{prs2} ≠ \mu_{prs3}≠ \mu_{prs4} \] TABLA DE ANOVA
mod = aov(time~ prs, data)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## prs 3 0.016567 0.005522 82.83 2.3e-06 ***
## Residuals 8 0.000533 0.000067
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalor < 0.05, por tanto, se rechaza la hipotesis nula. Las medias por presión son diferentes.
REVISIÓN SE SUPUESTOS
Prueba de normalidad
#1. Extraemos los residuales
res_mod = mod$residuals
#2. Prueba de normalidad
shapiro.test(res_mod)
##
## Shapiro-Wilk normality test
##
## data: res_mod
## W = 0.94102, p-value = 0.5114
En este caso pvalor > 0.05, se cumple supuesto de normalidad.
Prueba de varianzas iguales
#3.Probando homocedasticidad (varianzas iguales)
bartlett.test(res_mod, data$prs)
##
## Bartlett test of homogeneity of variances
##
## data: res_mod and data$prs
## Bartlett's K-squared = 0.95233, df = 3, p-value = 0.8128
En este caso pvalor> 0.05, se cumple supuesto de varianzas iguales
REVISION DE DATOS ATÍPICOS
#Instalamos libreria
#Valor p ≤ α: Existe un valor atípico (Rechaza H0)
#
library(outliers)
grubbs.test(mod$residuals)
##
## Grubbs test for one outlier
##
## data: mod$residuals
## G.3 = 1.43614, U = 0.79545, p-value = 0.8393
## alternative hypothesis: highest value 0.0100000000000001 is an outlier
En este caso pvalor > 0.05, no existen datos atípicos. No es necesario imputar (ver clase 12)
PRUEBA DE TUKEY
library(TukeyC)
tt = TukeyC(mod, "prs")
plot(tt)
No hay diferencias entre los tratamientos 0.2 y 0.1 de presión. El
tratamiento de prs = 0.25 implica un mayor tiempo de fractura.
Tukey 2
TukeyHSD(mod, conf.level = 0.95)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = time ~ prs, data = data)
##
## $prs
## diff lwr upr p adj
## 0.1-0.05 0.05000000 0.028650987 0.07134901 0.0003178
## 0.2-0.05 0.06666667 0.045317653 0.08801568 0.0000396
## 0.25-0.05 0.10333333 0.081984320 0.12468235 0.0000014
## 0.2-0.1 0.01666667 -0.004682347 0.03801568 0.1344163
## 0.25-0.1 0.05333333 0.031984320 0.07468235 0.0002012
## 0.25-0.2 0.03666667 0.015317653 0.05801568 0.0025538
Hay diferencia en todos los tratamientos menos entre prs 0.2 y 0.1. Ya que el pvalor es mayor al 0.05 en esta comparación
INTERPRETACIÓN BIOLÓGICA
La presión SI influye en el tiempo de ruptura, los analisis muestran que a mayor valor de presión mayor es el tiempo de fractura.
MODALIDADES DE ANALISIS DE VARIANZA
Oneway Test
mod1v = oneway.test(time~prs, data)
mod1v
##
## One-way analysis of means (not assuming equal variances)
##
## data: time and prs
## F = 66.242, num df = 3.0000, denom df = 4.3243, p-value = 0.0004653
Test de Kruskal-Wallis
mod2v = kruskal.test(time ~prs, data)
mod2v
##
## Kruskal-Wallis rank sum test
##
## data: time by prs
## Kruskal-Wallis chi-squared = 10.274, df = 3, p-value = 0.01637
Analisis varianza permutacional
library(RVAideMemoire)
## *** Package RVAideMemoire v 0.9-82-2 ***
##
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:TukeyC':
##
## cv
perm1<-perm.anova(time ~ prs, data = data, nperm = 1000, progress = F)
perm1
## Permutation Analysis of Variance Table
##
## Response: time
## 1000 permutations
## Sum Sq Df Mean Sq F value Pr(>F)
## prs 0.0165667 3 0.0055222 82.833 0.000999 ***
## Residuals 0.0005333 8 0.0000667
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1