Nombre y Apellido: Luis Alfonso Salsavilca Cayetano
# Librerias
library(agricolae)
library(car)
## Loading required package: carData
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(MASS)
library(multcomp)
## Loading required package: mvtnorm
## Loading required package: survival
## Loading required package: TH.data
##
## Attaching package: 'TH.data'
## The following object is masked from 'package:MASS':
##
## geyser
library(phia)
datos<-read.table("datosppt.txt",T)
names(datos)
## [1] "marca" "periodo" "respuesta"
marca<-factor(datos[,1])
periodo<-factor(datos[,2])
respuesta<-datos[,3]
datos
\[Y_{ijk} = \mu + \alpha_{i} +\beta_{j} + (\alpha\beta)_{ij} + \varepsilon_{ijk} \quad \text{ para } i = 1,2 ,j =1,2,3 ,k =1,2,3,4 \]
Descripción de cada componente del modelo :
\(Y_{ijk}\):Cantidad de ácido
ascórbico obtenida con la i-ésima marca de concentrado de jugo y el
j-ésimo período en la k-ésima repetición.
\(\mu\): Media general.
\(\alpha_{i}\): =Efecto de la i-ésima
marca.
\(\beta_{j}\) : Efecto del j-ésimo
periodo.
\((\alpha\beta)_{ij}\): Efecto de la
interacción entre la i-ésima marca y el jésimo periodo.
\(\varepsilon_{ijk}\): Efecto del
error experimental obtenida con la i-ésima marca de concentrado de jugo
y el j-ésimo período en la késima repetición.
modelo<-lm(respuesta~marca+periodo+marca*periodo)
par(mfrow=c(2,2))
plot(modelo)
En el primer gráfico se observa que el lowes de los valores predichos sobre los residuos se sobrepone casi a la recta residuals = 0, esto indica que el supuesto de modelo aditivo lineal se cumple. También, conforme el valor predicho aumenta la dispersión aumenta,es posible que el supuesto de homogeneidad de variancia se cumpla, a pesar que las observaciones 5, 10 y 21 que posiblemente sean valores extremos.
En el segundo gráfico se observa que los cuantiles de los residuales estandarizados están en torno a la recta que contiene los cuantiles teóricos ±2 de la distribución normal estándar salvo la observación 5, 10 y 21 que se encuentran en los extremos, lo cual indicaría que posiblemente se cumpla con el supuesto de normalidad de errores.
En el tercer gráfico se observa que el lowes de los valores predichos sobre los residuales estandarizados tiene una tendencia constante, es posible que el supuesto de homogeneidad se cumpla.
En el cuarto gráfico se observa que los residuos estandarizados y que ninguno sobrepasa los limites +-2, pero podrían ser considerados valores extremos.
Prueba de hipótesis
\(H_0\): Los errores tienen
distribución normal
\(H_1\): Los errores no tienen
distribución normal
Nivel de significancia: α= 5%
ri<-rstandard(modelo)
shapiro.test(ri)
##
## Shapiro-Wilk normality test
##
## data: ri
## W = 0.95204, p-value = 0.2998
p_valor = 0.2998
Decisión: p_valor > α , No se rechaza \(H_0\)
Conclusión: Con un nivel de significancia de 0.01 ,no existe evidencia estadística para rechazar \(H_0\), por lo tanto los errores presentan distribución normal.
Prueba de hipótesis
\(H_0\): Los errores tienen varianzas
homogéneas o constantes.
\(H_1\): Los errores no tienen
varianzas homogéneas o constantes.
Nivel de significancia: α= 5%
ncvTest(modelo)
## Non-constant Variance Score Test
## Variance formula: ~ fitted.values
## Chisquare = 0.0001430365, Df = 1, p = 0.99046
p_valor = 0.99046
Decisión: p_valor > α , No se rechaza \(H_0\)
Conclusión: Con un nivel de significancia de 0.01 ,no existe evidencia estadística para rechazar \(H_0\), por lo tanto las varianzas son homogéneas.
Conclusiones Generales: A un nivel de significancia del 5%:
Normalidad: No existe evidencia estadística para rechazar \(H_0\), por lo tanto los errores presentan
distribución normal.
Homogeneidad: No existe evidencia estadística para rechazar \(H_0\), por lo tanto las varianzas son
homogéneas.
No es necesario realizar ningún tipo de tranformacion a este nivel de confianza del 5% y se seguira trabajando con el modelo inicial.
interaction.plot(periodo,marca,respuesta)
interaction.plot(marca, periodo,respuesta)
Para el gráfico de marcas como las lineas se cruzan indicaría existe
interacción entre ambas marcas.
Para el gráfico de periodo no existe interacción entre entre b1 - b2 pero si existe una mayor fuerza de interacción entre b1 - b3 y b2 - b3.
Prueba de hipótesis
\(H_0\): \((\alpha\beta)_{ij}\) = 0 ; i=1,2 ;
j=1,2,3.
\(H_1\):\((\alpha\beta)_{ij}\) =! 0 ; para al menos
algún i,j.
Nivel de significancia: α=0.05
modelo<-lm(respuesta~marca+periodo+marca*periodo)
summary(aov(modelo))
## Df Sum Sq Mean Sq F value Pr(>F)
## marca 1 0.11 0.11 0.008 0.9286
## periodo 2 107.65 53.82 4.164 0.0326 *
## marca:periodo 2 105.44 52.72 4.079 0.0346 *
## Residuals 18 232.67 12.93
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
p_valor = 0.0346
Decisión: p_valor > α , Se rechaza \(H_0\)
Conclusión: Existe evidencia estadística para afirmar que existe interacción entre la marca de concentrados de jugo de naranja congelado y el periodo de almacenamiento.
A en b1
\(H_0\): \(μ_{11}\)=\(μ_{21}\)
\(H_1\): \(μ_{11}\)≠\(μ_{21}\)
A en b2
\(H_0\): \(μ_{12}\)=\(μ_{22}\)
\(H_1\): \(μ_{12}\)≠\(μ_{22}\)
A en b3
\(H_0\): \(μ_{13}\)=\(μ_{23}\)
\(H_1\): \(μ_{13}\)≠\(μ_{23}\)
testInteractions(modelo,fixed = "periodo",across = "marca", adjustment = "none")
Conclusión: No existen diferencias significativas entre las marcas de concentrado de jugo de naranja tanto a los 0 como a los 3 días de almacenamiento, pero que sí existe diferencia significativa entre las marcas a los 7 días, respecto al contenido medio de ácido ascórbico.
Prueba de hipótesis para efecto Bai
B en a1
\(H_0\): \(μ_{11}\)=\(μ_{12}\)=\(μ_{13}\)
\(H_1\): \(μ_{11}\)≠\(μ_{12}\)≠\(μ_{13}\)
B en a2
\(H_0\): \(μ_{21}\)=\(μ_{22}\)=\(μ_{23}\)
\(H_1\): \(μ_{21}\)≠\(μ_{22}\)≠\(μ_{23}\)
testInteractions(modelo,fixed = "marca",across = "periodo", adjustment = "none")
factor = B y marca = a1
marca_a1=datos[datos$marca=="a1",]
respuesta1=marca_a1$respuesta
periodoa1=as.factor(marca_a1$periodo)
modelo2=lm(respuesta1~periodoa1,data=marca_a1)
library(multcomp)
ptukey=glht(modelo2,linfct = mcp(periodoa1="Tukey"))
summary(ptukey)
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Tukey Contrasts
##
##
## Fit: lm(formula = respuesta1 ~ periodoa1, data = marca_a1)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## b2 - b1 == 0 -4.125 2.766 -1.492 0.3392
## b3 - b1 == 0 -7.900 2.766 -2.857 0.0451 *
## b3 - b2 == 0 -3.775 2.766 -1.365 0.3978
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)
En la marca 1:
Verifique si hay evidencias estadísticas para afirmar que con el periodo de 0 días se obtiene un promedio de ácido ascórbico que excede en más de 2.5 miligramos por litro al promedio que se obtiene durante el periodo de 7 días considerando la marca 1 en el concentrado de jugo de naranja. Use α=0.05
\(H_0\): \(μ_{11}\)-\(μ_{13}\)<=2.5
\(H_1\): \(μ_{11}\)-\(μ_{13}\)>2.5
summary(aov(modelo))
## Df Sum Sq Mean Sq F value Pr(>F)
## marca 1 0.11 0.11 0.008 0.9286
## periodo 2 107.65 53.82 4.164 0.0326 *
## marca:periodo 2 105.44 52.72 4.079 0.0346 *
## Residuals 18 232.67 12.93
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tcrit= -qt(0.05,18)
Tcrit
## [1] 1.734064
tcal<-(52.775 - 44.875-2.5)/sqrt(2*(12.9258)/4)
tcal
## [1] 2.124125
T calculado = 2.124125
T critico = 1.734064
Decisión: T calculado > T critico, Se rechaza \(H_0\).
Conclusión: Existe evidencia estadística para afirmar que con el periodo de 0 días se obtiene un promedio de ácido ascórbico que excede en más de 2.5 mg por litro al que se obtiene durante el periodo de 7 días, considerando la marca 1 en el concentrado de jugo de naranja.