PRACTICA OPCIONAL

Nombre y Apellido: Luis Alfonso Salsavilca Cayetano

# Librerias
library(agricolae)
library(car)
## Loading required package: carData
library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(MASS)
library(multcomp)
## Loading required package: mvtnorm
## Loading required package: survival
## Loading required package: TH.data
## 
## Attaching package: 'TH.data'
## The following object is masked from 'package:MASS':
## 
##     geyser
library(phia)

Lectura de datos

datos<-read.table("datosppt.txt",T)
names(datos)
## [1] "marca"     "periodo"   "respuesta"
marca<-factor(datos[,1])
periodo<-factor(datos[,2])
respuesta<-datos[,3]
datos

a. Modelo aditivo lineal

\[Y_{ijk} = \mu + \alpha_{i} +\beta_{j} + (\alpha\beta)_{ij} + \varepsilon_{ijk} \quad \text{ para } i = 1,2 ,j =1,2,3 ,k =1,2,3,4 \]

Descripción de cada componente del modelo :

\(Y_{ijk}\):Cantidad de ácido ascórbico obtenida con la i-ésima marca de concentrado de jugo y el j-ésimo período en la k-ésima repetición.

\(\mu\): Media general.
\(\alpha_{i}\): =Efecto de la i-ésima marca.

\(\beta_{j}\) : Efecto del j-ésimo periodo.

\((\alpha\beta)_{ij}\): Efecto de la interacción entre la i-ésima marca y el jésimo periodo.

\(\varepsilon_{ijk}\): Efecto del error experimental obtenida con la i-ésima marca de concentrado de jugo y el j-ésimo período en la késima repetición.

b. Verificacion de supuestos

modelo<-lm(respuesta~marca+periodo+marca*periodo)

par(mfrow=c(2,2))
plot(modelo)

En el primer gráfico se observa que el lowes de los valores predichos sobre los residuos se sobrepone casi a la recta residuals = 0, esto indica que el supuesto de modelo aditivo lineal se cumple. También, conforme el valor predicho aumenta la dispersión aumenta,es posible que el supuesto de homogeneidad de variancia se cumpla, a pesar que las observaciones 5, 10 y 21 que posiblemente sean valores extremos.

En el segundo gráfico se observa que los cuantiles de los residuales estandarizados están en torno a la recta que contiene los cuantiles teóricos ±2 de la distribución normal estándar salvo la observación 5, 10 y 21 que se encuentran en los extremos, lo cual indicaría que posiblemente se cumpla con el supuesto de normalidad de errores.

En el tercer gráfico se observa que el lowes de los valores predichos sobre los residuales estandarizados tiene una tendencia constante, es posible que el supuesto de homogeneidad se cumpla.

En el cuarto gráfico se observa que los residuos estandarizados y que ninguno sobrepasa los limites +-2, pero podrían ser considerados valores extremos.

  • Supuesto de Normalidad (Shapiro - Wilk)

Prueba de hipótesis
\(H_0\): Los errores tienen distribución normal
\(H_1\): Los errores no tienen distribución normal
Nivel de significancia: α= 5%

ri<-rstandard(modelo)
shapiro.test(ri)
## 
##  Shapiro-Wilk normality test
## 
## data:  ri
## W = 0.95204, p-value = 0.2998

p_valor = 0.2998

Decisión: p_valor > α , No se rechaza \(H_0\)

Conclusión: Con un nivel de significancia de 0.01 ,no existe evidencia estadística para rechazar \(H_0\), por lo tanto los errores presentan distribución normal.

  • Supuesto de homogeneidad de varianza (ncvTest)

Prueba de hipótesis
\(H_0\): Los errores tienen varianzas homogéneas o constantes.
\(H_1\): Los errores no tienen varianzas homogéneas o constantes.

Nivel de significancia: α= 5%

ncvTest(modelo)
## Non-constant Variance Score Test 
## Variance formula: ~ fitted.values 
## Chisquare = 0.0001430365, Df = 1, p = 0.99046

p_valor = 0.99046
Decisión: p_valor > α , No se rechaza \(H_0\)

Conclusión: Con un nivel de significancia de 0.01 ,no existe evidencia estadística para rechazar \(H_0\), por lo tanto las varianzas son homogéneas.

Conclusiones Generales: A un nivel de significancia del 5%:

  • Normalidad: No existe evidencia estadística para rechazar \(H_0\), por lo tanto los errores presentan distribución normal.

  • Homogeneidad: No existe evidencia estadística para rechazar \(H_0\), por lo tanto las varianzas son homogéneas.

  • No es necesario realizar ningún tipo de tranformacion a este nivel de confianza del 5% y se seguira trabajando con el modelo inicial.

c. Gráfico de interacción

interaction.plot(periodo,marca,respuesta)

interaction.plot(marca, periodo,respuesta)

Para el gráfico de marcas como las lineas se cruzan indicaría existe interacción entre ambas marcas.

Para el gráfico de periodo no existe interacción entre entre b1 - b2 pero si existe una mayor fuerza de interacción entre b1 - b3 y b2 - b3.

d. Hipótesis del efecto de interacción. Use α=0.05

Prueba de hipótesis
\(H_0\): \((\alpha\beta)_{ij}\) = 0 ; i=1,2 ; j=1,2,3.
\(H_1\):\((\alpha\beta)_{ij}\) =! 0 ; para al menos algún i,j.

Nivel de significancia: α=0.05

modelo<-lm(respuesta~marca+periodo+marca*periodo)
summary(aov(modelo))
##               Df Sum Sq Mean Sq F value Pr(>F)  
## marca          1   0.11    0.11   0.008 0.9286  
## periodo        2 107.65   53.82   4.164 0.0326 *
## marca:periodo  2 105.44   52.72   4.079 0.0346 *
## Residuals     18 232.67   12.93                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

p_valor = 0.0346

Decisión: p_valor > α , Se rechaza \(H_0\)

Conclusión: Existe evidencia estadística para afirmar que existe interacción entre la marca de concentrados de jugo de naranja congelado y el periodo de almacenamiento.

e. Análisis de efectos simples. α=0.05

  • Prueba de hipótesis para efecto Abj

A en b1
\(H_0\): \(μ_{11}\)=\(μ_{21}\)
\(H_1\): \(μ_{11}\)\(μ_{21}\)

A en b2
\(H_0\): \(μ_{12}\)=\(μ_{22}\)
\(H_1\): \(μ_{12}\)\(μ_{22}\)

A en b3
\(H_0\): \(μ_{13}\)=\(μ_{23}\)
\(H_1\): \(μ_{13}\)\(μ_{23}\)

testInteractions(modelo,fixed = "periodo",across = "marca", adjustment = "none")
  • Conclusión: No existen diferencias significativas entre las marcas de concentrado de jugo de naranja tanto a los 0 como a los 3 días de almacenamiento, pero que sí existe diferencia significativa entre las marcas a los 7 días, respecto al contenido medio de ácido ascórbico.

  • Prueba de hipótesis para efecto Bai

B en a1
\(H_0\): \(μ_{11}\)=\(μ_{12}\)=\(μ_{13}\)
\(H_1\): \(μ_{11}\)\(μ_{12}\)\(μ_{13}\)

B en a2
\(H_0\): \(μ_{21}\)=\(μ_{22}\)=\(μ_{23}\)
\(H_1\): \(μ_{21}\)\(μ_{22}\)\(μ_{23}\)

testInteractions(modelo,fixed = "marca",across = "periodo", adjustment = "none")
  • Conclusión: Al utilizar la marca 1 de concentrado de jugo de naranja, al menos uno de los períodos de almacenamiento presenta diferencias significativas con los demás, pero al utilizar la marca 2 no se presentaron diferencias significativas entre los períodos de almacenamiento, respecto al contenido medio de ácido ascórbico.

f. Prueba de Tukey para el efecto simple Ba1. Use α=0.05

factor = B y marca = a1

marca_a1=datos[datos$marca=="a1",]
respuesta1=marca_a1$respuesta
periodoa1=as.factor(marca_a1$periodo)

modelo2=lm(respuesta1~periodoa1,data=marca_a1)
library(multcomp)
ptukey=glht(modelo2,linfct = mcp(periodoa1="Tukey"))
summary(ptukey)
## 
##   Simultaneous Tests for General Linear Hypotheses
## 
## Multiple Comparisons of Means: Tukey Contrasts
## 
## 
## Fit: lm(formula = respuesta1 ~ periodoa1, data = marca_a1)
## 
## Linear Hypotheses:
##              Estimate Std. Error t value Pr(>|t|)  
## b2 - b1 == 0   -4.125      2.766  -1.492   0.3392  
## b3 - b1 == 0   -7.900      2.766  -2.857   0.0451 *
## b3 - b2 == 0   -3.775      2.766  -1.365   0.3978  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)

En la marca 1:

  • Se encontró diferencia significativa al 5% entre los periodos de 0 días y 7 días.
  • No se encontró diferencia significativa al 5% entre los periodos de 0 días y 3 días.
  • No se encontró diferencia significativa al 5% entre los periodos de 3 días y 7 días.

g. Prueba de hipotesis T

Verifique si hay evidencias estadísticas para afirmar que con el periodo de 0 días se obtiene un promedio de ácido ascórbico que excede en más de 2.5 miligramos por litro al promedio que se obtiene durante el periodo de 7 días considerando la marca 1 en el concentrado de jugo de naranja. Use α=0.05

\(H_0\): \(μ_{11}\)-\(μ_{13}\)<=2.5
\(H_1\): \(μ_{11}\)-\(μ_{13}\)>2.5

summary(aov(modelo))
##               Df Sum Sq Mean Sq F value Pr(>F)  
## marca          1   0.11    0.11   0.008 0.9286  
## periodo        2 107.65   53.82   4.164 0.0326 *
## marca:periodo  2 105.44   52.72   4.079 0.0346 *
## Residuals     18 232.67   12.93                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tcrit= -qt(0.05,18)
Tcrit
## [1] 1.734064
tcal<-(52.775 - 44.875-2.5)/sqrt(2*(12.9258)/4)
tcal
## [1] 2.124125

T calculado = 2.124125
T critico = 1.734064

Decisión: T calculado > T critico, Se rechaza \(H_0\).

Conclusión: Existe evidencia estadística para afirmar que con el periodo de 0 días se obtiene un promedio de ácido ascórbico que excede en más de 2.5 mg por litro al que se obtiene durante el periodo de 7 días, considerando la marca 1 en el concentrado de jugo de naranja.