Diseño Completamente Aleatorizado (DCA)

Ejemplo

ENTRENAMIENTO PARA EMPLEADOS NUEVOS

El director de entrenamiento de una compañía está tratando de evaluar tres diferentes métodos de entrenamiento para empleados nuevos, registrando la producción diaria después del entrenamiento.

Met 1: Asignar un empleado nuevo con un trabajador experimentado.

Met 2: Ubicar a todos los empleados nuevos en un salón de entrenamiento separado de la fábrica.

Met 3: Utilizar películas de entrenamiento y materiales de aprendizaje programado.

#setwd("E:\\TallerMexEdo\\BaseDiseños\\Base")
prod=read.table("F:\\TallerMexEdo\\BaseDiseños\\Base\\aprod.txt",T)
prod=data.frame(prod)
head(prod)
    tra produccion
  1  M1         28
  2  M2         18
  3  M3         22
  4  M1         27
  5  M2         17
  6  M3         18

HIPÓTESIS

Ho: No hay diferencia en la producción promedio diaria que obtiene un empleado nuevo cuando se le entrena con cualquiera de los tres métodos.

H1: Hay diferencia en la producción promedio diaria que obtiene un empleado nuevo cuando se le entrena con alguno de los tres métodos.

Nivel de significación= 0.05

pd=lm(produccion~tra,prod)
anova(pd)
  Analysis of Variance Table
  
  Response: produccion
            Df Sum Sq Mean Sq F value   Pr(>F)   
  tra        2 115.73  57.867   9.234 0.003733 **
  Residuals 12  75.20   6.267                    
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Conclusión: Con un nivel de significancia del 5% se puede afirmar que los métodos de entrenamiento producen un efecto diferente en la producción diaria que obtienen un empleado nuevo.

Verificación de Supuestos

par(mfrow=c(2,2))
plot(pd)

error=rstandard(pd)
head(error)
           1          2          3          4          5          6 
   1.4291792 -0.1786474  1.0718844  0.9825607 -0.6252659 -0.7145896
shapiro.test(error)
  
    Shapiro-Wilk normality test
  
  data:  error
  W = 0.94731, p-value = 0.4831

Prueba de Bartlett

library(car)
bartlett.test(produccion~tra,prod)
  
    Bartlett test of homogeneity of variances
  
  data:  produccion by tra
  Bartlett's K-squared = 0.23827, df = 2, p-value = 0.8877

Prueba de Levene

library(car)
leveneTest(produccion~tra,prod)
  Levene's Test for Homogeneity of Variance (center = median)
        Df F value Pr(>F)
  group  2  0.2258 0.8012
        12

library(zoo)
library(lmtest)
dwtest(pd)
  
    Durbin-Watson test
  
  data:  pd
  DW = 2.1165, p-value = 0.6842
  alternative hypothesis: true autocorrelation is greater than 0

¿QUÉ MÉTODO ES MÁS EFECTIVO?

¿CUÁL DEBERÍA ADOPTAR EL DIRECTOR DE ENTRENAMIENTO? ### Comparaciones Múltiples

library(multcomp)
library(RcmdrMisc)
modg<-aov(produccion~tra,prod)
summary(modg)
              Df Sum Sq Mean Sq F value  Pr(>F)   
  tra          2  115.7   57.87   9.234 0.00373 **
  Residuals   12   75.2    6.27                   
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
with(prod, numSummary(produccion, groups=prod$tra, statistics=c("mean", "sd")))
     mean       sd data:n
  M1 24.8 2.863564      5
  M2 18.4 2.302173      5
  M3 19.6 2.302173      5
local({
  .Pairs <- glht(modg, linfct = mcp(tra = "Tukey"))
  print(summary(.Pairs)) # pairwise tests
  print(confint(.Pairs)) # confidence intervals
  print(cld(.Pairs)) # compact letter display
  old.oma <- par(oma=c(0,5,0,0))
  plot(confint(.Pairs))
  par(old.oma)
})
  
     Simultaneous Tests for General Linear Hypotheses
  
  Multiple Comparisons of Means: Tukey Contrasts
  
  
  Fit: aov(formula = produccion ~ tra, data = prod)
  
  Linear Hypotheses:
               Estimate Std. Error t value Pr(>|t|)   
  M2 - M1 == 0   -6.400      1.583  -4.042  0.00436 **
  M3 - M1 == 0   -5.200      1.583  -3.284  0.01647 * 
  M3 - M2 == 0    1.200      1.583   0.758  0.73471   
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  (Adjusted p values reported -- single-step method)
  
  
     Simultaneous Confidence Intervals
  
  Multiple Comparisons of Means: Tukey Contrasts
  
  
  Fit: aov(formula = produccion ~ tra, data = prod)
  
  Quantile = 2.6701
  95% family-wise confidence level
   
  
  Linear Hypotheses:
               Estimate lwr      upr     
  M2 - M1 == 0  -6.4000 -10.6275  -2.1725
  M3 - M1 == 0  -5.2000  -9.4275  -0.9725
  M3 - M2 == 0   1.2000  -3.0275   5.4275
  
   M1  M2  M3 
  "b" "a" "a"

numSummary(prod[,"produccion"], groups=prod$tra, statistics=c("mean", "sd"))
     mean       sd data:n
  M1 24.8 2.863564      5
  M2 18.4 2.302173      5
  M3 19.6 2.302173      5

Se concluye que no hay diferencias significativas entre estos los métodos 3 y 2, pero si hay diferencias significativas de ambos con respecto al método 1.

Por lo tanto, el método 1 es el más efectivo, la producción promedio por día es mayor para este método con respecto a los método 2 y 3.

Diseño de Bloques Completamente al Azar (DBCA)

Ejemplo

En un estudio se asignan tres dietas por un período de tres días a cada uno de seis sujetos en un diseño de bloques completos al azar. A los sujetos, que juegan el papel de bloques, se les asignan las siguientes tres dietas en orden aleatorio.

Dieta 1: mezcla de grasa y carbohidratos,

Dieta 2: alta en grasa

Dieta 3: alta en carbohidratos.

Al final del período de tres días cada sujeto se coloca un aparato para caminata y se mide el tiempo de agotamiento en segundos. Se registraron los siguientes datos:

#setwd("E:\\TallerMexEdo\\BaseDiseños\\Base")
diet=read.table("F:\\TallerMexEdo\\BaseDiseños\\Base\\diet.txt",T)
head(diet)
    sujeto dieta agotamiento
  1     s1    d1          84
  2     s2    d1          35
  3     s3    d1          91
  4     s4    d1          57
  5     s5    d1          56
  6     s6    d1          45

HIPÓTESIS

Ho: Las dietas producen el mismo tiempo promedio de agotamiento en los sujetos.

H1: Al menos una de las dietas produce tiempos promedios de agotamiento diferentes.

Nivel de significación= 0.05

modiet=lm(agotamiento~sujeto+dieta,diet)
anova(modiet)
  Analysis of Variance Table
  
  Response: agotamiento
            Df Sum Sq Mean Sq F value   Pr(>F)   
  sujeto     5 6033.3 1206.67  6.6605 0.005595 **
  dieta      2 4297.0 2148.50 11.8592 0.002294 **
  Residuals 10 1811.7  181.17                    
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Conclusión: Al nivel de significación del 5% se puede concluir que el tipo de dieta afecta al tiempo de agotamiento de una persona. También podemos decir que, al menos una de las dietas producirán un tiempo promedio diferente de agotamiento.

Verificación de Supuestos

par(mfrow=c(2,2))
plot(modiet)

error=rstandard(modiet)
head(error)
           1          2          3          4          5          6 
  -0.3322583  0.1329033  1.1961299  1.0964524 -0.1661292 -1.9270982
shapiro.test(error)
  
    Shapiro-Wilk normality test
  
  data:  error
  W = 0.9612, p-value = 0.6249

Prueba De Puntaje Para Varianza De Error No Constante

library(car)
ncvTest(modiet)
  Non-constant Variance Score Test 
  Variance formula: ~ fitted.values 
  Chisquare = 0.03396116    Df = 1     p = 0.8537895

library(zoo)
library(lmtest)
dwtest(modiet)
  
    Durbin-Watson test
  
  data:  modiet
  DW = 1.6012, p-value = 0.1255
  alternative hypothesis: true autocorrelation is greater than 0

Comparaciones Múltiples

library(multcomp)
library(RcmdrMisc)
modg<-aov(agotamiento~dieta+sujeto,diet)
summary(modg)
              Df Sum Sq Mean Sq F value  Pr(>F)   
  dieta        2   4297  2148.5  11.859 0.00229 **
  sujeto       5   6033  1206.7   6.661 0.00559 **
  Residuals   10   1812   181.2                   
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
with(diet, numSummary(agotamiento, groups=diet$dieta, statistics=c("mean", "sd")))
         mean       sd data:n
  d1 61.33333 21.91499      6
  d2 62.83333 16.76206      6
  d3 94.83333 28.42124      6
local({
  .Pairs <- glht(modg, linfct = mcp(dieta = "Tukey"))
  print(summary(.Pairs)) # pairwise tests
  print(confint(.Pairs)) # confidence intervals
  print(cld(.Pairs)) # compact letter display
  old.oma <- par(oma=c(0,5,0,0))
  plot(confint(.Pairs))
  par(old.oma)
})
  
     Simultaneous Tests for General Linear Hypotheses
  
  Multiple Comparisons of Means: Tukey Contrasts
  
  
  Fit: aov(formula = agotamiento ~ dieta + sujeto, data = diet)
  
  Linear Hypotheses:
               Estimate Std. Error t value Pr(>|t|)   
  d2 - d1 == 0    1.500      7.771   0.193  0.97970   
  d3 - d1 == 0   33.500      7.771   4.311  0.00386 **
  d3 - d2 == 0   32.000      7.771   4.118  0.00535 **
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  (Adjusted p values reported -- single-step method)
  
  
     Simultaneous Confidence Intervals
  
  Multiple Comparisons of Means: Tukey Contrasts
  
  
  Fit: aov(formula = agotamiento ~ dieta + sujeto, data = diet)
  
  Quantile = 2.7437
  95% family-wise confidence level
   
  
  Linear Hypotheses:
               Estimate lwr      upr     
  d2 - d1 == 0   1.5000 -19.8210  22.8210
  d3 - d1 == 0  33.5000  12.1790  54.8210
  d3 - d2 == 0  32.0000  10.6790  53.3210
  
   d1  d2  d3 
  "a" "a" "b"

numSummary(diet[,"agotamiento"], groups=diet$dieta, statistics=c("mean", "sd"))
         mean       sd data:n
  d1 61.33333 21.91499      6
  d2 62.83333 16.76206      6
  d3 94.83333 28.42124      6

Con un nivel de significación del 5%, la dieta 3 es la que produce mayor agotamiento.