El director de entrenamiento de una compañía está tratando de evaluar tres diferentes métodos de entrenamiento para empleados nuevos, registrando la producción diaria después del entrenamiento.
Met 1: Asignar un empleado nuevo con un trabajador experimentado.
Met 2: Ubicar a todos los empleados nuevos en un salón de entrenamiento separado de la fábrica.
Met 3: Utilizar películas de entrenamiento y materiales de aprendizaje programado.
#setwd("E:\\TallerMexEdo\\BaseDiseños\\Base")
prod=read.table("F:\\TallerMexEdo\\BaseDiseños\\Base\\aprod.txt",T)
prod=data.frame(prod)
head(prod)
tra produccion
1 M1 28
2 M2 18
3 M3 22
4 M1 27
5 M2 17
6 M3 18
Ho: No hay diferencia en la producción promedio diaria que obtiene un empleado nuevo cuando se le entrena con cualquiera de los tres métodos.
H1: Hay diferencia en la producción promedio diaria que obtiene un empleado nuevo cuando se le entrena con alguno de los tres métodos.
Nivel de significación= 0.05
pd=lm(produccion~tra,prod)
anova(pd)
Analysis of Variance Table
Response: produccion
Df Sum Sq Mean Sq F value Pr(>F)
tra 2 115.73 57.867 9.234 0.003733 **
Residuals 12 75.20 6.267
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Conclusión: Con un nivel de significancia del 5% se puede afirmar que los métodos de entrenamiento producen un efecto diferente en la producción diaria que obtienen un empleado nuevo.
par(mfrow=c(2,2))
plot(pd)
error=rstandard(pd)
head(error)
1 2 3 4 5 6
1.4291792 -0.1786474 1.0718844 0.9825607 -0.6252659 -0.7145896
shapiro.test(error)
Shapiro-Wilk normality test
data: error
W = 0.94731, p-value = 0.4831
Prueba de Bartlett
library(car)
bartlett.test(produccion~tra,prod)
Bartlett test of homogeneity of variances
data: produccion by tra
Bartlett's K-squared = 0.23827, df = 2, p-value = 0.8877
Prueba de Levene
library(car)
leveneTest(produccion~tra,prod)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.2258 0.8012
12
library(zoo)
library(lmtest)
dwtest(pd)
Durbin-Watson test
data: pd
DW = 2.1165, p-value = 0.6842
alternative hypothesis: true autocorrelation is greater than 0
¿QUÉ MÉTODO ES MÁS EFECTIVO?
¿CUÁL DEBERÍA ADOPTAR EL DIRECTOR DE ENTRENAMIENTO? ### Comparaciones Múltiples
library(multcomp)
library(RcmdrMisc)
modg<-aov(produccion~tra,prod)
summary(modg)
Df Sum Sq Mean Sq F value Pr(>F)
tra 2 115.7 57.87 9.234 0.00373 **
Residuals 12 75.2 6.27
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
with(prod, numSummary(produccion, groups=prod$tra, statistics=c("mean", "sd")))
mean sd data:n
M1 24.8 2.863564 5
M2 18.4 2.302173 5
M3 19.6 2.302173 5
local({
.Pairs <- glht(modg, linfct = mcp(tra = "Tukey"))
print(summary(.Pairs)) # pairwise tests
print(confint(.Pairs)) # confidence intervals
print(cld(.Pairs)) # compact letter display
old.oma <- par(oma=c(0,5,0,0))
plot(confint(.Pairs))
par(old.oma)
})
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = produccion ~ tra, data = prod)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
M2 - M1 == 0 -6.400 1.583 -4.042 0.00436 **
M3 - M1 == 0 -5.200 1.583 -3.284 0.01647 *
M3 - M2 == 0 1.200 1.583 0.758 0.73471
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = produccion ~ tra, data = prod)
Quantile = 2.6701
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr upr
M2 - M1 == 0 -6.4000 -10.6275 -2.1725
M3 - M1 == 0 -5.2000 -9.4275 -0.9725
M3 - M2 == 0 1.2000 -3.0275 5.4275
M1 M2 M3
"b" "a" "a"
numSummary(prod[,"produccion"], groups=prod$tra, statistics=c("mean", "sd"))
mean sd data:n
M1 24.8 2.863564 5
M2 18.4 2.302173 5
M3 19.6 2.302173 5
Se concluye que no hay diferencias significativas entre estos los métodos 3 y 2, pero si hay diferencias significativas de ambos con respecto al método 1.
Por lo tanto, el método 1 es el más efectivo, la producción promedio por día es mayor para este método con respecto a los método 2 y 3.
En un estudio se asignan tres dietas por un período de tres días a cada uno de seis sujetos en un diseño de bloques completos al azar. A los sujetos, que juegan el papel de bloques, se les asignan las siguientes tres dietas en orden aleatorio.
Dieta 1: mezcla de grasa y carbohidratos,
Dieta 2: alta en grasa
Dieta 3: alta en carbohidratos.
Al final del período de tres días cada sujeto se coloca un aparato para caminata y se mide el tiempo de agotamiento en segundos. Se registraron los siguientes datos:
#setwd("E:\\TallerMexEdo\\BaseDiseños\\Base")
diet=read.table("F:\\TallerMexEdo\\BaseDiseños\\Base\\diet.txt",T)
head(diet)
sujeto dieta agotamiento
1 s1 d1 84
2 s2 d1 35
3 s3 d1 91
4 s4 d1 57
5 s5 d1 56
6 s6 d1 45
Ho: Las dietas producen el mismo tiempo promedio de agotamiento en los sujetos.
H1: Al menos una de las dietas produce tiempos promedios de agotamiento diferentes.
Nivel de significación= 0.05
modiet=lm(agotamiento~sujeto+dieta,diet)
anova(modiet)
Analysis of Variance Table
Response: agotamiento
Df Sum Sq Mean Sq F value Pr(>F)
sujeto 5 6033.3 1206.67 6.6605 0.005595 **
dieta 2 4297.0 2148.50 11.8592 0.002294 **
Residuals 10 1811.7 181.17
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Conclusión: Al nivel de significación del 5% se puede concluir que el tipo de dieta afecta al tiempo de agotamiento de una persona. También podemos decir que, al menos una de las dietas producirán un tiempo promedio diferente de agotamiento.
par(mfrow=c(2,2))
plot(modiet)
error=rstandard(modiet)
head(error)
1 2 3 4 5 6
-0.3322583 0.1329033 1.1961299 1.0964524 -0.1661292 -1.9270982
shapiro.test(error)
Shapiro-Wilk normality test
data: error
W = 0.9612, p-value = 0.6249
Prueba De Puntaje Para Varianza De Error No Constante
library(car)
ncvTest(modiet)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 0.03396116 Df = 1 p = 0.8537895
library(zoo)
library(lmtest)
dwtest(modiet)
Durbin-Watson test
data: modiet
DW = 1.6012, p-value = 0.1255
alternative hypothesis: true autocorrelation is greater than 0
library(multcomp)
library(RcmdrMisc)
modg<-aov(agotamiento~dieta+sujeto,diet)
summary(modg)
Df Sum Sq Mean Sq F value Pr(>F)
dieta 2 4297 2148.5 11.859 0.00229 **
sujeto 5 6033 1206.7 6.661 0.00559 **
Residuals 10 1812 181.2
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
with(diet, numSummary(agotamiento, groups=diet$dieta, statistics=c("mean", "sd")))
mean sd data:n
d1 61.33333 21.91499 6
d2 62.83333 16.76206 6
d3 94.83333 28.42124 6
local({
.Pairs <- glht(modg, linfct = mcp(dieta = "Tukey"))
print(summary(.Pairs)) # pairwise tests
print(confint(.Pairs)) # confidence intervals
print(cld(.Pairs)) # compact letter display
old.oma <- par(oma=c(0,5,0,0))
plot(confint(.Pairs))
par(old.oma)
})
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = agotamiento ~ dieta + sujeto, data = diet)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
d2 - d1 == 0 1.500 7.771 0.193 0.97970
d3 - d1 == 0 33.500 7.771 4.311 0.00386 **
d3 - d2 == 0 32.000 7.771 4.118 0.00535 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = agotamiento ~ dieta + sujeto, data = diet)
Quantile = 2.7437
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr upr
d2 - d1 == 0 1.5000 -19.8210 22.8210
d3 - d1 == 0 33.5000 12.1790 54.8210
d3 - d2 == 0 32.0000 10.6790 53.3210
d1 d2 d3
"a" "a" "b"
numSummary(diet[,"agotamiento"], groups=diet$dieta, statistics=c("mean", "sd"))
mean sd data:n
d1 61.33333 21.91499 6
d2 62.83333 16.76206 6
d3 94.83333 28.42124 6
Con un nivel de significación del 5%, la dieta 3 es la que produce mayor agotamiento.