17.9 Se pide a muestras de cuatro vendedores de 4 regiones distintas que predigan los aumentos porcentuales del volumen de ventas de sus territorios en los proximos 12 meses. La tabla adjunta muestra las predicciones
Oeste | Norte | Sur | Este | ||
---|---|---|---|---|---|
6,8 | 7,2 | 4,2 | 9.0 | ||
4,2 | 6,6 | 4,8 | 8.0 | ||
5,4 | 5,8 | 5,8 | 7.2 | ||
5,0 | 7,0 | 4,6 | 7.6 |
Se cumplen los supuestos de normalidad e igualdad de varianzas.
Se desea hacer la prueba de hipótesis:
\[ H_0: \mu_1=\mu_2=\mu_3=\mu_4 \\ H_1: \mu_i \ne \mu_j, i \ne j \] Es decir, se desea comprobar si las medias poblacionales son iguales frente a la alternativa de que hay al menos dos medias poblacionales diferentes. La prueba es de cola derecha. Para hacer la prueba se debe hacer la tabla de ANOVA, de la siguiente manera:
y <- c(6.8,4.2,5.4,5,7.2,6.6,5.8,7,4.2,4.8,5.8,4.6,9,8,7.2,7.6)
x <- as.factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4)))
datos = data.frame(y,x)
datos
y x
1 6.8 1
2 4.2 1
3 5.4 1
4 5.0 1
5 7.2 2
6 6.6 2
7 5.8 2
8 7.0 2
9 4.2 3
10 4.8 3
11 5.8 3
12 4.6 3
13 9.0 4
14 8.0 4
15 7.2 4
16 7.6 4
m = aov(formula(y ~ x), datos)
summary(m)
Df Sum Sq Mean Sq F value Pr(>F)
x 3 23.24 7.747 11.8 0.000684 ***
Residuals 12 7.88 0.657
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como el valor−p <0.01 rechaza la hipotesis nula de que las medias son iguales al 1% y acepta la alternativa de que al menos un par de medias es diferente.
pval=1-pf(11.8,2,8)
curve(df(x,3,12),0,8 , main="Prueba F", ylab="f(x)")
abline(v=3.77,col="red")
text(4.5,0.2,"valor-p")
text(4.5,0.1, round(pval,4))
Rechaza \(H_0\) al 1% y acepta \(H_1\)
pairwise.t.test(y,x,pool.sd = TRUE,p.adjust.method = "none")
Pairwise comparisons using t tests with pooled SD
data: y and x
1 2 3
2 0.04253 - -
3 0.40001 0.00851 -
4 0.00068 0.04253 0.00016
P value adjustment method: none
aggregate(y ~x, FUN= mean)
x y
1 1 5.35
2 2 6.65
3 3 4.85
4 4 7.95
\[ \underline{\mu_3 \qquad \mu_1 } \qquad \mu_2 \qquad \mu_4 \]
17.9 Si no se cumplen los supuestos de normalidad e igualdad de varianzas se hace la prueba de Kruskal-Wallisb.
\[ H_{0}: \text{Las predicciones de los aumentos porcentuales del volumen de ventas son iguales }\\ H_{1}: \text{No todas las las predicciones de los aumentos porcentuales del volumen de ventas son iguales} \]
kw = kruskal.test(y,x)
kw
Kruskal-Wallis rank sum test
data: y and x
Kruskal-Wallis chi-squared = 11.571, df = 3, p-value = 0.009006
k=3
curve(dchisq(x,k),0,30 , main="Prueba de Kruskal-Wallis", ylab="f(x)")
abline(v=kw$statistic,col="red")
text(15,0.04,"valor-p")
text(15,0.02, round(kw$p.value,4))
17.32 Una empresa ha hecho uin estudio de mercado de tres nuevos tipos de sopa en algunas tiendas de sopa en algunas tiendas durante un periodo de un año.La tabla muestra las ventas (en miles de dolares) de cada una de las tres sopas en cada trimestre dela año.
Trimestre | A | B | C |
---|---|---|---|
1 | 47 | 57 | 65 |
2 | 63 | 63 | 76 |
3 | 79 | 67 | 54 |
4 | 52 | 50 | 49 |
dat=c(47,63,79,52,57,63,67,50,65,76,54,49)
tra=as.factor(c(rep(1,4),rep(2,4),rep(3,4)))
blq=as.factor(c(rep(c(1,2,3,4),3)))
dfbl= data.frame(dat,tra,blq)
dbq= aov(dat ~ tra + blq, data=dfbl)
dfbl
dat tra blq
1 47 1 1
2 63 1 2
3 79 1 3
4 52 1 4
5 57 2 1
6 63 2 2
7 67 2 3
8 50 2 4
9 65 3 1
10 76 3 2
11 54 3 3
12 49 3 4
summary(dbq)
Df Sum Sq Mean Sq F value Pr(>F)
tra 2 6.2 3.08 0.032 0.969
blq 3 615.0 205.00 2.097 0.202
Residuals 6 586.5 97.75
sum(dat^2)
[1] 44648
\[ H_{0}: \text{Las medias de las ventas de los 3 tipos de sopa son iguales}\\ H_{1}: \text{Hay al menos dos tipos de sopa con medias diferentes} \] \[ H_{0}: \text{Las medias de los trimestres son iguales}\\ H_{1}: \text{Hay al menos dos trimestres con medias diferentes} \]
No se rechaza \(H_{0}\) al 5% y se acepta \(H_{0}\). Es decir no hay diferencias entre los promedios de las ventas de los tres tipos de sopa y no hay diferencia entre los promedios de los trimestres.