1 ANOVA a una vía

17.9 Se pide a muestras de cuatro vendedores de 4 regiones distintas que predigan los aumentos porcentuales del volumen de ventas de sus territorios en los proximos 12 meses. La tabla adjunta muestra las predicciones

Oeste Norte Sur Este
6,8 7,2 4,2 9.0
4,2 6,6 4,8 8.0
5,4 5,8 5,8 7.2
5,0 7,0 4,6 7.6

Se cumplen los supuestos de normalidad e igualdad de varianzas.
Se desea hacer la prueba de hipótesis:

\[ H_0: \mu_1=\mu_2=\mu_3=\mu_4 \\ H_1: \mu_i \ne \mu_j, i \ne j \] Es decir, se desea comprobar si las medias poblacionales son iguales frente a la alternativa de que hay al menos dos medias poblacionales diferentes. La prueba es de cola derecha. Para hacer la prueba se debe hacer la tabla de ANOVA, de la siguiente manera:

y <- c(6.8,4.2,5.4,5,7.2,6.6,5.8,7,4.2,4.8,5.8,4.6,9,8,7.2,7.6)
x <- as.factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4)))
datos = data.frame(y,x)
datos
     y x
1  6.8 1
2  4.2 1
3  5.4 1
4  5.0 1
5  7.2 2
6  6.6 2
7  5.8 2
8  7.0 2
9  4.2 3
10 4.8 3
11 5.8 3
12 4.6 3
13 9.0 4
14 8.0 4
15 7.2 4
16 7.6 4

1.1 Tabla ANOVA

m = aov(formula(y ~ x), datos)
summary(m)
            Df Sum Sq Mean Sq F value   Pr(>F)    
x            3  23.24   7.747    11.8 0.000684 ***
Residuals   12   7.88   0.657                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Como el valor−p <0.01 rechaza la hipotesis nula de que las medias son iguales al 1% y acepta la alternativa de que al menos un par de medias es diferente.

pval=1-pf(11.8,2,8)
curve(df(x,3,12),0,8 , main="Prueba F", ylab="f(x)")
abline(v=3.77,col="red")
text(4.5,0.2,"valor-p")
text(4.5,0.1, round(pval,4))

1.2 Decisión:

Rechaza \(H_0\) al 1% y acepta \(H_1\)

1.3 Comparaciones múltiples

pairwise.t.test(y,x,pool.sd = TRUE,p.adjust.method = "none")

    Pairwise comparisons using t tests with pooled SD 

data:  y and x 

  1       2       3      
2 0.04253 -       -      
3 0.40001 0.00851 -      
4 0.00068 0.04253 0.00016

P value adjustment method: none 

1.4 Medias muestrales

aggregate(y ~x, FUN= mean)
  x    y
1 1 5.35
2 2 6.65
3 3 4.85
4 4 7.95

\[ \underline{\mu_3 \qquad \mu_1 } \qquad \mu_2 \qquad \mu_4 \]

2 Prueba de Kruskal-Wallis

17.9 Si no se cumplen los supuestos de normalidad e igualdad de varianzas se hace la prueba de Kruskal-Wallisb.

\[ H_{0}: \text{Las predicciones de los aumentos porcentuales del volumen de ventas son iguales }\\ H_{1}: \text{No todas las las predicciones de los aumentos porcentuales del volumen de ventas son iguales} \]

2.1 Datos

kw = kruskal.test(y,x)
kw

    Kruskal-Wallis rank sum test

data:  y and x
Kruskal-Wallis chi-squared = 11.571, df = 3, p-value = 0.009006
k=3
curve(dchisq(x,k),0,30 , main="Prueba de Kruskal-Wallis", ylab="f(x)")
abline(v=kw$statistic,col="red")
text(15,0.04,"valor-p")
text(15,0.02, round(kw$p.value,4))

3 ANOVA a dos vías

17.32 Una empresa ha hecho uin estudio de mercado de tres nuevos tipos de sopa en algunas tiendas de sopa en algunas tiendas durante un periodo de un año.La tabla muestra las ventas (en miles de dolares) de cada una de las tres sopas en cada trimestre dela año.

Trimestre A B C
1 47 57 65
2 63 63 76
3 79 67 54
4 52 50 49

3.1 Datos

dat=c(47,63,79,52,57,63,67,50,65,76,54,49)
tra=as.factor(c(rep(1,4),rep(2,4),rep(3,4)))
blq=as.factor(c(rep(c(1,2,3,4),3)))
dfbl= data.frame(dat,tra,blq)
dbq= aov(dat ~ tra + blq, data=dfbl)
dfbl
   dat tra blq
1   47   1   1
2   63   1   2
3   79   1   3
4   52   1   4
5   57   2   1
6   63   2   2
7   67   2   3
8   50   2   4
9   65   3   1
10  76   3   2
11  54   3   3
12  49   3   4

3.2 Análisis de varianza

summary(dbq)
            Df Sum Sq Mean Sq F value Pr(>F)
tra          2    6.2    3.08   0.032  0.969
blq          3  615.0  205.00   2.097  0.202
Residuals    6  586.5   97.75               
sum(dat^2)
[1] 44648

3.3 Hipótesis

\[ H_{0}: \text{Las medias de las ventas de los 3 tipos de sopa son iguales}\\ H_{1}: \text{Hay al menos dos tipos de sopa con medias diferentes} \] \[ H_{0}: \text{Las medias de los trimestres son iguales}\\ H_{1}: \text{Hay al menos dos trimestres con medias diferentes} \]

3.3.1 Decisión

No se rechaza \(H_{0}\) al 5% y se acepta \(H_{0}\). Es decir no hay diferencias entre los promedios de las ventas de los tres tipos de sopa y no hay diferencia entre los promedios de los trimestres.