library(readxl)
datos <- read_excel("base de datos taller 2 DE.xlsx")Taller ANOVA experimento de un factor completo al azar de efectos fijos
TALLER
1. Realice el análisis de varianza (ANOVA) para el experimento:
a. (10%) Identifique cada uno de los elementos del experimento (factor de interés, variable respuesta, niveles o tratamientos, réplicas.)
Factor de interés: Tipo de mostrador
Variable Respuesta: Porcentaje de incremento en ventas
Niveles: Tipo de mostrador 1, 2 y 3
Replicas: 5
b. (10%) Planteé las hipótesis para el análisis de varianza del experimento, tanto basada en las medias, como basada en los efectos de los tratamientos, explique su significado basado en los datos del experimento.
- Prueba de hipótesis basada en las medias
\(H_0:\) Las medias poblacionales de los niveles 1, 2 y 3 son iguales
\(H_0: \mu_1=\mu_2=\mu_3\)
\(H_1:\) Para al menos 2 niveles sus medias poblacionales son distintas
\(H_1: \mu_i\neq \mu_k\) , para al menos un par\((i,k), i\neq k,\) \(i,k=1,2,3\)
- Prueba de hipótesis basada en los efectos de los tratamientos
\(H_0:\) Los efectos del tratamiento de todos los niveles son iguales a 0
\(H_0: \tau_1=\tau_2=\tau_3=0\)
\(H_1:\) Al menos un efecto del tratamiento de un nivel es distintos de 0
\(H_1: \tau_i\neq0\) para al menos un i, \(i = 1,2,3\)
c. (50%) Realice el análisis de varianza para el experimento. Muestre los cálculos (en R) de la suma de cuadrados, grados de libertad, cuadrados medios, estadístico de prueba y valor crítico.
datos$niveles <- as.factor(datos$niveles)modelo <- lm(incremento~niveles, datos)
anova <- aov(modelo)
summary(anova) Df Sum Sq Mean Sq F value Pr(>F)
niveles 2 18.78 9.392 35.77 8.78e-06 ***
Residuals 12 3.15 0.263
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Suma de cuadrados
\(SS_{tratamientos }= \left [ \frac{1}{n} \sum_{i=1}^{a}y{_{i.}}^{2}\right ]-\frac{y..^{2}}{N} = \left [ \frac{1}{5} \sum_{i=1}^{3}y{_{i.}}^{2}\right ]-\frac{y..^{2}}{15}=18.78\)
\(SS_{total }= \left [ \sum_{i=1}^{a}\sum_{j=1}^{n}y{_{i}}^{2}_{j}\right ]-\frac{y..^{2}}{N}= \left [ \sum_{i=1}^{3}\sum_{j=1}^{5}y{_{i}}^{2}_{j}\right ]-\frac{y..^{2}}{15}=21.93\)
\(SS_{error}= 21.93-18.78=3.15\)
Grados de libertad
\(\textit{DFtrat= a - 1 } = 3-1=2\)
\(\textit{DFerror= N - a } = 15-3=12\)
\(\textit{DFtotal= N - 1 } = 15-1=14\)
Cuadrados medios
\(MS_{tratamientos}=\frac{SS_{tratamientos}}{\textit{Grados de libertad tratamientos}}=9.39\)
\(MS_{error}=\frac{SS_{error}}{DF_{error}}=0.26\)
Estadístico de prueb
\(F_{o} =\frac{MS_{tratamientos}}{MS_{error}}= 35.77\)
Valor crítico
\(p_{value} < \alpha\)
\(8.78x10^{-6} < 0.05\)
d. (30%) Calcule y compare con el cuantil de la distribución de referencia, concluya sobre las hipótesis basadas en la información del experimento.
qf(0.05,2,12, lower.tail = F)[1] 3.885294
dado que:
\(F_0=35.77\)
\(F_\alpha, a-1, N-a = 3.885294\)
y
\(F_0 > F_\alpha, a-1, N-a\)
Existe evidencia científica para rechazar \(H_0\) por tanto la media poblacional de al menos un nivel es diferente, por lo que se concluye que al menos un tipo de mostrador tiene efecto en el porcentaje del incremento en las ventas y la fuente de variabilidad de la variable respuesta no es el error