Taller ANOVA experimento de un factor completo al azar de efectos fijos

Author

Maura Moreno - isabella Petro - Yhony Vargas - Isa Morelo

TALLER

1. Realice el análisis de varianza (ANOVA) para el experimento:

a. (10%) Identifique cada uno de los elementos del experimento (factor de interés, variable respuesta, niveles o tratamientos, réplicas.)

  • Factor de interés: Tipo de mostrador

  • Variable Respuesta: Porcentaje de incremento en ventas

  • Niveles: Tipo de mostrador 1, 2 y 3

  • Replicas: 5

b. (10%) Planteé las hipótesis para el análisis de varianza del experimento, tanto basada en las medias, como basada en los efectos de los tratamientos, explique su significado basado en los datos del experimento.

  • Prueba de hipótesis basada en las medias

\(H_0:\) Las medias poblacionales de los niveles 1, 2 y 3 son iguales
\(H_0: \mu_1=\mu_2=\mu_3\)

\(H_1:\) Para al menos 2 niveles sus medias poblacionales son distintas
\(H_1: \mu_i\neq \mu_k\) , para al menos un par\((i,k), i\neq k,\) \(i,k=1,2,3\)

  • Prueba de hipótesis basada en los efectos de los tratamientos

\(H_0:\) Los efectos del tratamiento de todos los niveles son iguales a 0
\(H_0: \tau_1=\tau_2=\tau_3=0\)

\(H_1:\) Al menos un efecto del tratamiento de un nivel es distintos de 0
\(H_1: \tau_i\neq0\) para al menos un i, \(i = 1,2,3\)

c. (50%) Realice el análisis de varianza para el experimento. Muestre los cálculos (en R) de la suma de cuadrados, grados de libertad, cuadrados medios, estadístico de prueba y valor crítico.

library(readxl)
datos <- read_excel("base de datos taller 2 DE.xlsx")
datos$niveles <- as.factor(datos$niveles)
modelo <- lm(incremento~niveles, datos)
anova <- aov(modelo)
summary(anova)
            Df Sum Sq Mean Sq F value   Pr(>F)    
niveles      2  18.78   9.392   35.77 8.78e-06 ***
Residuals   12   3.15   0.263                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  • Suma de cuadrados

    \(SS_{tratamientos }= \left [ \frac{1}{n} \sum_{i=1}^{a}y{_{i.}}^{2}\right ]-\frac{y..^{2}}{N} = \left [ \frac{1}{5} \sum_{i=1}^{3}y{_{i.}}^{2}\right ]-\frac{y..^{2}}{15}=18.78\)

    \(SS_{total }= \left [ \sum_{i=1}^{a}\sum_{j=1}^{n}y{_{i}}^{2}_{j}\right ]-\frac{y..^{2}}{N}= \left [ \sum_{i=1}^{3}\sum_{j=1}^{5}y{_{i}}^{2}_{j}\right ]-\frac{y..^{2}}{15}=21.93\)

    \(SS_{error}= 21.93-18.78=3.15\)

  • Grados de libertad

    \(\textit{DFtrat= a - 1 } = 3-1=2\)

    \(\textit{DFerror= N - a } = 15-3=12\)

    \(\textit{DFtotal= N - 1 } = 15-1=14\)

  • Cuadrados medios

    \(MS_{tratamientos}=\frac{SS_{tratamientos}}{\textit{Grados de libertad tratamientos}}=9.39\)

    \(MS_{error}=\frac{SS_{error}}{DF_{error}}=0.26\)

  • Estadístico de prueb

    \(F_{o} =\frac{MS_{tratamientos}}{MS_{error}}= 35.77\)

  • Valor crítico

    \(p_{value} < \alpha\)

    \(8.78x10^{-6} < 0.05\)

d. (30%) Calcule y compare con el cuantil de la distribución de referencia, concluya sobre las hipótesis basadas en la información del experimento.

qf(0.05,2,12, lower.tail = F)
[1] 3.885294

dado que:

\(F_0=35.77\)

\(F_\alpha, a-1, N-a = 3.885294\)

y

\(F_0 > F_\alpha, a-1, N-a\)

Existe evidencia científica para rechazar \(H_0\) por tanto la media poblacional de al menos un nivel es diferente, por lo que se concluye que al menos un tipo de mostrador tiene efecto en el porcentaje del incremento en las ventas y la fuente de variabilidad de la variable respuesta no es el error