PUNTO 4
Un jefe de ventas de una empresa de fertilizantes estaba interesado en comparar las ventas de tres productos (A,B y C). Para controlar sistemáticamente los efectos de la región y la temporada en las ventas de los productos, se realizó un diseño experimental de cuadrado latino. Los datos sobre ingresos por ventas (en miles de dólares) se dan en la Tabla .Analice los datos y saque las conclusiones apropiadas. Use α = 0.05.
library(readxl)
data <- read_excel("C:\\Users\\Lenovo\\Desktop\\2023-1\\Diseño\\Datos Taller. pto 4.xlsx")
print(data)
## # A tibble: 9 × 4
## venta producto estacion reg
## <dbl> <chr> <chr> <chr>
## 1 280 A E_1 R_2
## 2 240 A E_2 R_3
## 3 220 A E_3 R_1
## 4 360 B E_1 R_3
## 5 410 B E_2 R_1
## 6 384 B E_3 R_2
## 7 265 C E_1 R_1
## 8 300 C E_2 R_2
## 9 251 C E_3 R_3
ARBOL DE DESICIÓN
library(collapsibleTree)
collapsibleTreeSummary (data,
c("producto", "reg", "estacion", "venta"),
collapsed = FALSE)
MODELO \[Y_{ij} = \mu + \tau_i + \beta_j +\epsilon_{ij}\] ANALISIS DESCRIPTIVO
Bwplot
library(lattice)
bwplot(venta ~ producto|reg + estacion, data)
Boxplot
library(ggplot2)
HIPOTESIS \[H_0: \mu_A= \mu_B = \mu_C\]
\[H_0: \mu_A≠ \mu_B ≠ \mu_C\] TABLA DE ANOVA
Según el arbol, time que es la variable a analizar depende de bloq +sitio
mod = aov( venta ~ producto + reg + estacion , data)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## producto 2 32380 16190 44.792 0.0218 *
## reg 2 2163 1081 2.992 0.2505
## estacion 2 1506 753 2.083 0.3244
## Residuals 2 723 361
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalor < 0.05, por tanto se rechaza la hipotesis nula, al menos uno de los productos tiene efecto la venta. No se mira el de los bloqueos.
REVISION DE SUPUESTOS
Prueba de normalidad
#1. Extraemos los residuales
res_mod = mod$residuals
#2. Prueba de normalidad
shapiro.test(res_mod)
##
## Shapiro-Wilk normality test
##
## data: res_mod
## W = 0.70608, p-value = 0.001671
En este caso pvalor > 0.05, se cumple supuesto de normalidad.
Prueba de varianzas iguales
#3.Probando homocedasticidad (varianzas iguales)
bartlett.test(res_mod, data$producto)
##
## Bartlett test of homogeneity of variances
##
## data: res_mod and data$producto
## Bartlett's K-squared = 0, df = 2, p-value = 1
En este caso pvalor> 0.05, se cumple supuesto de varianzas iguales
REVISION DE DATOS ATÍPICOS
#Instalamos libreria
#Valor p ≤ α: Existe un valor atípico (Rechaza H0)
#
library(outliers)
grubbs.test(mod$residuals)
##
## Grubbs test for one outlier
##
## data: mod$residuals
## G.5 = 1.32082, U = 0.75467, p-value = 0.7882
## alternative hypothesis: highest value 12.5555555555555 is an outlier
pvalue > 0.05, no se detectaron datos atípicos.
PRUEBA DE TUKEY
library(TukeyC)
tt = TukeyC(mod, "producto")
plot(tt)
No hay diferencias significativas entre los productos C Y A.
Tukey 2
TukeyHSD(mod, conf.level = 0.95)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = venta ~ producto + reg + estacion, data = data)
##
## $producto
## diff lwr upr p adj
## B-A 138.00000 46.55795 229.44205 0.0225911
## C-A 25.33333 -66.10872 116.77538 0.4061820
## C-B -112.66667 -204.10872 -21.22462 0.0335115
##
## $reg
## diff lwr upr p adj
## R_2-R_1 23.00000 -68.44205 114.44205 0.4534211
## R_3-R_1 -14.66667 -106.10872 76.77538 0.6707084
## R_3-R_2 -37.66667 -129.10872 53.77538 0.2365160
##
## $estacion
## diff lwr upr p adj
## E_2-E_1 15.00000 -76.44205 106.44205 0.6607232
## E_3-E_1 -16.66667 -108.10872 74.77538 0.6121017
## E_3-E_2 -31.66667 -123.10872 59.77538 0.3046323
Solo hay diferencias entre sur y norte porque p adj < 0.05