PUNTO 4

Un jefe de ventas de una empresa de fertilizantes estaba interesado en comparar las ventas de tres productos (A,B y C). Para controlar sistemáticamente los efectos de la región y la temporada en las ventas de los productos, se realizó un diseño experimental de cuadrado latino. Los datos sobre ingresos por ventas (en miles de dólares) se dan en la Tabla .Analice los datos y saque las conclusiones apropiadas. Use α = 0.05.

library(readxl)

data <- read_excel("C:\\Users\\Lenovo\\Desktop\\2023-1\\Diseño\\Datos Taller. pto 4.xlsx")

print(data)
## # A tibble: 9 × 4
##   venta producto estacion reg  
##   <dbl> <chr>    <chr>    <chr>
## 1   280 A        E_1      R_2  
## 2   240 A        E_2      R_3  
## 3   220 A        E_3      R_1  
## 4   360 B        E_1      R_3  
## 5   410 B        E_2      R_1  
## 6   384 B        E_3      R_2  
## 7   265 C        E_1      R_1  
## 8   300 C        E_2      R_2  
## 9   251 C        E_3      R_3

ARBOL DE DESICIÓN

library(collapsibleTree)

collapsibleTreeSummary (data, 
                        c("producto", "reg", "estacion", "venta"), 
                        collapsed = FALSE)

MODELO \[Y_{ij} = \mu + \tau_i + \beta_j +\epsilon_{ij}\] ANALISIS DESCRIPTIVO

Bwplot

library(lattice)
bwplot(venta ~ producto|reg + estacion, data)

Boxplot

library(ggplot2)

HIPOTESIS \[H_0: \mu_A= \mu_B = \mu_C\]

\[H_0: \mu_A≠ \mu_B ≠ \mu_C\] TABLA DE ANOVA

Según el arbol, time que es la variable a analizar depende de bloq +sitio

mod = aov( venta ~ producto + reg + estacion , data)
summary(mod)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## producto     2  32380   16190  44.792 0.0218 *
## reg          2   2163    1081   2.992 0.2505  
## estacion     2   1506     753   2.083 0.3244  
## Residuals    2    723     361                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor < 0.05, por tanto se rechaza la hipotesis nula, al menos uno de los productos tiene efecto la venta. No se mira el de los bloqueos.

REVISION DE SUPUESTOS

Prueba de normalidad

#1. Extraemos los residuales 
res_mod = mod$residuals

#2. Prueba de normalidad
shapiro.test(res_mod)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_mod
## W = 0.70608, p-value = 0.001671

En este caso pvalor > 0.05, se cumple supuesto de normalidad.

Prueba de varianzas iguales

#3.Probando homocedasticidad (varianzas iguales)
bartlett.test(res_mod, data$producto)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  res_mod and data$producto
## Bartlett's K-squared = 0, df = 2, p-value = 1

En este caso pvalor> 0.05, se cumple supuesto de varianzas iguales

REVISION DE DATOS ATÍPICOS

#Instalamos libreria 
#Valor p ≤ α: Existe un valor atípico (Rechaza H0)
#
library(outliers)
grubbs.test(mod$residuals)
## 
##  Grubbs test for one outlier
## 
## data:  mod$residuals
## G.5 = 1.32082, U = 0.75467, p-value = 0.7882
## alternative hypothesis: highest value 12.5555555555555 is an outlier

pvalue > 0.05, no se detectaron datos atípicos.

PRUEBA DE TUKEY

library(TukeyC)

tt = TukeyC(mod, "producto")
plot(tt)

No hay diferencias significativas entre los productos C Y A.

Tukey 2

TukeyHSD(mod, conf.level = 0.95)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = venta ~ producto + reg + estacion, data = data)
## 
## $producto
##           diff        lwr       upr     p adj
## B-A  138.00000   46.55795 229.44205 0.0225911
## C-A   25.33333  -66.10872 116.77538 0.4061820
## C-B -112.66667 -204.10872 -21.22462 0.0335115
## 
## $reg
##              diff        lwr       upr     p adj
## R_2-R_1  23.00000  -68.44205 114.44205 0.4534211
## R_3-R_1 -14.66667 -106.10872  76.77538 0.6707084
## R_3-R_2 -37.66667 -129.10872  53.77538 0.2365160
## 
## $estacion
##              diff        lwr       upr     p adj
## E_2-E_1  15.00000  -76.44205 106.44205 0.6607232
## E_3-E_1 -16.66667 -108.10872  74.77538 0.6121017
## E_3-E_2 -31.66667 -123.10872  59.77538 0.3046323

Solo hay diferencias entre sur y norte porque p adj < 0.05