A lo largo de la historia el intercambio de insumos ha sido pieza fundamental en el desarrollo de la humanidad, estos movimientos surgen de la necesidad de cubrir los requerimientos básicos. Con el paso del tiempo y debido al aumento de la población, las cantidades demandadas debían de ser solventadas en masa, por tal motivo era necesario industrializar esta actividad.
La consolidación de un sistema mundial dedicado a la producción para la venta o el intercambio de mercancías con el objeto de maximizar beneficios entre las naciones ha reemplazado al antiguo sistema de comercio iniciando desde el trueque, pasando por tiendas de raya, grandes almacenes y concluyendo en los supermercados, que tienen en común la característica principal de cubrir las necesidades domésticas.
“De ahí que las sociedades modernas operan de acuerdo con la teoría del sistema mundial en la existencia de una cultura global, caracterizada por las conexiones que se van dando desde la gente local hasta las fuerzas internacionales” (Vinatea, 2008).
El origen de los supermercados se da en los años 60, con el objetivo de sustituir las bodegas minoristas. Es considerado supermercados todos los establecimientos con un volumen de ventas superior a 2 millones de dólares al año. Uno de los principales atractivos de los supermercados radica en la posibilidad de comprar productos diversos en un solo sitio y a bajo costo. Entre las áreas de mayor importancia en los supermercados es la venta de productos frescos, especialmente frutas y vegetales, en promedio esta área cubre el 25% y el 35% del total de ventas en los supermercados. ((IICA), Instituto Interamericano de Cooperación para la Agricultura; 2000)
Según Kottak (2006), los países más fuertes y poderosos del sistema mundial monopolizan las actividades más rentables ejerciendo un dominio y control sobre los países de la periferia. De ahí que la cultura global contemporánea ha manifestado el anhelo de poseer mercancías de todo el mundo. Un claro ejemplo de este dominio es Estados Unidos, un líder indiscutible en la industria minorista que cuenta con una gran variación en la segmentación del mercado, entre los más importantes se encuentran los supermercados o grandes cadenas de distribución.
Estados Unidos es la mayor economía del mundo; claro ejemplo de esto es que si su PIB se compara conta el de China es aproximadamente dos tercios del PIB estadounidense. Según los últimos datos del Departamento de Agricultura de Estados Unidos, indica que la base de la economía se encuentra en los servicios, ya que representa más de tres cuartas partes del PIB (77.3%) y emplea a más del 78,7% de la fuerza laboral del país. El comercio mayorista aportó alrededor del 5,8% y del comercio minorista 5,7% el PIB del país.
Por los datos mencionados con anterioridad y con el hecho de que en cualquier industria lo más importante es obtener el mayor beneficio, el presente trabajo busca que, mediante la utilización de una base de datos de dominio publico correspondiente al primer trimestre de un supermercado estadounidense, poder utilizar herramientas estadísticas que brinden resultados satisfactorios otorgando un resumen de la posición actual del comercio, consolidando un informe que pueda ser útil posteriormente con los análisis propuestos captar las áreas de oportunidad que puedan generar mayores beneficios al establecimiento.
Se busca demostrar la importancia de la extracción e interpretación de los datos en un caso aplicado a la vida real: mediante la identificación de las variables que conforman un a base de datos, poder realizar una selección adecuada que nos ayuden a resolver el problema de interés correspondiente al análisis de las ventas del supermercado para la toma decisiones acerca de las oportunidades de mejora, teniendo como finalidad incrementar el ticket promedio y por consecuencia la utilidad, así como precisar los departamento que pueden aportar mayores o menores ingresos.
Primero que nada, importamos nuestro datos, seleccionamos y renombramos las variables con las que trabajaremos.
ventas_super<- rename(sales_super, Tipo_Supermercado= Branch,
Ciudad = City,
Tipo_Cliente = Customer_type,
Departamento = Product_line,
Precio_Unitario = Unit_price,
Cantidad = Quantity,
Total = Total,
Tipo_Pago = Payment,
Costo = cogs,
Utilidad = gross_income)
names(ventas_super)## [1] "Tipo_Supermercado" "Ciudad" "Tipo_Cliente"
## [4] "Departamento" "Precio_Unitario" "Cantidad"
## [7] "Total" "Tipo_Pago" "Costo"
## [10] "Utilidad"
attach(ventas_super) La base de datos, es una muestra de las ventas de un supermercado en dónde se ven los ciudad donde se realizó la transacción, departamentos a los que pertenecen los productos, cantidad, total y utilidad de la compra. Específicamente las variables que se van a analizar, son las siguientes:
Departamento: Nos indica los departamentos o áreas que hay en el Supermercado, y así mismo en donde se clasifican los productos que esta comprando el consumidor.
Cantidad: Número de artículos que se compraron en ese ticket o venta.
Utilidad: Se refiere al total que pago el cliente menos el costo que nos cobra el provedor, es decir lo que gana el supermercado por esta transacción.
Clasificando estos atributos, tenemos:
| Variable | Tipo | Escala de medición |
|---|---|---|
| Departamento | Cualitativa | Nominal |
| Cantidad | Cuantitativa | Razón |
| Utilidad | Cuantitativa/Continua | Razón |
Empezaremos con el análisis de la variable cualitativa Departamento, viendo en unidades cuanto se vende de cada uno:
Departamento_Cantidad<- aggregate(Cantidad ~ Departamento,ventas_super,sum)
Departamento_Cantidad## Departamento Cantidad
## 1 Electronic accessories 971
## 2 Fashion accessories 902
## 3 Food and beverages 952
## 4 Health and beauty 854
## 5 Home and lifestyle 911
## 6 Sports and travel 920
Observamos que el departamento líder en ventas (Unidades) es Electronic Accesories, seguido de Food and Beverages.
Si lo vemos a nivel monetario, obtenemos la siguiente tabla:
Departamento_Utilidad<- aggregate(Utilidad ~ Departamento,ventas_super,sum)
Departamento_Total<- aggregate(Total ~ Departamento,ventas_super,sum)
Departamento_Utilidad_Total<-cbind(Departamento_Utilidad,Departamento_Total$Total )
Departamento_Utilidad_Total## Departamento Utilidad Departamento_Total$Total
## 1 Electronic accessories 2587.501 54337.53
## 2 Fashion accessories 2585.995 54305.89
## 3 Food and beverages 2673.564 56144.84
## 4 Health and beauty 2342.559 49193.74
## 5 Home and lifestyle 2564.853 53861.91
## 6 Sports and travel 2624.896 55122.83
En este caso, el departamento que nos deja mayor mayor utilidad es Food and Beverages, también es el que representa la demanda mayor en dinero. Por lo tanto, podemos decir que el hecho de que venda más piezas, no significa que nos deja más utilidad.
El siguiente paso en nuestro análisis es sacar la proporción, teniendo como resultado la siguiente tabla:
Pi<-Departamento_Cantidad$Cantidad/sum(Departamento_Cantidad$Cantidad)
Departamento_Cantidad2<- cbind(Departamento_Cantidad,Pi)
Departamento_Cantidad2## Departamento Cantidad Pi
## 1 Electronic accessories 971 0.1762250
## 2 Fashion accessories 902 0.1637024
## 3 Food and beverages 952 0.1727768
## 4 Health and beauty 854 0.1549909
## 5 Home and lifestyle 911 0.1653358
## 6 Sports and travel 920 0.1669691
Observamos que el departamento con mayor probabilidad de venderse es Electronic Accesories, sin embargo los 6 departamentos tienen una proporción muy similar, es decir no varia tanto el porcentaje de la demanda entre ellos.
Esto se confirma con la siguiente gráfica:
pie(proporciones,labels = etiquetas,
col=topo.colors(length(etiquetas)),
main="Departamentos (Frecuencias relativas)")Seguimos con el análisis de nuestra segunda variable: Cantidad. Esta atributo es cuantitivo y discreto.
Empezamos sacando las frecuencias, y observamos que la cantidad de artículos que se llevan por cliente, en este supermercado oscila entre 1 y 10 productos.
(tabla_cant<- table(Cantidad)) #tabla de frecuencias absolutas## Cantidad
## 1 2 3 4 5 6 7 8 9 10
## 112 91 90 109 102 98 102 85 92 119
En la tabla de frecuencias absolutas, se ve que la mayoría de los clientes se llevan sólo 10 productos, lo cual es bastante bueno ya que eso hace que nuestro ticket promedio suba. Sin embargo, la segunda mayor frecuencia es la compra de sólo 1 artículo, es decir que una gran parte de la población sólo va a comprar algo rápido o tal vez no están los artículos que esta buscando.
Esto lo podemos confirmar con la siguiente tabla de frecuencias relativas:
(tablar_cant <- round(prop.table(tabla_cant),digits=2)) # tabla de frecuencias relativas## Cantidad
## 1 2 3 4 5 6 7 8 9 10
## 0.11 0.09 0.09 0.11 0.10 0.10 0.10 0.09 0.09 0.12
Proseguimos a sacar la media:
mean(Cantidad)## [1] 5.51
La cantidad promedio es de 6 articulos por venta. A pesar de eso, no existe una probabilidad marcada sobre el número de articulos que sea más probable que pueda elegir una persona en su compra. La diferencia entre la mayor probabilidad y la menor es de 3pbs (12% vs. 9%)
(tabla_acum<- cumsum(tabla_cant))## 1 2 3 4 5 6 7 8 9 10
## 112 203 293 402 504 602 704 789 881 1000
(tablar_acum<-cumsum(tablar_cant))## 1 2 3 4 5 6 7 8 9 10
## 0.11 0.20 0.29 0.40 0.50 0.60 0.70 0.79 0.88 1.00
Con las tablas de frencuencias acomuladas, podemos decir que el 50% de los clientes, a lo más se llevan 5 articulos por compra.
En la siguiente tabla podemos ver todas las frecuencias que se sacaron anteriormente:
tabla.fre2_cant<- matrix(cbind(tabla_cant[1],tabla_cant[2],tabla_cant[3],tabla_cant[4],tabla_cant[5],
tabla_cant[6],tabla_cant[7],tabla_cant[8],tabla_cant[9],tabla_cant[10],
tabla_acum[1],tabla_acum[2],tabla_acum[3],tabla_acum[4],tabla_acum[5],
tabla_acum[6],tabla_acum[7],tabla_acum[8],tabla_acum[9],tabla_acum[10],
tablar_cant[1],tablar_cant[2],tablar_cant[3],tablar_cant[4],tablar_cant[5],
tablar_cant[6],tablar_cant[7],tablar_cant[8],tablar_cant[9],tablar_cant[10],
tablar_acum[1],tablar_acum[2],tablar_acum[3],tablar_acum[4],tablar_acum[5],
tablar_acum[6],tablar_acum[7],tablar_acum[8],tablar_acum[9],tablar_acum[10]),
byrow=T,nrow = 4,ncol=10)
colnames(tabla.fre2_cant)<- c("1art.","2art.","3art.","4art.","5art.","6art.","7art.","8art.","9art.","10art.")
rownames(tabla.fre2_cant)<- c("fi","Fi","pi","Pi")
tabla.fre2_cant## 1art. 2art. 3art. 4art. 5art. 6art. 7art. 8art. 9art. 10art.
## fi 112.00 91.00 90.00 109.00 102.0 98.0 102.0 85.00 92.00 119.00
## Fi 112.00 203.00 293.00 402.00 504.0 602.0 704.0 789.00 881.00 1000.00
## pi 0.11 0.09 0.09 0.11 0.1 0.1 0.1 0.09 0.09 0.12
## Pi 0.11 0.20 0.29 0.40 0.5 0.6 0.7 0.79 0.88 1.00
Al verlo gráficamente, se puede apreciar que la compra del número de artículos tiene un comportamiento uniforme, en otras palabras, no hay una cantidad que se separe mucho al resto.
barplot(tabla_cant,names.arg=c("1art.","2art.","3art.","4art.","5art.","6art.","7art.","8art.","9art.","10art."),col=topo.colors(c(3,32,28,5,6,7,8,9,3,3)),ylim=c(0,120))
title("Cantidad de Artículos \n (Frecuencias Absolutas)")Por último tenemos la variable Utilidad.
range(Utilidad)## [1] 0.5085 49.6500
Con el Método de la Raíz Cuadrada sacamos el rango, el cual va de .05 a 49.65 dólares por ticket de compra.
Este método nos dio un total de 32 clases. También obtuvimos la amplitud la cual nos dio un valor de 1.53.
Amplitud = diff(range(Total)) / 32Posteriormente, sacamos la tabla de frecuencias:
(tabla_utilidad<- fdt(Utilidad,breaks="Scott",start=10,end=47,h=3,right=T))## Class limits f rf rf(%) cf cf(%)
## (10,13] 95 0.10 9.5 95 9.5
## (13,16] 83 0.08 8.3 178 17.8
## (16,19] 67 0.07 6.7 245 24.5
## (19,22] 60 0.06 6.0 305 30.5
## (22,25] 55 0.06 5.5 360 36.0
## (25,28] 40 0.04 4.0 400 40.0
## (28,31] 36 0.04 3.6 436 43.6
## (31,34] 28 0.03 2.8 464 46.4
## (34,37] 34 0.03 3.4 498 49.8
## (37,40] 28 0.03 2.8 526 52.6
## (40,43] 14 0.01 1.4 540 54.0
## (43,46] 17 0.02 1.7 557 55.7
Observamos que tenemos una mayor frecuencia en utilidades pequeñas, especificamente el 51.9% del total de utilidades se encuentra en el rango de 0.5 y 13.
Seguimos con las medidas estadísticas media y mediana:
median(Utilidad)## [1] 12.088
mean(Utilidad)## [1] 15.37937
Tenemos una media de 15.37 y una mediana de 12.088, esto nos indica que los datos tienen un sesgo a la izquierda.
Al sacar un histograma de nuestra variable Utilidad, nos da el siguiente gráfico:
hist(Utilidad,col="darkolivegreen1",main="Histograma de Utilidad")Con este grafico podemos confirmar que si tenemos un sesgo a la izquierda.
Al cruzar esta variable con Departamento, obtenemos lo siguiente:
n<- length(Utilidad)
mu3<- sum((Utilidad-mean(Utilidad))^3)/(n-1)
s3<- sd(Utilidad)^3
j3<- mu3/s3; j3 ## [1] 0.8907847
mode(Utilidad)## [1] "numeric"
boxplot(Utilidad~Departamento, col = topo.colors(length(etiquetas)), main="Utilidad por Departamento",cex.main = 2, horizontal =F )
Analizando las utilidades por tienda podemos ver que estas están muy
parejas. Sin embargo vemos que el Departamento que nos da mejor
Utilidad es Food and Beverages, mientras que el que
nos da menos es Health and Beauty.
Proseguimos a cruzar Utilidad con Cantidad
round(cor(base[c(8,16)]),digits = 2) ## Quantity gross_income
## Quantity 1.00 0.71
## gross_income 0.71 1.00
plot(base[c(8,16)],col="darkolivegreen1",ylab="Utilidad",xlab="Cantidad",main="Utilidad Vs Cantidad")La tendencia es que entre mayor número de artículos se lleve el cliente, mayor será la Utilidad.
Posterior al desarrollo del análisis exploratorio de los datos es necesario acudir a herramientas que permitan modelar la muestra con la que contamos, es por eso por lo que nos apoyamos de la Inferencia Estadística Clásica que se define como conjunto de métodos y técnicas que permiten inducir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.
Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos: métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral que se utiliza como estimador de un parámetro. A continuación, buscaremos desarrollar una estimación puntual y objetiva para modelar la variable cuantitativa Utilidad teniendo como conocimiento previo que tiene un comportamiento continuo.
Como primer paso y continuando con una consistencia de la interpretación gráfica, es necesario observar el comportamiento de nuestros datos mediante un histograma, así como su densidad.
hist(Utilidad,probability=T,col="violetred1",ylim=c(0,0.06), main = "Utilidad",ylab="Densidad")
lines(density(Utilidad),lwd=2,col="violetred4")Con los conocimientos estadísticos previos se puede notar en la gráfica que la mayoría de los datos se concentran en una forma de campana hacia la izquierda en un rango especifico de valores, por lo que se proponen 2 distribuciones que pueden adaptarse de mejor forma: Gamma y Weibull. El siguiente paso es obtener los parámetros que cumplan con la distribución, para lograr identificar los parámetros es necesario llevar a cabo el método de máxima verosimilitud.
La siguiente extracción de R- Studio demuestra que como se suponía, las distribuciones más adecuadas a nuestros datos son la distribución Weibull y Gamma.
(fit1 <- fitdistr(Utilidad, densfun="gamma"))(fit2 <- fitdistr(Utilidad, densfun="weibull"))Clasificando los parámetros de la distribución Gamma:
| Variable | Valor |
|---|---|
| Shapew | 1.562511187 |
| Rate | 0.101597915 |
Clasificando los parámetros de la distribución Weibull:
| Variable | Valor |
|---|---|
| Shape | 1.3172452 |
| Scale | 16.7178052 |
A continuación y utilizando los parámetros obtenido a traves del método de M.V., las distribuciones propuestas lucirían de la siguiente forma. Adicionalmente se muestran los Q-Plot para poder tener una mejor referencia:
hist(Utilidad, pch=30,prob=TRUE, main="",col="seagreen2",ylim=c(0,0.06))
curve(dgamma(x, fit1$estimate[1],fit1$estimate[2]), col="seagreen4", lwd=3, add=T)hist(Utilidad, pch=30,prob=TRUE, main="",col="coral")
curve(dweibull(x, fit2$estimate[1],fit2$estimate[2]), col="saddlebrown", lwd=3, add=T)par(mfrow=c(1, 2))
qqplot(ventas_super$Utilidad, pch=19,
x=qgamma(ppoints(n), shape= 1.562511187, rate=0.101597915),
main='Gamma Q-Q Plot',
xlab='Theoretical Quantiles',
ylab='Sample Quantiles')
qqplot(ventas_super$Utilidad, pch=19,
x=qweibull(ppoints(n), shape=1.3172452, scale=16.7178052),
main='Weibull Q-Q Plot',
xlab='Theoretical Quantiles',
ylab='Sample Quantiles')Hasta este punto se puede afirmar que ambas distribuciones (Gamma y Weibull) tienen un comportamiento similiar a la distribución de nuestros datos, a pesar de esto. ¿Cómo se que cuál es la mejor? Por tal motivo es necesario comprobar estos argumentos de forma estadisticas, comenzando por observar la siguiente gráfica para posteriormente evaluar mediante los parámetros:
density(Utilidad)plot(density(Utilidad),las=2, main="Densidad de las distribuciones",col="red",xlab="Datos",panel.first=grid(),)
curve(dweibull(x,1.3172452,16.7178052,log = FALSE),add = TRUE,col="blue")
curve(dgamma(x,1.562511187,0.101597915 ),add = TRUE,col="green")fitgamma<-fitdist(Utilidad,"gamma",method = "mle")
summary(fitgamma)## Fitting of the distribution ' gamma ' by maximum likelihood
## Parameters :
## estimate Std. Error
## shape 1.5629646 0.063816560
## rate 0.1016357 0.004880918
## Loglikelihood: -3680.02 AIC: 7364.039 BIC: 7373.855
## Correlation matrix:
## shape rate
## shape 1.0000000 0.8500778
## rate 0.8500778 1.0000000
ks.test(Utilidad,"pgamma",1.562511187,0.101597915 )## Warning in ks.test.default(Utilidad, "pgamma", 1.562511187, 0.101597915): ties
## should not be present for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: Utilidad
## D = 0.039899, p-value = 0.08284
## alternative hypothesis: two-sided
plot(fitgamma)fitweibull<-fitdist(Utilidad,"weibull",method = "mle")
summary(fitweibull)## Fitting of the distribution ' weibull ' by maximum likelihood
## Parameters :
## estimate Std. Error
## shape 1.31720 0.03288527
## scale 16.71558 0.42327725
## Loglikelihood: -3679.374 AIC: 7362.747 BIC: 7372.563
## Correlation matrix:
## shape scale
## shape 1.0000000 0.3184361
## scale 0.3184361 1.0000000
ks.test(Utilidad,"pweibull",1.3172452,16.7178052) ## Warning in ks.test.default(Utilidad, "pweibull", 1.3172452, 16.7178052): ties
## should not be present for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: Utilidad
## D = 0.040211, p-value = 0.0788
## alternative hypothesis: two-sided
plot(fitweibull)Las distribuciones que se propusieron con anterioridad, aplicando la prueba Kolmogor-Smirnov en ambos casos su p-value fue mayor a .05 determinando que los datos vienen de esa distribución. A pesar de que las distribuciones se adecuan de forma exitosa a nuestros datos, por la definición de maximización, utilizaremos la distribución Gamma que cuenta con el indicador Log-Likehood de -3679.374 siendo el mayor entre las opciones.
hist(Utilidad,col="slategray2")qqnorm(Utilidad,pch=16);qqline(Utilidad,col="springgreen1",lwd=2)Prueba de normalidad A-D
ad.test(Utilidad)##
## Anderson-Darling normality test
##
## data: Utilidad
## A = 28.475, p-value < 2.2e-16
Por lo tanto se rechaza H0
lambda = BoxCox.lambda(Utilidad,method="loglik",lower=-100,upper=100);lambda ## [1] 0.3
lambda2 = BoxCox.lambda(Utilidad,method="guerrero",lower=-100,upper=100);lambda2 ## [1] -0.03570584
Aplicamos la lamba óptima a los datos, transformadolos de tal manera que se acerquen a una Distribución Normal
trans.utilidad <- BoxCox(Utilidad, lambda) # aplica la lambda optima a los datos, transformandolos
hist(trans.utilidad, main="Histogrma de Utilidad Transformada") Kolmogorov–Smirnov Test
Proseguimos a sacar el test Kolmogorov–Smirnov
ks.test(trans.utilidad, "pnorm",mean(trans.utilidad),sd(trans.utilidad))## Warning in ks.test.default(trans.utilidad, "pnorm", mean(trans.utilidad), : ties
## should not be present for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: trans.utilidad
## D = 0.042819, p-value = 0.05111
## alternative hypothesis: two-sided
qqnorm(trans.utilidad,pch=16);qqline(trans.utilidad,col="red",lwd=2)Con este test y gráfica Q-Q Plot, observamos que los datos transformados de la variable Utilidad se acercan mucho a una distribución normal, sin embargo no tenemos una normalidad perfecta.
En el siguiente gráfico, podemos apreciar la variable Utilidad, sus datos originales y los transformados.
par(mfrow=c(1, 2))
hist(trans.utilidad, main="Histograma de Utilidad Transformada")
hist(Utilidad,main="Histograma de Utilidad")Utilizando la variable transformada, estimamos un intervalo de confianza del 80%
utilidad_barra<-mean(trans.utilidad)
ds<-sd(trans.utilidad)
n<-length(trans.utilidad)
ee<- qt(0.20/2,df=n-1,lower.tail = F)*ds/sqrt(n)
options(digits= 5)
cbind(utilidad_barra-ee,utilidad_barra+ee)## [,1] [,2]
## [1,] 3.6533 3.8013
t.test(trans.utilidad,alternative = "two.sided",conf.level = 0.80)##
## One Sample t-test
##
## data: trans.utilidad
## t = 64.6, df = 999, p-value <2e-16
## alternative hypothesis: true mean is not equal to 0
## 80 percent confidence interval:
## 3.6533 3.8013
## sample estimates:
## mean of x
## 3.7273
Tenemos la certeza del 80% que el valor verdadero de la utilidad por ticket esta dentro del intervalo (3.6533, 3.8013)
Para estimamos un intervalo de confianza del 99.9%
ee2<- qt(0.001/2,df=n-1,lower.tail = F)*ds/sqrt(n)
options(digits= 5)
cbind(utilidad_barra-ee2,utilidad_barra+ee2)## [,1] [,2]
## [1,] 3.5368 3.9178
t.test(trans.utilidad,alternative = "two.sided",conf.level = 0.999)##
## One Sample t-test
##
## data: trans.utilidad
## t = 64.6, df = 999, p-value <2e-16
## alternative hypothesis: true mean is not equal to 0
## 99.9 percent confidence interval:
## 3.5368 3.9178
## sample estimates:
## mean of x
## 3.7273
Se puede decir que tenemos la certeza del 99.9% que el valor verdadero de la utilidad por ticket esta dentro del intervalo (3.5368, 3.9178)
Los valores de los intervalos del 80% y 99.9% no presentan una gran variación, pero si se puede notar que el intervalo de confianza del 99.9% tiene una anchura mayor entre los intervalos. En el caso que se presentara una anchura mayor entre el intervalo de confianza del 80% y 99.9% sería más conveniente trabajar con el intervalo de confianza del 80%
Muestras Independientes
Suponemos independencia entre las muestras.
Se consideran dos grupos, en el grupo uno están los departamentos en los que se venden artículos para uso personal, alimentos y moda. En el grupo dos están los departamentos que venden artículos para el hogar.
grupo1<- ventas_super[Departamento %in% c("Fashion accessories","Food and beverages","Health and beauty"),]; grupo1## # A tibble: 504 × 10
## Tipo_Supermercado Ciudad Tipo_Cliente Departamento Precio_Unitario Cantidad
## <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 A Yangon Member Health and … 74.7 7
## 2 A Yangon Member Health and … 58.2 8
## 3 A Yangon Member Health and … 36.3 2
## 4 B Mandalay Member Food and be… 54.8 3
## 5 B Mandalay Member Fashion acc… 14.5 4
## 6 A Yangon Normal Food and be… 43.2 10
## 7 A Yangon Normal Health and … 71.4 10
## 8 A Yangon Member Health and … 68.9 7
## 9 A Yangon Normal Food and be… 54.7 3
## 10 B Mandalay Normal Health and … 88.0 3
## # … with 494 more rows, and 4 more variables: Total <dbl>, Tipo_Pago <chr>,
## # Costo <dbl>, Utilidad <dbl>
grupo2<- ventas_super[Departamento %in% c("Home and lifestyle","Sports and travel","Electronic accessories"),]; grupo2## # A tibble: 496 × 10
## Tipo_Supermercado Ciudad Tipo_Cliente Departamento Precio_Unitario Cantidad
## <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 C Naypyit… Normal Electronic … 15.3 5
## 2 A Yangon Normal Home and li… 46.3 7
## 3 A Yangon Normal Sports and … 86.3 7
## 4 C Naypyit… Normal Electronic … 85.4 7
## 5 A Yangon Member Electronic … 68.8 6
## 6 C Naypyit… Normal Home and li… 73.6 10
## 7 B Mandalay Member Electronic … 25.5 4
## 8 A Yangon Normal Electronic … 47.0 5
## 9 B Mandalay Member Sports and … 93.7 6
## 10 A Yangon Normal Sports and … 72.6 6
## # … with 486 more rows, and 4 more variables: Total <dbl>, Tipo_Pago <chr>,
## # Costo <dbl>, Utilidad <dbl>
n1<-nrow(grupo1)
n2<-nrow(grupo2)
mean(grupo1$Utilidad)## [1] 15.084
mean(grupo2$Utilidad)## [1] 15.68
dif<- mean(grupo1$Utilidad)-mean(grupo2$Utilidad)
dif## [1] -0.59637
s2_1<- var(grupo1$Utilidad)
s2_1## [1] 133.56
s2_2<- var(grupo2$Utilidad)
s2_2## [1] 140.79
Estimamos un intervalo de confianza de 80%
ee<- qnorm(0.20/2,lower.tail=F)*sqrt((s2_1/n1)+(s2_2/n2))
c(dif-ee,dif+ee)## [1] -1.54580 0.35305
Estimaremos intervalos de confianza del 80% y 99.9%
Con un intervalo de confianza del 80% tenemos un intervalo del (-1.54580, 0.35305) que contiene la diferencia entre la utilidad entre los grupos de departamentos conformados. Podemos decir que con un 80% de confianza que los grupos de departamento manejan una utilidad promedio muy similar.
Estimamos un intervalo de confianza de 99.9%
ee<- qnorm(0.001/2,lower.tail=F)*sqrt((s2_1/n1)+(s2_2/n2))
c(dif-ee,dif+ee)## [1] -3.0341 1.8414
Con un intervalo de confianza del 99.9% el intervalo es de (-3.0341, 1.8414) en el cual se encuentran las diferencias de las medias de la utilidad de los dos grupos de departamentos que estamos manejando. Podemos ver que ambas contienen el valor cero por lo tanto podemos decir que el nivel promedio no cambia de un grupo a otro.
Muestras Dependientes
d<- grupo1$Utilidad-grupo2$Utilidad ; n<- length(d); n## Warning in grupo1$Utilidad - grupo2$Utilidad: longer object length is not a
## multiple of shorter object length
## [1] 504
dbarra<- mean(d); dbarra## [1] -0.65384
ee_dep<- qt(0.20/2,df=(n)-1,lower.tail = F)*sd(d)/sqrt(n)
i.c_difmedias_dep<- c(dif-ee_dep,dif+ee_dep); i.c_difmedias_dep## [1] -1.56610 0.37335
Con un intervalo de confianza del 80% encontramos que el intervalo (-1.56610, 0.37335) contienen las diferencias de las medias de utilidades de lo grupo de departamentos 1 contra el grupo de departamentos 2.
ee_dep<- qt(0.001/2,df=(n)-1,lower.tail = F)*sd(d)/sqrt(n)
i.c_difmedias_dep<- c(dif-ee_dep,dif+ee_dep); i.c_difmedias_dep## [1] -3.0977 1.9049
Con un Intervalo de Confianza del 99.9% encontramos que el intervalo (-3.0977, 1.9049) contienen las diferencias de las medias de utilidades de lo grupo de departamentos 1 contra el grupo de departamentos 2.
l_inde<- (dif+ee)-(dif-ee); l_inde## [1] 4.8755
l_dep<- (dif+ee_dep)-(dif-ee_dep); l_dep## [1] 5.0026
Al comparar la muestra dependiente con la muestra independiente podemos observar que nos conviene más tomar las muestras dependientes ya que presenta una anchura menor.
Con la variable utilidad transformada vamos a analizar el promedio de utilidad por ticket. De acuerdo con estos datos queremos comprobar que el promedio de utilidad de un ticket es igual a 3.72.
Por lo tanto, tenemos:
rcrit1<- qnorm(0.001/2,mean=0,sd=1,lower.tail=T)
rcrit1## [1] -3.2905
rcrit2<- qnorm(0.001/2,mean=0,sd=1,lower.tail=F)
rcrit2## [1] 3.2905
p1<- z.test(trans.utilidad,alternative="two.sided",mu=3.72,sigma.x=1.82,conf.level=0.999)
p1$statistic## z
## 0.12679
p1$p.value## [1] 0.8991
p1$conf.int## [1] 3.5379 3.9167
## attr(,"conf.level")
## [1] 0.999
Dado que Zcalc=0.12679 y Zcrit=3.2905 y como Zcalc<Zcrit no se rechaza la hipotesis nula, esto quiere decir que hay suficiente evidencia estadistica para decir que la media de las utilidades por ticket es 3.72. También, vemos que el p-value= 0.8991 es mayor al nivel de significancia por lo tanto NO se rechaza H0.
En este caso se quiere demostrar que el grupo 1 de los departamentos del supermercado tienen una mayor utilidad que el grupo 2. Recordemos que en el grupo 1 se encuentran los departamentos que venden artículos para uso personal, alimentos y moda. En el grupo dos están los departamentos que venden artículos para el hogar.
Denominaremos a mu1 como la media del grupo 1 de departamentos y mu2 será la media del grupo 2. Nuestras hipótesis quedan de la siguiente manera grupo 2 de departamentos:
Se trabajará con la muestra dependiente con los niveles de significancia de 0.1 % y del 20%.
Con el nivel de significancia del 0.1% tenemos los siguientes resultados:
t.test(grupo1$Utilidad,grupo2$Utilidad,alternative="two.sided",mu0 = 0,paired =F,conf.level = 0.999)##
## Welch Two Sample t-test
##
## data: grupo1$Utilidad and grupo2$Utilidad
## t = -0.805, df = 996, p-value = 0.42
## alternative hypothesis: true difference in means is not equal to 0
## 99.9 percent confidence interval:
## -3.0414 1.8486
## sample estimates:
## mean of x mean of y
## 15.084 15.680
t.crit= qt(0.001,df=n-1,lower.tail = T); t.crit## [1] -3.1065
Con una significancia del .1% tenemos un tcalc=-0.805 y un tcrit =-3.10, por lo tanto, no se rechaza la hipótesis nula. Además, se obtiene un valor de p-value = 0.42 con lo que comprobamos nuestro análisis.
Con el nivel de significancia del 20%, tenemos los siguientes resultados:
t.test(grupo1$Utilidad,grupo2$Utilidad,alternative="two.sided",mu0 = 0,paired =F,conf.level = 0.80)##
## Welch Two Sample t-test
##
## data: grupo1$Utilidad and grupo2$Utilidad
## t = -0.805, df = 996, p-value = 0.42
## alternative hypothesis: true difference in means is not equal to 0
## 80 percent confidence interval:
## -1.54643 0.35368
## sample estimates:
## mean of x mean of y
## 15.084 15.680
t.crit1= qt(0.20,df=n-1,lower.tail = T); t.crit1## [1] -0.84234
En el caso del nivel de significancia del del 20% tenemos los siguientes resultados, un tcalc=-0.805 y un tcrit=-0.8423, tcalc>tcrit , con esto comprobamos que se rechaza la Hipotesis Nula. Pero es una diferencia muy pequeña, con un valor de p-value = 0.42, indicando que la Hipótesis Nula no se rechaza.
Con los dos niveles de significancia podemos concluir que el grupo 1 tiene mayores utilidades, pero estas no tienen una gran diferencia con las del grupo 2.
La recabación del análisis de las variables seleccionadas nos puede otorgar un panorama más detallado para realizar las siguientes afirmaciones:
A pesar de tener una distribución equitativa de las cantidades que se venden por departamento, tenemos una oportunidad de alzar los números si realizamos una estrategia en el departamento Health and Beauty, esta podría ser alzando los precios para subir la utilidad, bajar los precios para subir la cantidad, o revisar con el área de compras para checar si los productos exhibidos son los que nuestra clientela esta buscando.
Para subir tanto Calidad como Utilidad, y así subir el ticket promedio, tenemos que buscar algo que marque la diferencia en nuestras tiendas, ya sea el servicio, las instalaciones, la gama de productos que manejamos, la manera de comprar.
Aunque nuestros departamentos líderes en venta son Food and Beverages y Electronic Accesories, la probabilidad de compra a cualquier departamento es casi la misma, por lo tanto, se requiere tener abastecidas todas las áreas con el inventario suficiente para compra.
Podemos observar que este grafico no es muy distinto al de frecuencias absolutas.
barplot(tablar_cant,names.arg=c("1art.","2art.","3art.","4art.","5art.","6art.","7art.","8art.","9art.","10art."),col=topo.colors(3:13),ylim=c(0,0.15))
title("Cantidad de Artículos \n (Frecuencias Relativas)")Al cruzar esta variable con Ciudad, obtenemos lo siguiente:
boxplot(Utilidad~Ciudad,col="turquoise", horizontal =T )Analizando las utilidades por tienda podemos ver que estas están muy parejas, la ciudad de Yangon el 75% tiene utilidades de 22 al igual que Mandalay. Mientras que Naypyitaw tiene utilidades mayores a estas que son 24.
as.matrix(trans.utilidad) ## [,1]
## [1,] 5.539818
## [2,] 1.649745
## [3,] 4.355454
## [4,] 5.237408
## [5,] 5.933204
## [6,] 5.903461
## [7,] 4.934037
## [8,] 6.496865
## [9,] 1.572436
## [10,] 2.939090
## [11,] 1.252500
## [12,] 2.101683
## [13,] 3.644995
## [14,] 5.045522
## [15,] 6.408545
## [16,] 5.735780
## [17,] 5.328736
## [18,] 5.067339
## [19,] 2.933250
## [20,] 1.730393
## [21,] 5.035615
## [22,] 3.894719
## [23,] 1.444381
## [24,] 3.032172
## [25,] 3.910698
## [26,] 4.979856
## [27,] 0.558560
## [28,] 3.060099
## [29,] 5.102684
## [30,] 3.547641
## [31,] 5.264305
## [32,] 6.362558
## [33,] 6.226247
## [34,] 3.248470
## [35,] 4.840577
## [36,] 1.481177
## [37,] 4.274740
## [38,] 5.665473
## [39,] 5.088680
## [40,] 3.699871
## [41,] 1.842801
## [42,] 2.258971
## [43,] 4.944110
## [44,] 6.708012
## [45,] 0.458776
## [46,] 4.703235
## [47,] 5.475014
## [48,] 3.111573
## [49,] 2.279218
## [50,] 6.845806
## [51,] 6.093873
## [52,] 3.537857
## [53,] 1.551223
## [54,] -0.249581
## [55,] 0.516227
## [56,] 6.300874
## [57,] 1.877623
## [58,] 6.420810
## [59,] 6.448073
## [60,] 3.149638
## [61,] 1.606656
## [62,] 4.426311
## [63,] 5.398733
## [64,] 2.864634
## [65,] 4.199968
## [66,] 2.871682
## [67,] 1.456004
## [68,] 5.847105
## [69,] 6.700757
## [70,] -0.086063
## [71,] 7.091942
## [72,] 6.010803
## [73,] 2.712865
## [74,] 5.180102
## [75,] 6.233900
## [76,] 4.954753
## [77,] 5.100163
## [78,] 3.111573
## [79,] 6.683142
## [80,] 2.099445
## [81,] 5.891435
## [82,] 4.102114
## [83,] 2.815971
## [84,] 4.334978
## [85,] 3.731144
## [86,] 5.827115
## [87,] 4.746329
## [88,] 4.503931
## [89,] 0.844917
## [90,] 5.216259
## [91,] 3.211013
## [92,] 5.141429
## [93,] 2.814293
## [94,] 5.816798
## [95,] 1.896406
## [96,] 2.022364
## [97,] 7.035310
## [98,] 1.616219
## [99,] 2.866398
## [100,] 5.401744
## [101,] 1.020333
## [102,] 6.380404
## [103,] 3.392665
## [104,] 4.530355
## [105,] 3.439132
## [106,] 7.063540
## [107,] 2.936343
## [108,] 4.683549
## [109,] 4.221233
## [110,] 6.821346
## [111,] 0.539644
## [112,] 4.137221
## [113,] 5.473305
## [114,] 5.538800
## [115,] 6.462689
## [116,] 1.739046
## [117,] 2.220997
## [118,] 1.090077
## [119,] 2.219478
## [120,] 2.177772
## [121,] 6.734180
## [122,] 4.853871
## [123,] 7.108827
## [124,] 5.480552
## [125,] 5.159294
## [126,] 6.164119
## [127,] 2.901426
## [128,] 4.067549
## [129,] 5.667443
## [130,] 6.794580
## [131,] 4.002906
## [132,] 5.689344
## [133,] 2.634424
## [134,] 5.549327
## [135,] 5.357117
## [136,] 3.949443
## [137,] 2.532058
## [138,] 3.381858
## [139,] 5.520780
## [140,] 5.820398
## [141,] 7.103113
## [142,] 7.127453
## [143,] 6.293135
## [144,] 0.446518
## [145,] 5.248102
## [146,] 4.004652
## [147,] 4.188310
## [148,] 3.899809
## [149,] 5.796081
## [150,] 3.859522
## [151,] 4.640571
## [152,] 3.708265
## [153,] 6.550880
## [154,] 2.050632
## [155,] 6.128907
## [156,] 5.213538
## [157,] 1.565321
## [158,] 3.789935
## [159,] 7.022122
## [160,] 5.726188
## [161,] 4.502434
## [162,] 1.385027
## [163,] 4.328459
## [164,] 2.801556
## [165,] 4.848707
## [166,] 4.469060
## [167,] 7.300255
## [168,] 7.412349
## [169,] 4.234987
## [170,] 5.350912
## [171,] 4.533660
## [172,] 4.856388
## [173,] 2.965042
## [174,] 4.305503
## [175,] 2.867220
## [176,] 4.211881
## [177,] 3.082107
## [178,] 2.858394
## [179,] 5.111152
## [180,] 3.865499
## [181,] 5.148337
## [182,] 4.235578
## [183,] 2.827923
## [184,] 3.980128
## [185,] 1.836704
## [186,] 1.163074
## [187,] 6.577553
## [188,] 3.173048
## [189,] 1.603659
## [190,] 4.017948
## [191,] 3.612446
## [192,] 2.731242
## [193,] 6.710300
## [194,] 2.104239
## [195,] 2.927972
## [196,] 1.608054
## [197,] 1.854944
## [198,] 0.243135
## [199,] 2.955965
## [200,] 4.579863
## [201,] 2.298707
## [202,] 3.601970
## [203,] 5.033688
## [204,] 3.853866
## [205,] 1.880618
## [206,] 3.389165
## [207,] 5.913277
## [208,] 4.065449
## [209,] 1.920056
## [210,] 7.101614
## [211,] 3.656744
## [212,] 6.893734
## [213,] 5.215482
## [214,] 2.633139
## [215,] 3.389165
## [216,] -0.088723
## [217,] 2.426880
## [218,] 4.054695
## [219,] 6.589494
## [220,] 3.023538
## [221,] 3.961045
## [222,] 5.060970
## [223,] 1.279160
## [224,] -0.435596
## [225,] 1.838858
## [226,] 3.048918
## [227,] 6.024903
## [228,] 2.746048
## [229,] 5.647100
## [230,] 5.460224
## [231,] 2.918653
## [232,] 0.496456
## [233,] 6.581052
## [234,] 4.142162
## [235,] 5.522314
## [236,] 3.177246
## [237,] 1.848702
## [238,] 3.520702
## [239,] 1.437895
## [240,] 1.895357
## [241,] 3.551785
## [242,] 2.365996
## [243,] 3.178504
## [244,] 3.783128
## [245,] 6.557999
## [246,] 4.734399
## [247,] 3.728109
## [248,] 1.895532
## [249,] 4.258516
## [250,] 5.481276
## [251,] 4.969349
## [252,] 4.546110
## [253,] 0.384560
## [254,] 1.986363
## [255,] 5.267318
## [256,] 2.517705
## [257,] 1.443301
## [258,] 2.833403
## [259,] 2.497715
## [260,] 3.893240
## [261,] 6.248863
## [262,] 1.431388
## [263,] 2.806370
## [264,] 3.532768
## [265,] 1.168290
## [266,] 6.304906
## [267,] 2.666596
## [268,] 6.538354
## [269,] 4.047192
## [270,] 4.569539
## [271,] 4.445540
## [272,] 0.838115
## [273,] 3.255617
## [274,] 0.190038
## [275,] 5.905917
## [276,] 4.436113
## [277,] 3.493608
## [278,] 4.740496
## [279,] 6.392547
## [280,] 5.093507
## [281,] 5.722985
## [282,] 0.675613
## [283,] -0.254988
## [284,] 5.909251
## [285,] 3.223004
## [286,] 4.419482
## [287,] 1.619397
## [288,] 3.451537
## [289,] 4.462249
## [290,] 6.200149
## [291,] 4.873229
## [292,] 3.266709
## [293,] 1.357954
## [294,] 1.576490
## [295,] 3.122396
## [296,] 3.858857
## [297,] 2.305462
## [298,] 5.262277
## [299,] 3.691804
## [300,] 1.876389
## [301,] 3.313947
## [302,] 0.739743
## [303,] 1.017650
## [304,] 3.364638
## [305,] 2.367997
## [306,] 5.450019
## [307,] 4.036610
## [308,] 6.394272
## [309,] 1.708419
## [310,] 2.931072
## [311,] 5.312922
## [312,] 2.625416
## [313,] 1.544447
## [314,] 2.641993
## [315,] 6.676229
## [316,] 3.304943
## [317,] 1.375001
## [318,] 4.691090
## [319,] 3.393248
## [320,] 3.070362
## [321,] 3.380394
## [322,] 0.752538
## [323,] 1.927826
## [324,] 4.243610
## [325,] 2.499342
## [326,] 4.798893
## [327,] 5.415977
## [328,] 4.710924
## [329,] 3.362282
## [330,] 2.711369
## [331,] 3.299326
## [332,] 2.047690
## [333,] 4.762132
## [334,] 0.972807
## [335,] 1.592230
## [336,] 2.671285
## [337,] 6.299865
## [338,] 4.517778
## [339,] 2.680135
## [340,] 4.763897
## [341,] 2.696739
## [342,] 4.804068
## [343,] 5.617780
## [344,] 5.342927
## [345,] 2.563958
## [346,] 6.357339
## [347,] 1.560836
## [348,] 6.409364
## [349,] 3.133495
## [350,] 2.577788
## [351,] 7.422759
## [352,] 4.612165
## [353,] 4.749559
## [354,] 3.717682
## [355,] 0.440166
## [356,] 4.577269
## [357,] 4.701053
## [358,] 7.295580
## [359,] 1.765912
## [360,] 1.621579
## [361,] 6.128557
## [362,] 6.576924
## [363,] 3.313348
## [364,] 5.088450
## [365,] 2.944118
## [366,] 4.372551
## [367,] 5.215926
## [368,] 3.893240
## [369,] 2.688325
## [370,] 3.251944
## [371,] 3.151332
## [372,] 2.399803
## [373,] 4.979501
## [374,] 3.799102
## [375,] 4.433752
## [376,] 5.334064
## [377,] 4.313293
## [378,] 6.218495
## [379,] 4.779871
## [380,] 1.979633
## [381,] 4.390896
## [382,] 1.137538
## [383,] 5.413608
## [384,] 4.174505
## [385,] 3.364049
## [386,] 1.638366
## [387,] 4.028828
## [388,] 4.347550
## [389,] 5.350859
## [390,] 2.477838
## [391,] 3.704071
## [392,] 4.726634
## [393,] 1.657948
## [394,] 5.538647
## [395,] 1.714124
## [396,] 4.777234
## [397,] 3.955008
## [398,] 2.405298
## [399,] 3.746790
## [400,] 3.036147
## [401,] 3.661271
## [402,] 3.162528
## [403,] -0.339539
## [404,] 3.305043
## [405,] 6.286942
## [406,] 3.936338
## [407,] 1.498701
## [408,] 3.983004
## [409,] 3.567022
## [410,] 2.359694
## [411,] 4.479628
## [412,] 0.882014
## [413,] 2.146158
## [414,] 1.671549
## [415,] 4.900249
## [416,] 2.004934
## [417,] 3.126883
## [418,] 1.747477
## [419,] 2.291933
## [420,] 3.073194
## [421,] 2.311905
## [422,] 3.796304
## [423,] 7.354337
## [424,] 3.350866
## [425,] -0.199571
## [426,] 4.636191
## [427,] 4.679741
## [428,] 1.360880
## [429,] 4.439998
## [430,] 7.132651
## [431,] 2.618962
## [432,] 1.839575
## [433,] 2.652347
## [434,] 6.219996
## [435,] 0.985964
## [436,] 7.086206
## [437,] 4.407741
## [438,] 3.356580
## [439,] 1.482025
## [440,] 4.373683
## [441,] 1.851379
## [442,] 6.382423
## [443,] 6.758418
## [444,] -0.419069
## [445,] 2.560654
## [446,] -0.043148
## [447,] 3.997028
## [448,] 2.606783
## [449,] 0.316863
## [450,] 0.743185
## [451,] 5.139502
## [452,] 2.538871
## [453,] 4.310626
## [454,] 0.230782
## [455,] 1.776641
## [456,] 2.740629
## [457,] 6.337520
## [458,] 6.724385
## [459,] 5.237077
## [460,] 0.639147
## [461,] 3.343362
## [462,] 6.476369
## [463,] 4.146109
## [464,] 0.125404
## [465,] 3.834659
## [466,] 5.653531
## [467,] 3.862595
## [468,] 3.530173
## [469,] 0.076909
## [470,] 2.049979
## [471,] 5.435497
## [472,] 2.889218
## [473,] 5.042029
## [474,] 5.823048
## [475,] 4.340412
## [476,] 3.272695
## [477,] 2.959372
## [478,] 4.439513
## [479,] 4.490572
## [480,] 0.726853
## [481,] 5.564836
## [482,] 4.381595
## [483,] 3.171158
## [484,] 5.931501
## [485,] 4.664269
## [486,] 3.297116
## [487,] 4.921163
## [488,] 2.750473
## [489,] 0.140919
## [490,] 6.348002
## [491,] 1.508140
## [492,] 3.283418
## [493,] 3.342967
## [494,] 2.389624
## [495,] 3.315345
## [496,] 5.947855
## [497,] 2.462756
## [498,] 5.633412
## [499,] 2.038349
## [500,] 4.928749
## [501,] 1.601658
## [502,] 0.501151
## [503,] 2.627220
## [504,] 3.180808
## [505,] 1.873565
## [506,] 3.251331
## [507,] 2.712117
## [508,] 5.444280
## [509,] 4.225898
## [510,] 1.998092
## [511,] 6.073399
## [512,] 3.459146
## [513,] 4.729564
## [514,] 6.338561
## [515,] 4.908061
## [516,] 1.092917
## [517,] 3.978689
## [518,] 3.286949
## [519,] 1.509396
## [520,] 4.597442
## [521,] 2.605614
## [522,] 5.416608
## [523,] 3.553441
## [524,] 2.453111
## [525,] 5.370242
## [526,] 5.189007
## [527,] 2.849774
## [528,] 2.368569
## [529,] 5.644129
## [530,] 7.049836
## [531,] 2.798905
## [532,] 6.324338
## [533,] 3.597805
## [534,] 2.728147
## [535,] 2.663041
## [536,] 2.324887
## [537,] 1.601458
## [538,] 2.035226
## [539,] 4.118683
## [540,] 5.550241
## [541,] 1.936086
## [542,] 1.639546
## [543,] 1.732654
## [544,] 2.264944
## [545,] 1.545475
## [546,] 2.830783
## [547,] 4.133949
## [548,] 5.668576
## [549,] 3.843024
## [550,] 4.832428
## [551,] 3.021209
## [552,] 5.362405
## [553,] 5.546584
## [554,] 2.554828
## [555,] 2.580939
## [556,] 2.262258
## [557,] 2.694356
## [558,] 7.397342
## [559,] 3.777670
## [560,] 3.484772
## [561,] 3.259285
## [562,] 7.082145
## [563,] 4.460802
## [564,] 5.132691
## [565,] 3.302537
## [566,] 6.793009
## [567,] 5.386398
## [568,] 5.875220
## [569,] 5.719780
## [570,] 5.514429
## [571,] 4.916942
## [572,] 3.917312
## [573,] 1.539505
## [574,] 2.703127
## [575,] 5.031819
## [576,] 5.768782
## [577,] 3.701972
## [578,] 2.471542
## [579,] 3.837840
## [580,] 2.630053
## [581,] 1.750281
## [582,] 4.257344
## [583,] 3.173888
## [584,] 1.568373
## [585,] 3.207488
## [586,] 3.384978
## [587,] 2.851902
## [588,] 3.466260
## [589,] 5.895897
## [590,] 1.584173
## [591,] 4.017474
## [592,] 2.997472
## [593,] 0.934447
## [594,] 3.562257
## [595,] 4.104882
## [596,] 0.902712
## [597,] 2.846934
## [598,] 4.975230
## [599,] 3.155879
## [600,] 2.650816
## [601,] 1.776641
## [602,] 1.413716
## [603,] 6.654265
## [604,] 4.374955
## [605,] 4.621375
## [606,] 2.470446
## [607,] 4.701374
## [608,] 3.309149
## [609,] 0.453958
## [610,] 2.311613
## [611,] 0.391521
## [612,] 7.077694
## [613,] 4.021263
## [614,] 1.736604
## [615,] 6.244435
## [616,] 4.523058
## [617,] 5.066992
## [618,] 5.089772
## [619,] 5.872978
## [620,] 3.868483
## [621,] 3.463796
## [622,] 1.928688
## [623,] 6.191398
## [624,] 6.868660
## [625,] 1.924203
## [626,] 2.860633
## [627,] 2.397262
## [628,] 6.843958
## [629,] 2.885720
## [630,] -0.467192
## [631,] 6.103145
## [632,] 3.646600
## [633,] 2.973412
## [634,] 4.171044
## [635,] 3.689081
## [636,] 6.202474
## [637,] 3.343857
## [638,] 0.951780
## [639,] 1.868261
## [640,] 2.854737
## [641,] 4.150430
## [642,] 6.386377
## [643,] 2.245779
## [644,] 5.821155
## [645,] 1.307082
## [646,] 3.048039
## [647,] 4.983056
## [648,] 0.562387
## [649,] 0.467634
## [650,] 3.755743
## [651,] 4.718980
## [652,] 4.429651
## [653,] 6.465477
## [654,] 4.436738
## [655,] 3.697769
## [656,] 0.975830
## [657,] 2.063826
## [658,] 3.898906
## [659,] 2.638147
## [660,] 1.192934
## [661,] 2.496494
## [662,] 2.372281
## [663,] 4.550138
## [664,] 7.007968
## [665,] 3.293497
## [666,] 3.262338
## [667,] 3.036809
## [668,] 1.559407
## [669,] 4.072909
## [670,] 1.742422
## [671,] 5.726479
## [672,] 3.182693
## [673,] 3.512600
## [674,] 3.936987
## [675,] 5.176399
## [676,] 2.973412
## [677,] 5.141202
## [678,] 4.131511
## [679,] 5.865122
## [680,] 4.109489
## [681,] 0.754403
## [682,] 0.602901
## [683,] 4.147019
## [684,] 0.859321
## [685,] 2.623094
## [686,] 2.039498
## [687,] 2.506649
## [688,] 6.075265
## [689,] 2.715356
## [690,] 3.330481
## [691,] 6.057953
## [692,] 4.763267
## [693,] 5.349091
## [694,] 5.492840
## [695,] 5.279345
## [696,] 5.074216
## [697,] 2.197490
## [698,] 3.767412
## [699,] 6.033393
## [700,] 7.363892
## [701,] 5.332880
## [702,] 2.019054
## [703,] 3.294503
## [704,] 6.451033
## [705,] 6.730500
## [706,] 5.434293
## [707,] 3.023316
## [708,] 1.499332
## [709,] 2.442319
## [710,] 1.663399
## [711,] 5.335247
## [712,] 4.193696
## [713,] 6.346132
## [714,] 2.438017
## [715,] 6.708012
## [716,] 3.093369
## [717,] 5.422915
## [718,] 0.636821
## [719,] 2.592719
## [720,] 2.146629
## [721,] 3.098983
## [722,] 6.806343
## [723,] 2.542869
## [724,] 3.840433
## [725,] 1.958644
## [726,] 3.584183
## [727,] 2.964023
## [728,] 6.340850
## [729,] 4.786891
## [730,] 4.634686
## [731,] 1.888175
## [732,] 2.978602
## [733,] -0.015079
## [734,] 5.581995
## [735,] 1.150098
## [736,] 6.820603
## [737,] 5.765086
## [738,] 5.856217
## [739,] 6.484338
## [740,] 6.916703
## [741,] 4.788331
## [742,] 1.808696
## [743,] 2.684044
## [744,] 1.629693
## [745,] 3.806551
## [746,] 0.721163
## [747,] 6.148754
## [748,] 1.123119
## [749,] 2.234780
## [750,] 5.766095
## [751,] 1.888175
## [752,] 2.596112
## [753,] 3.047600
## [754,] 4.642139
## [755,] 3.817100
## [756,] 6.664760
## [757,] 4.070269
## [758,] 5.816229
## [759,] 3.200426
## [760,] 3.524977
## [761,] 6.640335
## [762,] 6.439141
## [763,] 5.479310
## [764,] 1.143326
## [765,] 3.529061
## [766,] 6.607966
## [767,] 3.585821
## [768,] 1.759227
## [769,] 4.746076
## [770,] 1.490908
## [771,] 4.743541
## [772,] 5.919007
## [773,] 5.293128
## [774,] 1.117270
## [775,] 2.528712
## [776,] 2.697116
## [777,] 5.189678
## [778,] 1.958984
## [779,] 2.460142
## [780,] 6.712702
## [781,] 3.049797
## [782,] 4.723702
## [783,] 0.454329
## [784,] 4.547319
## [785,] 1.075553
## [786,] 5.535896
## [787,] 5.797224
## [788,] 1.180651
## [789,] 3.125709
## [790,] 4.930011
## [791,] 0.957614
## [792,] 3.977889
## [793,] 7.359611
## [794,] 6.130835
## [795,] 1.956262
## [796,] 1.166056
## [797,] 1.321356
## [798,] 3.734176
## [799,] 1.948760
## [800,] 5.054532
## [801,] 2.617669
## [802,] 3.705470
## [803,] 5.270219
## [804,] 5.096033
## [805,] 6.269111
## [806,] 4.251182
## [807,] 3.178084
## [808,] 3.326705
## [809,] -0.117235
## [810,] 6.013510
## [811,] 1.829871
## [812,] 4.870784
## [813,] 4.359292
## [814,] 1.988881
## [815,] 4.786390
## [816,] 5.009138
## [817,] 4.310842
## [818,] 3.952509
## [819,] 4.759230
## [820,] 3.654345
## [821,] 3.430608
## [822,] 1.992402
## [823,] -0.612098
## [824,] 3.378051
## [825,] 4.978908
## [826,] 1.866312
## [827,] 6.134294
## [828,] 2.426740
## [829,] 6.136525
## [830,] 6.523242
## [831,] 1.802323
## [832,] 3.780400
## [833,] 1.983001
## [834,] 1.923340
## [835,] 4.063971
## [836,] 1.116251
## [837,] 3.243764
## [838,] 3.926108
## [839,] 5.718225
## [840,] 3.059880
## [841,] 2.837683
## [842,] 1.308237
## [843,] 1.698878
## [844,] 0.421339
## [845,] 0.064530
## [846,] 4.034490
## [847,] 1.587400
## [848,] 0.114353
## [849,] 6.164510
## [850,] 5.888924
## [851,] 1.604259
## [852,] 3.287050
## [853,] 4.680645
## [854,] 5.565545
## [855,] 5.313842
## [856,] 4.385756
## [857,] 2.989401
## [858,] 2.274172
## [859,] 4.503114
## [860,] 5.026674
## [861,] 1.834728
## [862,] 0.252862
## [863,] 2.093359
## [864,] 4.583453
## [865,] 3.680633
## [866,] 2.091916
## [867,] 6.451073
## [868,] 2.451730
## [869,] 1.580740
## [870,] 3.848533
## [871,] 3.042540
## [872,] 1.218478
## [873,] 3.456770
## [874,] 5.598075
## [875,] 1.955241
## [876,] 5.535998
## [877,] 1.115486
## [878,] 0.762770
## [879,] 6.434505
## [880,] 2.016403
## [881,] 4.410400
## [882,] 1.746168
## [883,] 4.323938
## [884,] 3.381858
## [885,] 2.963683
## [886,] 4.317900
## [887,] 1.863831
## [888,] 6.493255
## [889,] 2.028309
## [890,] 6.629469
## [891,] 4.965482
## [892,] 5.223692
## [893,] 5.219090
## [894,] 2.666849
## [895,] 4.198028
## [896,] 6.722028
## [897,] 5.006197
## [898,] 4.052352
## [899,] 5.910270
## [900,] 4.291173
## [901,] 4.876648
## [902,] 3.151967
## [903,] 2.625287
## [904,] 1.732466
## [905,] 2.324159
## [906,] 4.277800
## [907,] 6.918375
## [908,] 4.942194
## [909,] 2.876135
## [910,] 5.369390
## [911,] 1.855834
## [912,] 3.552337
## [913,] 6.534223
## [914,] 4.920078
## [915,] 4.168785
## [916,] 3.443814
## [917,] 0.856097
## [918,] 4.721405
## [919,] 3.385660
## [920,] 1.695816
## [921,] 4.339769
## [922,] 2.039826
## [923,] 0.250331
## [924,] 5.829761
## [925,] 3.428305
## [926,] 1.184836
## [927,] 1.871091
## [928,] 4.577402
## [929,] 6.725715
## [930,] 1.070860
## [931,] 5.911750
## [932,] 2.963909
## [933,] 6.531998
## [934,] 5.141202
## [935,] 4.722809
## [936,] 3.838510
## [937,] 5.686650
## [938,] 5.134622
## [939,] 3.994404
## [940,] 4.490846
## [941,] 3.912251
## [942,] 7.104438
## [943,] 5.187608
## [944,] 3.811535
## [945,] 1.532277
## [946,] 6.169893
## [947,] 2.984232
## [948,] 1.151600
## [949,] 3.100385
## [950,] 3.429457
## [951,] 2.368712
## [952,] 1.429215
## [953,] 3.789935
## [954,] 1.796479
## [955,] 4.826861
## [956,] 4.162678
## [957,] 5.174209
## [958,] 3.993210
## [959,] 2.863458
## [960,] 7.067900
## [961,] 1.935055
## [962,] 0.824435
## [963,] -0.245390
## [964,] 4.105343
## [965,] 1.449986
## [966,] 1.652483
## [967,] 4.175557
## [968,] 3.717943
## [969,] 0.984872
## [970,] 3.028301
## [971,] 6.919102
## [972,] 3.848617
## [973,] 5.957928
## [974,] 3.693560
## [975,] 3.026198
## [976,] 2.066261
## [977,] 4.167580
## [978,] 2.882217
## [979,] 0.249908
## [980,] 1.473743
## [981,] 3.677018
## [982,] 3.625760
## [983,] 7.030422
## [984,] 6.350494
## [985,] 6.244818
## [986,] 4.314229
## [987,] 0.412985
## [988,] 5.400688
## [989,] 6.835076
## [990,] 5.927633
## [991,] 4.045940
## [992,] 6.617017
## [993,] 2.315705
## [994,] 3.055281
## [995,] 1.323191
## [996,] 0.781221
## [997,] 7.359940
## [998,] 0.498986
## [999,] 1.431823
## [1000,] 5.998057
Base Supermercado. Recuperado 27 de mayo de 2022, de https://www.kaggle.com/datasets/aungpyaeap/supermarket-sales?resource=download
Kottak, Conrad (2006), Introducción a la antropología cultural. Espejo para la humanidad, Madrid, McGraw Hill, 2006. Recuperado en 02 de junio de 2022, de https://scholar.google.com/scholar_lookup?title=+Introducci%C3%B3n+a+la+antropolog%C3%ADa+cultural.+Espejo+para+la+humanidad&author=Kottak+Conrad&publication_year=2006
Torres Gastelú, Carlos Arturo. (2012). La participación de las grandes cadenas de supermercados en las redes de comercialización de los pequeños productores. Nueva antropología, 25(77), 109-132. Recuperado en 02 de junio de 2022, de http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0185-06362012000200006&lng=es&tlng=es.
Vinatea, Eduardo (2008), Lecciones de antropología social y cultural, Madrid, Universidad Rey Juan Carlos / Dykinson. Recuperado en 02 de junio de 2022, de https://scholar.google.com/scholar_lookup?title=+Lecciones+de+antropolog%C3%ADa+social+y+cultural&author=Vinatea+Eduardo&publication_year=2008