1 Introducción

A lo largo de la historia el intercambio de insumos ha sido pieza fundamental en el desarrollo de la humanidad, estos movimientos surgen de la necesidad de cubrir los requerimientos básicos. Con el paso del tiempo y debido al aumento de la población, las cantidades demandadas debían de ser solventadas en masa, por tal motivo era necesario industrializar esta actividad.

La consolidación de un sistema mundial dedicado a la producción para la venta o el intercambio de mercancías con el objeto de maximizar beneficios entre las naciones ha reemplazado al antiguo sistema de comercio iniciando desde el trueque, pasando por tiendas de raya, grandes almacenes y concluyendo en los supermercados, que tienen en común la característica principal de cubrir las necesidades domésticas.

“De ahí que las sociedades modernas operan de acuerdo con la teoría del sistema mundial en la existencia de una cultura global, caracterizada por las conexiones que se van dando desde la gente local hasta las fuerzas internacionales” (Vinatea, 2008).

El origen de los supermercados se da en los años 60, con el objetivo de sustituir las bodegas minoristas. Es considerado supermercados todos los establecimientos con un volumen de ventas superior a 2 millones de dólares al año. Uno de los principales atractivos de los supermercados radica en la posibilidad de comprar productos diversos en un solo sitio y a bajo costo. Entre las áreas de mayor importancia en los supermercados es la venta de productos frescos, especialmente frutas y vegetales, en promedio esta área cubre el 25% y el 35% del total de ventas en los supermercados. ((IICA), Instituto Interamericano de Cooperación para la Agricultura; 2000)

Según Kottak (2006), los países más fuertes y poderosos del sistema mundial monopolizan las actividades más rentables ejerciendo un dominio y control sobre los países de la periferia. De ahí que la cultura global contemporánea ha manifestado el anhelo de poseer mercancías de todo el mundo. Un claro ejemplo de este dominio es Estados Unidos, un líder indiscutible en la industria minorista que cuenta con una gran variación en la segmentación del mercado, entre los más importantes se encuentran los supermercados o grandes cadenas de distribución.

Estados Unidos es la mayor economía del mundo; claro ejemplo de esto es que si su PIB se compara conta el de China es aproximadamente dos tercios del PIB estadounidense. Según los últimos datos del Departamento de Agricultura de Estados Unidos, indica que la base de la economía se encuentra en los servicios, ya que representa más de tres cuartas partes del PIB (77.3%) y emplea a más del 78,7% de la fuerza laboral del país. El comercio mayorista aportó alrededor del 5,8% y del comercio minorista 5,7% el PIB del país.

Por los datos mencionados con anterioridad y con el hecho de que en cualquier industria lo más importante es obtener el mayor beneficio, el presente trabajo busca que, mediante la utilización de una base de datos de dominio publico correspondiente al primer trimestre de un supermercado estadounidense, poder utilizar herramientas estadísticas que brinden resultados satisfactorios otorgando un resumen de la posición actual del comercio, consolidando un informe que pueda ser útil posteriormente con los análisis propuestos captar las áreas de oportunidad que puedan generar mayores beneficios al establecimiento.

Se busca demostrar la importancia de la extracción e interpretación de los datos en un caso aplicado a la vida real: mediante la identificación de las variables que conforman un a base de datos, poder realizar una selección adecuada que nos ayuden a resolver el problema de interés correspondiente al análisis de las ventas del supermercado para la toma decisiones acerca de las oportunidades de mejora, teniendo como finalidad incrementar el ticket promedio y por consecuencia la utilidad, así como precisar los departamento que pueden aportar mayores o menores ingresos.

2 Análisis Exploratorio de Datos

Primero que nada, importamos nuestro datos, seleccionamos y renombramos las variables con las que trabajaremos.

ventas_super<- rename(sales_super, Tipo_Supermercado= Branch,
                      Ciudad  = City,
                      Tipo_Cliente = Customer_type,
                      Departamento = Product_line,
                      Precio_Unitario = Unit_price,
                      Cantidad = Quantity,
                      Total = Total,
                      Tipo_Pago = Payment,
                      Costo = cogs,
                      Utilidad = gross_income)
names(ventas_super)

##  [1] "Tipo_Supermercado" "Ciudad"            "Tipo_Cliente"     
##  [4] "Departamento"      "Precio_Unitario"   "Cantidad"         
##  [7] "Total"             "Tipo_Pago"         "Costo"            
## [10] "Utilidad"

attach(ventas_super)

La base de datos, es una muestra de las ventas de un supermercado en dónde se ven los ciudad donde se realizó la transacción, departamentos a los que pertenecen los productos, cantidad, total y utilidad de la compra. Específicamente las variables que se van a analizar, son las siguientes:

Departamento: Nos indica los departamentos o áreas que hay en el Supermercado, y así mismo en donde se clasifican los productos que esta comprando el consumidor.
Cantidad: Número de artículos que se compraron en ese ticket o venta.
Utilidad: Se refiere al total que pago el cliente menos el costo que nos cobra el provedor, es decir lo que gana el supermercado por esta transacción.

Clasificando estos atributos, tenemos:

Variable	Tipo	Escala de medición
Departamento	Cualitativa	Nominal
Cantidad	Cuantitativa	Razón
Utilidad	Cuantitativa/Continua	Razón

2.1 Análisis Variable- Departamento

Empezaremos con el análisis de la variable cualitativa Departamento, viendo en unidades cuanto se vende de cada uno:

Departamento_Cantidad<- aggregate(Cantidad ~ Departamento,ventas_super,sum)
Departamento_Cantidad

##             Departamento Cantidad
## 1 Electronic accessories      971
## 2    Fashion accessories      902
## 3     Food and beverages      952
## 4      Health and beauty      854
## 5     Home and lifestyle      911
## 6      Sports and travel      920

Observamos que el departamento líder en ventas (Unidades) es Electronic Accesories, seguido de Food and Beverages.

Si lo vemos a nivel monetario, obtenemos la siguiente tabla:

Departamento_Utilidad<- aggregate(Utilidad ~ Departamento,ventas_super,sum)
Departamento_Total<- aggregate(Total ~ Departamento,ventas_super,sum)
Departamento_Utilidad_Total<-cbind(Departamento_Utilidad,Departamento_Total$Total )
Departamento_Utilidad_Total

##             Departamento Utilidad Departamento_Total$Total
## 1 Electronic accessories 2587.501                 54337.53
## 2    Fashion accessories 2585.995                 54305.89
## 3     Food and beverages 2673.564                 56144.84
## 4      Health and beauty 2342.559                 49193.74
## 5     Home and lifestyle 2564.853                 53861.91
## 6      Sports and travel 2624.896                 55122.83

En este caso, el departamento que nos deja mayor mayor utilidad es Food and Beverages, también es el que representa la demanda mayor en dinero. Por lo tanto, podemos decir que el hecho de que venda más piezas, no significa que nos deja más utilidad.

El siguiente paso en nuestro análisis es sacar la proporción, teniendo como resultado la siguiente tabla:

Pi<-Departamento_Cantidad$Cantidad/sum(Departamento_Cantidad$Cantidad)
Departamento_Cantidad2<- cbind(Departamento_Cantidad,Pi)
Departamento_Cantidad2

##             Departamento Cantidad        Pi
## 1 Electronic accessories      971 0.1762250
## 2    Fashion accessories      902 0.1637024
## 3     Food and beverages      952 0.1727768
## 4      Health and beauty      854 0.1549909
## 5     Home and lifestyle      911 0.1653358
## 6      Sports and travel      920 0.1669691

Observamos que el departamento con mayor probabilidad de venderse es Electronic Accesories, sin embargo los 6 departamentos tienen una proporción muy similar, es decir no varia tanto el porcentaje de la demanda entre ellos.

Esto se confirma con la siguiente gráfica:

pie(proporciones,labels = etiquetas,
    col=topo.colors(length(etiquetas)),
    main="Departamentos (Frecuencias relativas)")

2.2 Análisis Variable- Cantidad

Seguimos con el análisis de nuestra segunda variable: Cantidad. Esta atributo es cuantitivo y discreto.

Empezamos sacando las frecuencias, y observamos que la cantidad de artículos que se llevan por cliente, en este supermercado oscila entre 1 y 10 productos.

(tabla_cant<- table(Cantidad))  #tabla de frecuencias absolutas

## Cantidad
##   1   2   3   4   5   6   7   8   9  10 
## 112  91  90 109 102  98 102  85  92 119

En la tabla de frecuencias absolutas, se ve que la mayoría de los clientes se llevan sólo 10 productos, lo cual es bastante bueno ya que eso hace que nuestro ticket promedio suba. Sin embargo, la segunda mayor frecuencia es la compra de sólo 1 artículo, es decir que una gran parte de la población sólo va a comprar algo rápido o tal vez no están los artículos que esta buscando.

Esto lo podemos confirmar con la siguiente tabla de frecuencias relativas:

(tablar_cant <- round(prop.table(tabla_cant),digits=2)) # tabla de frecuencias relativas

## Cantidad
##    1    2    3    4    5    6    7    8    9   10 
## 0.11 0.09 0.09 0.11 0.10 0.10 0.10 0.09 0.09 0.12

Proseguimos a sacar la media:

mean(Cantidad)

## [1] 5.51

La cantidad promedio es de 6 articulos por venta. A pesar de eso, no existe una probabilidad marcada sobre el número de articulos que sea más probable que pueda elegir una persona en su compra. La diferencia entre la mayor probabilidad y la menor es de 3pbs (12% vs. 9%)

(tabla_acum<- cumsum(tabla_cant))

##    1    2    3    4    5    6    7    8    9   10 
##  112  203  293  402  504  602  704  789  881 1000

(tablar_acum<-cumsum(tablar_cant))

##    1    2    3    4    5    6    7    8    9   10 
## 0.11 0.20 0.29 0.40 0.50 0.60 0.70 0.79 0.88 1.00

Con las tablas de frencuencias acomuladas, podemos decir que el 50% de los clientes, a lo más se llevan 5 articulos por compra.

En la siguiente tabla podemos ver todas las frecuencias que se sacaron anteriormente:

tabla.fre2_cant<- matrix(cbind(tabla_cant[1],tabla_cant[2],tabla_cant[3],tabla_cant[4],tabla_cant[5],
                               tabla_cant[6],tabla_cant[7],tabla_cant[8],tabla_cant[9],tabla_cant[10],
                               tabla_acum[1],tabla_acum[2],tabla_acum[3],tabla_acum[4],tabla_acum[5],
                               tabla_acum[6],tabla_acum[7],tabla_acum[8],tabla_acum[9],tabla_acum[10],
                               tablar_cant[1],tablar_cant[2],tablar_cant[3],tablar_cant[4],tablar_cant[5],
                               tablar_cant[6],tablar_cant[7],tablar_cant[8],tablar_cant[9],tablar_cant[10],
                               tablar_acum[1],tablar_acum[2],tablar_acum[3],tablar_acum[4],tablar_acum[5],
                               tablar_acum[6],tablar_acum[7],tablar_acum[8],tablar_acum[9],tablar_acum[10]),
                         byrow=T,nrow = 4,ncol=10)
colnames(tabla.fre2_cant)<- c("1art.","2art.","3art.","4art.","5art.","6art.","7art.","8art.","9art.","10art.")
rownames(tabla.fre2_cant)<- c("fi","Fi","pi","Pi")
tabla.fre2_cant

##     1art.  2art.  3art.  4art. 5art. 6art. 7art.  8art.  9art.  10art.
## fi 112.00  91.00  90.00 109.00 102.0  98.0 102.0  85.00  92.00  119.00
## Fi 112.00 203.00 293.00 402.00 504.0 602.0 704.0 789.00 881.00 1000.00
## pi   0.11   0.09   0.09   0.11   0.1   0.1   0.1   0.09   0.09    0.12
## Pi   0.11   0.20   0.29   0.40   0.5   0.6   0.7   0.79   0.88    1.00

Al verlo gráficamente, se puede apreciar que la compra del número de artículos tiene un comportamiento uniforme, en otras palabras, no hay una cantidad que se separe mucho al resto.

barplot(tabla_cant,names.arg=c("1art.","2art.","3art.","4art.","5art.","6art.","7art.","8art.","9art.","10art."),col=topo.colors(c(3,32,28,5,6,7,8,9,3,3)),ylim=c(0,120))
title("Cantidad de Artículos \n (Frecuencias Absolutas)")

2.3 Análisis Variable- Utilidad

Por último tenemos la variable Utilidad.

range(Utilidad)

## [1]  0.5085 49.6500

Con el Método de la Raíz Cuadrada sacamos el rango, el cual va de .05 a 49.65 dólares por ticket de compra.

Este método nos dio un total de 32 clases. También obtuvimos la amplitud la cual nos dio un valor de 1.53.

Amplitud = diff(range(Total)) / 32

Posteriormente, sacamos la tabla de frecuencias:

(tabla_utilidad<- fdt(Utilidad,breaks="Scott",start=10,end=47,h=3,right=T))

##  Class limits  f   rf rf(%)  cf cf(%)
##       (10,13] 95 0.10   9.5  95   9.5
##       (13,16] 83 0.08   8.3 178  17.8
##       (16,19] 67 0.07   6.7 245  24.5
##       (19,22] 60 0.06   6.0 305  30.5
##       (22,25] 55 0.06   5.5 360  36.0
##       (25,28] 40 0.04   4.0 400  40.0
##       (28,31] 36 0.04   3.6 436  43.6
##       (31,34] 28 0.03   2.8 464  46.4
##       (34,37] 34 0.03   3.4 498  49.8
##       (37,40] 28 0.03   2.8 526  52.6
##       (40,43] 14 0.01   1.4 540  54.0
##       (43,46] 17 0.02   1.7 557  55.7

Observamos que tenemos una mayor frecuencia en utilidades pequeñas, especificamente el 51.9% del total de utilidades se encuentra en el rango de 0.5 y 13.

Seguimos con las medidas estadísticas media y mediana:

median(Utilidad)

## [1] 12.088

mean(Utilidad)

## [1] 15.37937

Tenemos una media de 15.37 y una mediana de 12.088, esto nos indica que los datos tienen un sesgo a la izquierda.

Al sacar un histograma de nuestra variable Utilidad, nos da el siguiente gráfico:

hist(Utilidad,col="darkolivegreen1",main="Histograma de Utilidad")

Con este grafico podemos confirmar que si tenemos un sesgo a la izquierda.

Al cruzar esta variable con Departamento, obtenemos lo siguiente:

n<- length(Utilidad)  
mu3<- sum((Utilidad-mean(Utilidad))^3)/(n-1)
s3<- sd(Utilidad)^3
j3<- mu3/s3; j3

## [1] 0.8907847

mode(Utilidad)

## [1] "numeric"

boxplot(Utilidad~Departamento, col = topo.colors(length(etiquetas)), main="Utilidad por Departamento",cex.main = 2, horizontal =F )

Analizando las utilidades por tienda podemos ver que estas están muy parejas. Sin embargo vemos que el Departamento que nos da mejor Utilidad es Food and Beverages, mientras que el que nos da menos es Health and Beauty.

Proseguimos a cruzar Utilidad con Cantidad

round(cor(base[c(8,16)]),digits = 2)

##              Quantity gross_income
## Quantity         1.00         0.71
## gross_income     0.71         1.00

plot(base[c(8,16)],col="darkolivegreen1",ylab="Utilidad",xlab="Cantidad",main="Utilidad Vs Cantidad")

La tendencia es que entre mayor número de artículos se lleve el cliente, mayor será la Utilidad.

3 Inferencia Estadística Clásica

Posterior al desarrollo del análisis exploratorio de los datos es necesario acudir a herramientas que permitan modelar la muestra con la que contamos, es por eso por lo que nos apoyamos de la Inferencia Estadística Clásica que se define como conjunto de métodos y técnicas que permiten inducir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.

Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos: métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral que se utiliza como estimador de un parámetro. A continuación, buscaremos desarrollar una estimación puntual y objetiva para modelar la variable cuantitativa Utilidad teniendo como conocimiento previo que tiene un comportamiento continuo.

3.1 Estimación Puntual

Como primer paso y continuando con una consistencia de la interpretación gráfica, es necesario observar el comportamiento de nuestros datos mediante un histograma, así como su densidad.

hist(Utilidad,probability=T,col="violetred1",ylim=c(0,0.06), main = "Utilidad",ylab="Densidad")
lines(density(Utilidad),lwd=2,col="violetred4")

Con los conocimientos estadísticos previos se puede notar en la gráfica que la mayoría de los datos se concentran en una forma de campana hacia la izquierda en un rango especifico de valores, por lo que se proponen 2 distribuciones que pueden adaptarse de mejor forma: Gamma y Weibull. El siguiente paso es obtener los parámetros que cumplan con la distribución, para lograr identificar los parámetros es necesario llevar a cabo el método de máxima verosimilitud.

La siguiente extracción de R- Studio demuestra que como se suponía, las distribuciones más adecuadas a nuestros datos son la distribución Weibull y Gamma.

(fit1 <- fitdistr(Utilidad, densfun="gamma"))

(fit2 <- fitdistr(Utilidad, densfun="weibull"))

Clasificando los parámetros de la distribución Gamma:

Variable	Valor
Shapew	1.562511187
Rate	0.101597915

Clasificando los parámetros de la distribución Weibull:

Variable	Valor
Shape	1.3172452
Scale	16.7178052

A continuación y utilizando los parámetros obtenido a traves del método de M.V., las distribuciones propuestas lucirían de la siguiente forma. Adicionalmente se muestran los Q-Plot para poder tener una mejor referencia:

3.1.1 Densidades de las distribuciones

3.1.1.1 Distribución Gamma

hist(Utilidad, pch=30,prob=TRUE, main="",col="seagreen2",ylim=c(0,0.06))
curve(dgamma(x, fit1$estimate[1],fit1$estimate[2]), col="seagreen4", lwd=3, add=T)

3.1.1.2 Distribución Weibull

hist(Utilidad, pch=30,prob=TRUE, main="",col="coral")
curve(dweibull(x, fit2$estimate[1],fit2$estimate[2]), col="saddlebrown", lwd=3, add=T)

3.1.1.3 Q Plot

par(mfrow=c(1, 2))
  qqplot(ventas_super$Utilidad, pch=19,
       x=qgamma(ppoints(n), shape= 1.562511187, rate=0.101597915),
       main='Gamma Q-Q Plot',
       xlab='Theoretical Quantiles',
       ylab='Sample Quantiles')
  qqplot(ventas_super$Utilidad, pch=19,
       x=qweibull(ppoints(n), shape=1.3172452, scale=16.7178052),
       main='Weibull Q-Q Plot',
       xlab='Theoretical Quantiles',
       ylab='Sample Quantiles')

3.1.2 Máxima Verosimilitud

Hasta este punto se puede afirmar que ambas distribuciones (Gamma y Weibull) tienen un comportamiento similiar a la distribución de nuestros datos, a pesar de esto. ¿Cómo se que cuál es la mejor? Por tal motivo es necesario comprobar estos argumentos de forma estadisticas, comenzando por observar la siguiente gráfica para posteriormente evaluar mediante los parámetros:

density(Utilidad)

plot(density(Utilidad),las=2, main="Densidad de las distribuciones",col="red",xlab="Datos",panel.first=grid(),)
curve(dweibull(x,1.3172452,16.7178052,log = FALSE),add = TRUE,col="blue")
curve(dgamma(x,1.562511187,0.101597915  ),add = TRUE,col="green")

3.1.3 Exposición de las distribuciones

3.1.3.1 Distribución Gamma

fitgamma<-fitdist(Utilidad,"gamma",method = "mle")
summary(fitgamma)

## Fitting of the distribution ' gamma ' by maximum likelihood 
## Parameters : 
##        estimate  Std. Error
## shape 1.5629646 0.063816560
## rate  0.1016357 0.004880918
## Loglikelihood:  -3680.02   AIC:  7364.039   BIC:  7373.855 
## Correlation matrix:
##           shape      rate
## shape 1.0000000 0.8500778
## rate  0.8500778 1.0000000

ks.test(Utilidad,"pgamma",1.562511187,0.101597915 )

## Warning in ks.test.default(Utilidad, "pgamma", 1.562511187, 0.101597915): ties
## should not be present for the Kolmogorov-Smirnov test

## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  Utilidad
## D = 0.039899, p-value = 0.08284
## alternative hypothesis: two-sided

plot(fitgamma)

3.1.3.2 Distribución Weibull

fitweibull<-fitdist(Utilidad,"weibull",method = "mle")
summary(fitweibull)

## Fitting of the distribution ' weibull ' by maximum likelihood 
## Parameters : 
##       estimate Std. Error
## shape  1.31720 0.03288527
## scale 16.71558 0.42327725
## Loglikelihood:  -3679.374   AIC:  7362.747   BIC:  7372.563 
## Correlation matrix:
##           shape     scale
## shape 1.0000000 0.3184361
## scale 0.3184361 1.0000000

ks.test(Utilidad,"pweibull",1.3172452,16.7178052)

## Warning in ks.test.default(Utilidad, "pweibull", 1.3172452, 16.7178052): ties
## should not be present for the Kolmogorov-Smirnov test

## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  Utilidad
## D = 0.040211, p-value = 0.0788
## alternative hypothesis: two-sided

plot(fitweibull)

Las distribuciones que se propusieron con anterioridad, aplicando la prueba Kolmogor-Smirnov en ambos casos su p-value fue mayor a .05 determinando que los datos vienen de esa distribución. A pesar de que las distribuciones se adecuan de forma exitosa a nuestros datos, por la definición de maximización, utilizaremos la distribución Gamma que cuenta con el indicador Log-Likehood de -3679.374 siendo el mayor entre las opciones.

3.2 Estimación de Intervalos de Confianza

3.2.1 Una Poblacion

hist(Utilidad,col="slategray2")

qqnorm(Utilidad,pch=16);qqline(Utilidad,col="springgreen1",lwd=2)

Prueba de normalidad A-D

ad.test(Utilidad)

## 
##  Anderson-Darling normality test
## 
## data:  Utilidad
## A = 28.475, p-value < 2.2e-16

H0: Los datos tienden una Distribución Normal
H1: Los datos tienden no una Distribución Normal

Por lo tanto se rechaza H0

lambda = BoxCox.lambda(Utilidad,method="loglik",lower=-100,upper=100);lambda

## [1] 0.3

lambda2 = BoxCox.lambda(Utilidad,method="guerrero",lower=-100,upper=100);lambda2

## [1] -0.03570584

Aplicamos la lamba óptima a los datos, transformadolos de tal manera que se acerquen a una Distribución Normal

trans.utilidad <- BoxCox(Utilidad, lambda)  # aplica la lambda optima a los datos, transformandolos

hist(trans.utilidad, main="Histogrma de Utilidad Transformada")

Kolmogorov–Smirnov Test

Proseguimos a sacar el test Kolmogorov–Smirnov

ks.test(trans.utilidad, "pnorm",mean(trans.utilidad),sd(trans.utilidad))

## Warning in ks.test.default(trans.utilidad, "pnorm", mean(trans.utilidad), : ties
## should not be present for the Kolmogorov-Smirnov test

## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  trans.utilidad
## D = 0.042819, p-value = 0.05111
## alternative hypothesis: two-sided

qqnorm(trans.utilidad,pch=16);qqline(trans.utilidad,col="red",lwd=2)

Con este test y gráfica Q-Q Plot, observamos que los datos transformados de la variable Utilidad se acercan mucho a una distribución normal, sin embargo no tenemos una normalidad perfecta.

En el siguiente gráfico, podemos apreciar la variable Utilidad, sus datos originales y los transformados.

par(mfrow=c(1, 2))
hist(trans.utilidad, main="Histograma de Utilidad Transformada")
hist(Utilidad,main="Histograma de Utilidad")

3.2.1.1 Intervalos de Confianza

Utilizando la variable transformada, estimamos un intervalo de confianza del 80%

utilidad_barra<-mean(trans.utilidad)
ds<-sd(trans.utilidad)
n<-length(trans.utilidad)

ee<- qt(0.20/2,df=n-1,lower.tail = F)*ds/sqrt(n)
options(digits= 5)
cbind(utilidad_barra-ee,utilidad_barra+ee)

##        [,1]   [,2]
## [1,] 3.6533 3.8013

t.test(trans.utilidad,alternative = "two.sided",conf.level = 0.80)

## 
##  One Sample t-test
## 
## data:  trans.utilidad
## t = 64.6, df = 999, p-value <2e-16
## alternative hypothesis: true mean is not equal to 0
## 80 percent confidence interval:
##  3.6533 3.8013
## sample estimates:
## mean of x 
##    3.7273

Tenemos la certeza del 80% que el valor verdadero de la utilidad por ticket esta dentro del intervalo (3.6533, 3.8013)

Para estimamos un intervalo de confianza del 99.9%

ee2<- qt(0.001/2,df=n-1,lower.tail = F)*ds/sqrt(n)

options(digits= 5)

cbind(utilidad_barra-ee2,utilidad_barra+ee2)

##        [,1]   [,2]
## [1,] 3.5368 3.9178

t.test(trans.utilidad,alternative = "two.sided",conf.level = 0.999)

## 
##  One Sample t-test
## 
## data:  trans.utilidad
## t = 64.6, df = 999, p-value <2e-16
## alternative hypothesis: true mean is not equal to 0
## 99.9 percent confidence interval:
##  3.5368 3.9178
## sample estimates:
## mean of x 
##    3.7273

Se puede decir que tenemos la certeza del 99.9% que el valor verdadero de la utilidad por ticket esta dentro del intervalo (3.5368, 3.9178)

Los valores de los intervalos del 80% y 99.9% no presentan una gran variación, pero si se puede notar que el intervalo de confianza del 99.9% tiene una anchura mayor entre los intervalos. En el caso que se presentara una anchura mayor entre el intervalo de confianza del 80% y 99.9% sería más conveniente trabajar con el intervalo de confianza del 80%

3.2.2 Dos poblaciones

Muestras Independientes

Suponemos independencia entre las muestras.

Se consideran dos grupos, en el grupo uno están los departamentos en los que se venden artículos para uso personal, alimentos y moda. En el grupo dos están los departamentos que venden artículos para el hogar.

grupo1<- ventas_super[Departamento %in% c("Fashion accessories","Food and beverages","Health and beauty"),]; grupo1

## # A tibble: 504 × 10
##    Tipo_Supermercado Ciudad   Tipo_Cliente Departamento Precio_Unitario Cantidad
##    <chr>             <chr>    <chr>        <chr>                  <dbl>    <dbl>
##  1 A                 Yangon   Member       Health and …            74.7        7
##  2 A                 Yangon   Member       Health and …            58.2        8
##  3 A                 Yangon   Member       Health and …            36.3        2
##  4 B                 Mandalay Member       Food and be…            54.8        3
##  5 B                 Mandalay Member       Fashion acc…            14.5        4
##  6 A                 Yangon   Normal       Food and be…            43.2       10
##  7 A                 Yangon   Normal       Health and …            71.4       10
##  8 A                 Yangon   Member       Health and …            68.9        7
##  9 A                 Yangon   Normal       Food and be…            54.7        3
## 10 B                 Mandalay Normal       Health and …            88.0        3
## # … with 494 more rows, and 4 more variables: Total <dbl>, Tipo_Pago <chr>,
## #   Costo <dbl>, Utilidad <dbl>

grupo2<- ventas_super[Departamento %in% c("Home and lifestyle","Sports and travel","Electronic accessories"),]; grupo2

## # A tibble: 496 × 10
##    Tipo_Supermercado Ciudad   Tipo_Cliente Departamento Precio_Unitario Cantidad
##    <chr>             <chr>    <chr>        <chr>                  <dbl>    <dbl>
##  1 C                 Naypyit… Normal       Electronic …            15.3        5
##  2 A                 Yangon   Normal       Home and li…            46.3        7
##  3 A                 Yangon   Normal       Sports and …            86.3        7
##  4 C                 Naypyit… Normal       Electronic …            85.4        7
##  5 A                 Yangon   Member       Electronic …            68.8        6
##  6 C                 Naypyit… Normal       Home and li…            73.6       10
##  7 B                 Mandalay Member       Electronic …            25.5        4
##  8 A                 Yangon   Normal       Electronic …            47.0        5
##  9 B                 Mandalay Member       Sports and …            93.7        6
## 10 A                 Yangon   Normal       Sports and …            72.6        6
## # … with 486 more rows, and 4 more variables: Total <dbl>, Tipo_Pago <chr>,
## #   Costo <dbl>, Utilidad <dbl>

n1<-nrow(grupo1)
n2<-nrow(grupo2)

mean(grupo1$Utilidad)

## [1] 15.084

mean(grupo2$Utilidad)

## [1] 15.68

dif<- mean(grupo1$Utilidad)-mean(grupo2$Utilidad)
dif

## [1] -0.59637

s2_1<- var(grupo1$Utilidad)
s2_1

## [1] 133.56

s2_2<- var(grupo2$Utilidad)
s2_2

## [1] 140.79

Estimamos un intervalo de confianza de 80%

ee<- qnorm(0.20/2,lower.tail=F)*sqrt((s2_1/n1)+(s2_2/n2))
c(dif-ee,dif+ee)

## [1] -1.54580  0.35305

Estimaremos intervalos de confianza del 80% y 99.9%

Con un intervalo de confianza del 80% tenemos un intervalo del (-1.54580, 0.35305) que contiene la diferencia entre la utilidad entre los grupos de departamentos conformados. Podemos decir que con un 80% de confianza que los grupos de departamento manejan una utilidad promedio muy similar.

Estimamos un intervalo de confianza de 99.9%

ee<- qnorm(0.001/2,lower.tail=F)*sqrt((s2_1/n1)+(s2_2/n2))
c(dif-ee,dif+ee)

## [1] -3.0341  1.8414

Con un intervalo de confianza del 99.9% el intervalo es de (-3.0341, 1.8414) en el cual se encuentran las diferencias de las medias de la utilidad de los dos grupos de departamentos que estamos manejando. Podemos ver que ambas contienen el valor cero por lo tanto podemos decir que el nivel promedio no cambia de un grupo a otro.

Muestras Dependientes

d<- grupo1$Utilidad-grupo2$Utilidad ; n<- length(d); n

## Warning in grupo1$Utilidad - grupo2$Utilidad: longer object length is not a
## multiple of shorter object length

## [1] 504

dbarra<- mean(d); dbarra

## [1] -0.65384

ee_dep<- qt(0.20/2,df=(n)-1,lower.tail = F)*sd(d)/sqrt(n)

i.c_difmedias_dep<- c(dif-ee_dep,dif+ee_dep); i.c_difmedias_dep

## [1] -1.56610  0.37335

Con un intervalo de confianza del 80% encontramos que el intervalo (-1.56610, 0.37335) contienen las diferencias de las medias de utilidades de lo grupo de departamentos 1 contra el grupo de departamentos 2.

ee_dep<- qt(0.001/2,df=(n)-1,lower.tail = F)*sd(d)/sqrt(n)

i.c_difmedias_dep<- c(dif-ee_dep,dif+ee_dep); i.c_difmedias_dep

## [1] -3.0977  1.9049

Con un Intervalo de Confianza del 99.9% encontramos que el intervalo (-3.0977, 1.9049) contienen las diferencias de las medias de utilidades de lo grupo de departamentos 1 contra el grupo de departamentos 2.

l_inde<- (dif+ee)-(dif-ee); l_inde

## [1] 4.8755

l_dep<- (dif+ee_dep)-(dif-ee_dep); l_dep

## [1] 5.0026

Al comparar la muestra dependiente con la muestra independiente podemos observar que nos conviene más tomar las muestras dependientes ya que presenta una anchura menor.

3.3 Pruebas de Hipótesis Paramétricas

3.3.1 Una Población

Con la variable utilidad transformada vamos a analizar el promedio de utilidad por ticket. De acuerdo con estos datos queremos comprobar que el promedio de utilidad de un ticket es igual a 3.72.

Por lo tanto, tenemos:

H0 : La utilidad promedio de los tickets es 3.72
Ha : La utilidad promedio de los tickets es diferente de 3.72

rcrit1<- qnorm(0.001/2,mean=0,sd=1,lower.tail=T)
rcrit1

## [1] -3.2905

rcrit2<- qnorm(0.001/2,mean=0,sd=1,lower.tail=F)
rcrit2

## [1] 3.2905

p1<- z.test(trans.utilidad,alternative="two.sided",mu=3.72,sigma.x=1.82,conf.level=0.999)
p1$statistic

##       z 
## 0.12679

p1$p.value

## [1] 0.8991

p1$conf.int

## [1] 3.5379 3.9167
## attr(,"conf.level")
## [1] 0.999

Dado que Zcalc=0.12679 y Zcrit=3.2905 y como Zcalc<Zcrit no se rechaza la hipotesis nula, esto quiere decir que hay suficiente evidencia estadistica para decir que la media de las utilidades por ticket es 3.72. También, vemos que el p-value= 0.8991 es mayor al nivel de significancia por lo tanto NO se rechaza H0.

3.3.2 Dos poblaciones

En este caso se quiere demostrar que el grupo 1 de los departamentos del supermercado tienen una mayor utilidad que el grupo 2. Recordemos que en el grupo 1 se encuentran los departamentos que venden artículos para uso personal, alimentos y moda. En el grupo dos están los departamentos que venden artículos para el hogar.

Denominaremos a mu1 como la media del grupo 1 de departamentos y mu2 será la media del grupo 2. Nuestras hipótesis quedan de la siguiente manera grupo 2 de departamentos:

H0: mu1<mu2
Ha: mu1>=mu2

Se trabajará con la muestra dependiente con los niveles de significancia de 0.1 % y del 20%.

Con el nivel de significancia del 0.1% tenemos los siguientes resultados:

t.test(grupo1$Utilidad,grupo2$Utilidad,alternative="two.sided",mu0 = 0,paired =F,conf.level = 0.999)

## 
##  Welch Two Sample t-test
## 
## data:  grupo1$Utilidad and grupo2$Utilidad
## t = -0.805, df = 996, p-value = 0.42
## alternative hypothesis: true difference in means is not equal to 0
## 99.9 percent confidence interval:
##  -3.0414  1.8486
## sample estimates:
## mean of x mean of y 
##    15.084    15.680

t.crit= qt(0.001,df=n-1,lower.tail = T); t.crit

## [1] -3.1065

Con una significancia del .1% tenemos un tcalc=-0.805 y un tcrit =-3.10, por lo tanto, no se rechaza la hipótesis nula. Además, se obtiene un valor de p-value = 0.42 con lo que comprobamos nuestro análisis.

Con el nivel de significancia del 20%, tenemos los siguientes resultados:

t.test(grupo1$Utilidad,grupo2$Utilidad,alternative="two.sided",mu0 = 0,paired =F,conf.level = 0.80)

## 
##  Welch Two Sample t-test
## 
## data:  grupo1$Utilidad and grupo2$Utilidad
## t = -0.805, df = 996, p-value = 0.42
## alternative hypothesis: true difference in means is not equal to 0
## 80 percent confidence interval:
##  -1.54643  0.35368
## sample estimates:
## mean of x mean of y 
##    15.084    15.680

t.crit1= qt(0.20,df=n-1,lower.tail = T); t.crit1

## [1] -0.84234

En el caso del nivel de significancia del del 20% tenemos los siguientes resultados, un tcalc=-0.805 y un tcrit=-0.8423, tcalc>tcrit , con esto comprobamos que se rechaza la Hipotesis Nula. Pero es una diferencia muy pequeña, con un valor de p-value = 0.42, indicando que la Hipótesis Nula no se rechaza.

Con los dos niveles de significancia podemos concluir que el grupo 1 tiene mayores utilidades, pero estas no tienen una gran diferencia con las del grupo 2.

4 Conclusiones

La recabación del análisis de las variables seleccionadas nos puede otorgar un panorama más detallado para realizar las siguientes afirmaciones:

A pesar de tener una distribución equitativa de las cantidades que se venden por departamento, tenemos una oportunidad de alzar los números si realizamos una estrategia en el departamento Health and Beauty, esta podría ser alzando los precios para subir la utilidad, bajar los precios para subir la cantidad, o revisar con el área de compras para checar si los productos exhibidos son los que nuestra clientela esta buscando.
Para subir tanto Calidad como Utilidad, y así subir el ticket promedio, tenemos que buscar algo que marque la diferencia en nuestras tiendas, ya sea el servicio, las instalaciones, la gama de productos que manejamos, la manera de comprar.
Aunque nuestros departamentos líderes en venta son Food and Beverages y Electronic Accesories, la probabilidad de compra a cualquier departamento es casi la misma, por lo tanto, se requiere tener abastecidas todas las áreas con el inventario suficiente para compra.

5 Anexo

5.1 Cantidad

Podemos observar que este grafico no es muy distinto al de frecuencias absolutas.

barplot(tablar_cant,names.arg=c("1art.","2art.","3art.","4art.","5art.","6art.","7art.","8art.","9art.","10art."),col=topo.colors(3:13),ylim=c(0,0.15))
title("Cantidad de Artículos \n (Frecuencias Relativas)")

5.2 Utilidad

Al cruzar esta variable con Ciudad, obtenemos lo siguiente:

boxplot(Utilidad~Ciudad,col="turquoise", horizontal =T )

Analizando las utilidades por tienda podemos ver que estas están muy parejas, la ciudad de Yangon el 75% tiene utilidades de 22 al igual que Mandalay. Mientras que Naypyitaw tiene utilidades mayores a estas que son 24.

5.2.1 Matriz de Utilidad Transformada

as.matrix(trans.utilidad)

##              [,1]
##    [1,]  5.539818
##    [2,]  1.649745
##    [3,]  4.355454
##    [4,]  5.237408
##    [5,]  5.933204
##    [6,]  5.903461
##    [7,]  4.934037
##    [8,]  6.496865
##    [9,]  1.572436
##   [10,]  2.939090
##   [11,]  1.252500
##   [12,]  2.101683
##   [13,]  3.644995
##   [14,]  5.045522
##   [15,]  6.408545
##   [16,]  5.735780
##   [17,]  5.328736
##   [18,]  5.067339
##   [19,]  2.933250
##   [20,]  1.730393
##   [21,]  5.035615
##   [22,]  3.894719
##   [23,]  1.444381
##   [24,]  3.032172
##   [25,]  3.910698
##   [26,]  4.979856
##   [27,]  0.558560
##   [28,]  3.060099
##   [29,]  5.102684
##   [30,]  3.547641
##   [31,]  5.264305
##   [32,]  6.362558
##   [33,]  6.226247
##   [34,]  3.248470
##   [35,]  4.840577
##   [36,]  1.481177
##   [37,]  4.274740
##   [38,]  5.665473
##   [39,]  5.088680
##   [40,]  3.699871
##   [41,]  1.842801
##   [42,]  2.258971
##   [43,]  4.944110
##   [44,]  6.708012
##   [45,]  0.458776
##   [46,]  4.703235
##   [47,]  5.475014
##   [48,]  3.111573
##   [49,]  2.279218
##   [50,]  6.845806
##   [51,]  6.093873
##   [52,]  3.537857
##   [53,]  1.551223
##   [54,] -0.249581
##   [55,]  0.516227
##   [56,]  6.300874
##   [57,]  1.877623
##   [58,]  6.420810
##   [59,]  6.448073
##   [60,]  3.149638
##   [61,]  1.606656
##   [62,]  4.426311
##   [63,]  5.398733
##   [64,]  2.864634
##   [65,]  4.199968
##   [66,]  2.871682
##   [67,]  1.456004
##   [68,]  5.847105
##   [69,]  6.700757
##   [70,] -0.086063
##   [71,]  7.091942
##   [72,]  6.010803
##   [73,]  2.712865
##   [74,]  5.180102
##   [75,]  6.233900
##   [76,]  4.954753
##   [77,]  5.100163
##   [78,]  3.111573
##   [79,]  6.683142
##   [80,]  2.099445
##   [81,]  5.891435
##   [82,]  4.102114
##   [83,]  2.815971
##   [84,]  4.334978
##   [85,]  3.731144
##   [86,]  5.827115
##   [87,]  4.746329
##   [88,]  4.503931
##   [89,]  0.844917
##   [90,]  5.216259
##   [91,]  3.211013
##   [92,]  5.141429
##   [93,]  2.814293
##   [94,]  5.816798
##   [95,]  1.896406
##   [96,]  2.022364
##   [97,]  7.035310
##   [98,]  1.616219
##   [99,]  2.866398
##  [100,]  5.401744
##  [101,]  1.020333
##  [102,]  6.380404
##  [103,]  3.392665
##  [104,]  4.530355
##  [105,]  3.439132
##  [106,]  7.063540
##  [107,]  2.936343
##  [108,]  4.683549
##  [109,]  4.221233
##  [110,]  6.821346
##  [111,]  0.539644
##  [112,]  4.137221
##  [113,]  5.473305
##  [114,]  5.538800
##  [115,]  6.462689
##  [116,]  1.739046
##  [117,]  2.220997
##  [118,]  1.090077
##  [119,]  2.219478
##  [120,]  2.177772
##  [121,]  6.734180
##  [122,]  4.853871
##  [123,]  7.108827
##  [124,]  5.480552
##  [125,]  5.159294
##  [126,]  6.164119
##  [127,]  2.901426
##  [128,]  4.067549
##  [129,]  5.667443
##  [130,]  6.794580
##  [131,]  4.002906
##  [132,]  5.689344
##  [133,]  2.634424
##  [134,]  5.549327
##  [135,]  5.357117
##  [136,]  3.949443
##  [137,]  2.532058
##  [138,]  3.381858
##  [139,]  5.520780
##  [140,]  5.820398
##  [141,]  7.103113
##  [142,]  7.127453
##  [143,]  6.293135
##  [144,]  0.446518
##  [145,]  5.248102
##  [146,]  4.004652
##  [147,]  4.188310
##  [148,]  3.899809
##  [149,]  5.796081
##  [150,]  3.859522
##  [151,]  4.640571
##  [152,]  3.708265
##  [153,]  6.550880
##  [154,]  2.050632
##  [155,]  6.128907
##  [156,]  5.213538
##  [157,]  1.565321
##  [158,]  3.789935
##  [159,]  7.022122
##  [160,]  5.726188
##  [161,]  4.502434
##  [162,]  1.385027
##  [163,]  4.328459
##  [164,]  2.801556
##  [165,]  4.848707
##  [166,]  4.469060
##  [167,]  7.300255
##  [168,]  7.412349
##  [169,]  4.234987
##  [170,]  5.350912
##  [171,]  4.533660
##  [172,]  4.856388
##  [173,]  2.965042
##  [174,]  4.305503
##  [175,]  2.867220
##  [176,]  4.211881
##  [177,]  3.082107
##  [178,]  2.858394
##  [179,]  5.111152
##  [180,]  3.865499
##  [181,]  5.148337
##  [182,]  4.235578
##  [183,]  2.827923
##  [184,]  3.980128
##  [185,]  1.836704
##  [186,]  1.163074
##  [187,]  6.577553
##  [188,]  3.173048
##  [189,]  1.603659
##  [190,]  4.017948
##  [191,]  3.612446
##  [192,]  2.731242
##  [193,]  6.710300
##  [194,]  2.104239
##  [195,]  2.927972
##  [196,]  1.608054
##  [197,]  1.854944
##  [198,]  0.243135
##  [199,]  2.955965
##  [200,]  4.579863
##  [201,]  2.298707
##  [202,]  3.601970
##  [203,]  5.033688
##  [204,]  3.853866
##  [205,]  1.880618
##  [206,]  3.389165
##  [207,]  5.913277
##  [208,]  4.065449
##  [209,]  1.920056
##  [210,]  7.101614
##  [211,]  3.656744
##  [212,]  6.893734
##  [213,]  5.215482
##  [214,]  2.633139
##  [215,]  3.389165
##  [216,] -0.088723
##  [217,]  2.426880
##  [218,]  4.054695
##  [219,]  6.589494
##  [220,]  3.023538
##  [221,]  3.961045
##  [222,]  5.060970
##  [223,]  1.279160
##  [224,] -0.435596
##  [225,]  1.838858
##  [226,]  3.048918
##  [227,]  6.024903
##  [228,]  2.746048
##  [229,]  5.647100
##  [230,]  5.460224
##  [231,]  2.918653
##  [232,]  0.496456
##  [233,]  6.581052
##  [234,]  4.142162
##  [235,]  5.522314
##  [236,]  3.177246
##  [237,]  1.848702
##  [238,]  3.520702
##  [239,]  1.437895
##  [240,]  1.895357
##  [241,]  3.551785
##  [242,]  2.365996
##  [243,]  3.178504
##  [244,]  3.783128
##  [245,]  6.557999
##  [246,]  4.734399
##  [247,]  3.728109
##  [248,]  1.895532
##  [249,]  4.258516
##  [250,]  5.481276
##  [251,]  4.969349
##  [252,]  4.546110
##  [253,]  0.384560
##  [254,]  1.986363
##  [255,]  5.267318
##  [256,]  2.517705
##  [257,]  1.443301
##  [258,]  2.833403
##  [259,]  2.497715
##  [260,]  3.893240
##  [261,]  6.248863
##  [262,]  1.431388
##  [263,]  2.806370
##  [264,]  3.532768
##  [265,]  1.168290
##  [266,]  6.304906
##  [267,]  2.666596
##  [268,]  6.538354
##  [269,]  4.047192
##  [270,]  4.569539
##  [271,]  4.445540
##  [272,]  0.838115
##  [273,]  3.255617
##  [274,]  0.190038
##  [275,]  5.905917
##  [276,]  4.436113
##  [277,]  3.493608
##  [278,]  4.740496
##  [279,]  6.392547
##  [280,]  5.093507
##  [281,]  5.722985
##  [282,]  0.675613
##  [283,] -0.254988
##  [284,]  5.909251
##  [285,]  3.223004
##  [286,]  4.419482
##  [287,]  1.619397
##  [288,]  3.451537
##  [289,]  4.462249
##  [290,]  6.200149
##  [291,]  4.873229
##  [292,]  3.266709
##  [293,]  1.357954
##  [294,]  1.576490
##  [295,]  3.122396
##  [296,]  3.858857
##  [297,]  2.305462
##  [298,]  5.262277
##  [299,]  3.691804
##  [300,]  1.876389
##  [301,]  3.313947
##  [302,]  0.739743
##  [303,]  1.017650
##  [304,]  3.364638
##  [305,]  2.367997
##  [306,]  5.450019
##  [307,]  4.036610
##  [308,]  6.394272
##  [309,]  1.708419
##  [310,]  2.931072
##  [311,]  5.312922
##  [312,]  2.625416
##  [313,]  1.544447
##  [314,]  2.641993
##  [315,]  6.676229
##  [316,]  3.304943
##  [317,]  1.375001
##  [318,]  4.691090
##  [319,]  3.393248
##  [320,]  3.070362
##  [321,]  3.380394
##  [322,]  0.752538
##  [323,]  1.927826
##  [324,]  4.243610
##  [325,]  2.499342
##  [326,]  4.798893
##  [327,]  5.415977
##  [328,]  4.710924
##  [329,]  3.362282
##  [330,]  2.711369
##  [331,]  3.299326
##  [332,]  2.047690
##  [333,]  4.762132
##  [334,]  0.972807
##  [335,]  1.592230
##  [336,]  2.671285
##  [337,]  6.299865
##  [338,]  4.517778
##  [339,]  2.680135
##  [340,]  4.763897
##  [341,]  2.696739
##  [342,]  4.804068
##  [343,]  5.617780
##  [344,]  5.342927
##  [345,]  2.563958
##  [346,]  6.357339
##  [347,]  1.560836
##  [348,]  6.409364
##  [349,]  3.133495
##  [350,]  2.577788
##  [351,]  7.422759
##  [352,]  4.612165
##  [353,]  4.749559
##  [354,]  3.717682
##  [355,]  0.440166
##  [356,]  4.577269
##  [357,]  4.701053
##  [358,]  7.295580
##  [359,]  1.765912
##  [360,]  1.621579
##  [361,]  6.128557
##  [362,]  6.576924
##  [363,]  3.313348
##  [364,]  5.088450
##  [365,]  2.944118
##  [366,]  4.372551
##  [367,]  5.215926
##  [368,]  3.893240
##  [369,]  2.688325
##  [370,]  3.251944
##  [371,]  3.151332
##  [372,]  2.399803
##  [373,]  4.979501
##  [374,]  3.799102
##  [375,]  4.433752
##  [376,]  5.334064
##  [377,]  4.313293
##  [378,]  6.218495
##  [379,]  4.779871
##  [380,]  1.979633
##  [381,]  4.390896
##  [382,]  1.137538
##  [383,]  5.413608
##  [384,]  4.174505
##  [385,]  3.364049
##  [386,]  1.638366
##  [387,]  4.028828
##  [388,]  4.347550
##  [389,]  5.350859
##  [390,]  2.477838
##  [391,]  3.704071
##  [392,]  4.726634
##  [393,]  1.657948
##  [394,]  5.538647
##  [395,]  1.714124
##  [396,]  4.777234
##  [397,]  3.955008
##  [398,]  2.405298
##  [399,]  3.746790
##  [400,]  3.036147
##  [401,]  3.661271
##  [402,]  3.162528
##  [403,] -0.339539
##  [404,]  3.305043
##  [405,]  6.286942
##  [406,]  3.936338
##  [407,]  1.498701
##  [408,]  3.983004
##  [409,]  3.567022
##  [410,]  2.359694
##  [411,]  4.479628
##  [412,]  0.882014
##  [413,]  2.146158
##  [414,]  1.671549
##  [415,]  4.900249
##  [416,]  2.004934
##  [417,]  3.126883
##  [418,]  1.747477
##  [419,]  2.291933
##  [420,]  3.073194
##  [421,]  2.311905
##  [422,]  3.796304
##  [423,]  7.354337
##  [424,]  3.350866
##  [425,] -0.199571
##  [426,]  4.636191
##  [427,]  4.679741
##  [428,]  1.360880
##  [429,]  4.439998
##  [430,]  7.132651
##  [431,]  2.618962
##  [432,]  1.839575
##  [433,]  2.652347
##  [434,]  6.219996
##  [435,]  0.985964
##  [436,]  7.086206
##  [437,]  4.407741
##  [438,]  3.356580
##  [439,]  1.482025
##  [440,]  4.373683
##  [441,]  1.851379
##  [442,]  6.382423
##  [443,]  6.758418
##  [444,] -0.419069
##  [445,]  2.560654
##  [446,] -0.043148
##  [447,]  3.997028
##  [448,]  2.606783
##  [449,]  0.316863
##  [450,]  0.743185
##  [451,]  5.139502
##  [452,]  2.538871
##  [453,]  4.310626
##  [454,]  0.230782
##  [455,]  1.776641
##  [456,]  2.740629
##  [457,]  6.337520
##  [458,]  6.724385
##  [459,]  5.237077
##  [460,]  0.639147
##  [461,]  3.343362
##  [462,]  6.476369
##  [463,]  4.146109
##  [464,]  0.125404
##  [465,]  3.834659
##  [466,]  5.653531
##  [467,]  3.862595
##  [468,]  3.530173
##  [469,]  0.076909
##  [470,]  2.049979
##  [471,]  5.435497
##  [472,]  2.889218
##  [473,]  5.042029
##  [474,]  5.823048
##  [475,]  4.340412
##  [476,]  3.272695
##  [477,]  2.959372
##  [478,]  4.439513
##  [479,]  4.490572
##  [480,]  0.726853
##  [481,]  5.564836
##  [482,]  4.381595
##  [483,]  3.171158
##  [484,]  5.931501
##  [485,]  4.664269
##  [486,]  3.297116
##  [487,]  4.921163
##  [488,]  2.750473
##  [489,]  0.140919
##  [490,]  6.348002
##  [491,]  1.508140
##  [492,]  3.283418
##  [493,]  3.342967
##  [494,]  2.389624
##  [495,]  3.315345
##  [496,]  5.947855
##  [497,]  2.462756
##  [498,]  5.633412
##  [499,]  2.038349
##  [500,]  4.928749
##  [501,]  1.601658
##  [502,]  0.501151
##  [503,]  2.627220
##  [504,]  3.180808
##  [505,]  1.873565
##  [506,]  3.251331
##  [507,]  2.712117
##  [508,]  5.444280
##  [509,]  4.225898
##  [510,]  1.998092
##  [511,]  6.073399
##  [512,]  3.459146
##  [513,]  4.729564
##  [514,]  6.338561
##  [515,]  4.908061
##  [516,]  1.092917
##  [517,]  3.978689
##  [518,]  3.286949
##  [519,]  1.509396
##  [520,]  4.597442
##  [521,]  2.605614
##  [522,]  5.416608
##  [523,]  3.553441
##  [524,]  2.453111
##  [525,]  5.370242
##  [526,]  5.189007
##  [527,]  2.849774
##  [528,]  2.368569
##  [529,]  5.644129
##  [530,]  7.049836
##  [531,]  2.798905
##  [532,]  6.324338
##  [533,]  3.597805
##  [534,]  2.728147
##  [535,]  2.663041
##  [536,]  2.324887
##  [537,]  1.601458
##  [538,]  2.035226
##  [539,]  4.118683
##  [540,]  5.550241
##  [541,]  1.936086
##  [542,]  1.639546
##  [543,]  1.732654
##  [544,]  2.264944
##  [545,]  1.545475
##  [546,]  2.830783
##  [547,]  4.133949
##  [548,]  5.668576
##  [549,]  3.843024
##  [550,]  4.832428
##  [551,]  3.021209
##  [552,]  5.362405
##  [553,]  5.546584
##  [554,]  2.554828
##  [555,]  2.580939
##  [556,]  2.262258
##  [557,]  2.694356
##  [558,]  7.397342
##  [559,]  3.777670
##  [560,]  3.484772
##  [561,]  3.259285
##  [562,]  7.082145
##  [563,]  4.460802
##  [564,]  5.132691
##  [565,]  3.302537
##  [566,]  6.793009
##  [567,]  5.386398
##  [568,]  5.875220
##  [569,]  5.719780
##  [570,]  5.514429
##  [571,]  4.916942
##  [572,]  3.917312
##  [573,]  1.539505
##  [574,]  2.703127
##  [575,]  5.031819
##  [576,]  5.768782
##  [577,]  3.701972
##  [578,]  2.471542
##  [579,]  3.837840
##  [580,]  2.630053
##  [581,]  1.750281
##  [582,]  4.257344
##  [583,]  3.173888
##  [584,]  1.568373
##  [585,]  3.207488
##  [586,]  3.384978
##  [587,]  2.851902
##  [588,]  3.466260
##  [589,]  5.895897
##  [590,]  1.584173
##  [591,]  4.017474
##  [592,]  2.997472
##  [593,]  0.934447
##  [594,]  3.562257
##  [595,]  4.104882
##  [596,]  0.902712
##  [597,]  2.846934
##  [598,]  4.975230
##  [599,]  3.155879
##  [600,]  2.650816
##  [601,]  1.776641
##  [602,]  1.413716
##  [603,]  6.654265
##  [604,]  4.374955
##  [605,]  4.621375
##  [606,]  2.470446
##  [607,]  4.701374
##  [608,]  3.309149
##  [609,]  0.453958
##  [610,]  2.311613
##  [611,]  0.391521
##  [612,]  7.077694
##  [613,]  4.021263
##  [614,]  1.736604
##  [615,]  6.244435
##  [616,]  4.523058
##  [617,]  5.066992
##  [618,]  5.089772
##  [619,]  5.872978
##  [620,]  3.868483
##  [621,]  3.463796
##  [622,]  1.928688
##  [623,]  6.191398
##  [624,]  6.868660
##  [625,]  1.924203
##  [626,]  2.860633
##  [627,]  2.397262
##  [628,]  6.843958
##  [629,]  2.885720
##  [630,] -0.467192
##  [631,]  6.103145
##  [632,]  3.646600
##  [633,]  2.973412
##  [634,]  4.171044
##  [635,]  3.689081
##  [636,]  6.202474
##  [637,]  3.343857
##  [638,]  0.951780
##  [639,]  1.868261
##  [640,]  2.854737
##  [641,]  4.150430
##  [642,]  6.386377
##  [643,]  2.245779
##  [644,]  5.821155
##  [645,]  1.307082
##  [646,]  3.048039
##  [647,]  4.983056
##  [648,]  0.562387
##  [649,]  0.467634
##  [650,]  3.755743
##  [651,]  4.718980
##  [652,]  4.429651
##  [653,]  6.465477
##  [654,]  4.436738
##  [655,]  3.697769
##  [656,]  0.975830
##  [657,]  2.063826
##  [658,]  3.898906
##  [659,]  2.638147
##  [660,]  1.192934
##  [661,]  2.496494
##  [662,]  2.372281
##  [663,]  4.550138
##  [664,]  7.007968
##  [665,]  3.293497
##  [666,]  3.262338
##  [667,]  3.036809
##  [668,]  1.559407
##  [669,]  4.072909
##  [670,]  1.742422
##  [671,]  5.726479
##  [672,]  3.182693
##  [673,]  3.512600
##  [674,]  3.936987
##  [675,]  5.176399
##  [676,]  2.973412
##  [677,]  5.141202
##  [678,]  4.131511
##  [679,]  5.865122
##  [680,]  4.109489
##  [681,]  0.754403
##  [682,]  0.602901
##  [683,]  4.147019
##  [684,]  0.859321
##  [685,]  2.623094
##  [686,]  2.039498
##  [687,]  2.506649
##  [688,]  6.075265
##  [689,]  2.715356
##  [690,]  3.330481
##  [691,]  6.057953
##  [692,]  4.763267
##  [693,]  5.349091
##  [694,]  5.492840
##  [695,]  5.279345
##  [696,]  5.074216
##  [697,]  2.197490
##  [698,]  3.767412
##  [699,]  6.033393
##  [700,]  7.363892
##  [701,]  5.332880
##  [702,]  2.019054
##  [703,]  3.294503
##  [704,]  6.451033
##  [705,]  6.730500
##  [706,]  5.434293
##  [707,]  3.023316
##  [708,]  1.499332
##  [709,]  2.442319
##  [710,]  1.663399
##  [711,]  5.335247
##  [712,]  4.193696
##  [713,]  6.346132
##  [714,]  2.438017
##  [715,]  6.708012
##  [716,]  3.093369
##  [717,]  5.422915
##  [718,]  0.636821
##  [719,]  2.592719
##  [720,]  2.146629
##  [721,]  3.098983
##  [722,]  6.806343
##  [723,]  2.542869
##  [724,]  3.840433
##  [725,]  1.958644
##  [726,]  3.584183
##  [727,]  2.964023
##  [728,]  6.340850
##  [729,]  4.786891
##  [730,]  4.634686
##  [731,]  1.888175
##  [732,]  2.978602
##  [733,] -0.015079
##  [734,]  5.581995
##  [735,]  1.150098
##  [736,]  6.820603
##  [737,]  5.765086
##  [738,]  5.856217
##  [739,]  6.484338
##  [740,]  6.916703
##  [741,]  4.788331
##  [742,]  1.808696
##  [743,]  2.684044
##  [744,]  1.629693
##  [745,]  3.806551
##  [746,]  0.721163
##  [747,]  6.148754
##  [748,]  1.123119
##  [749,]  2.234780
##  [750,]  5.766095
##  [751,]  1.888175
##  [752,]  2.596112
##  [753,]  3.047600
##  [754,]  4.642139
##  [755,]  3.817100
##  [756,]  6.664760
##  [757,]  4.070269
##  [758,]  5.816229
##  [759,]  3.200426
##  [760,]  3.524977
##  [761,]  6.640335
##  [762,]  6.439141
##  [763,]  5.479310
##  [764,]  1.143326
##  [765,]  3.529061
##  [766,]  6.607966
##  [767,]  3.585821
##  [768,]  1.759227
##  [769,]  4.746076
##  [770,]  1.490908
##  [771,]  4.743541
##  [772,]  5.919007
##  [773,]  5.293128
##  [774,]  1.117270
##  [775,]  2.528712
##  [776,]  2.697116
##  [777,]  5.189678
##  [778,]  1.958984
##  [779,]  2.460142
##  [780,]  6.712702
##  [781,]  3.049797
##  [782,]  4.723702
##  [783,]  0.454329
##  [784,]  4.547319
##  [785,]  1.075553
##  [786,]  5.535896
##  [787,]  5.797224
##  [788,]  1.180651
##  [789,]  3.125709
##  [790,]  4.930011
##  [791,]  0.957614
##  [792,]  3.977889
##  [793,]  7.359611
##  [794,]  6.130835
##  [795,]  1.956262
##  [796,]  1.166056
##  [797,]  1.321356
##  [798,]  3.734176
##  [799,]  1.948760
##  [800,]  5.054532
##  [801,]  2.617669
##  [802,]  3.705470
##  [803,]  5.270219
##  [804,]  5.096033
##  [805,]  6.269111
##  [806,]  4.251182
##  [807,]  3.178084
##  [808,]  3.326705
##  [809,] -0.117235
##  [810,]  6.013510
##  [811,]  1.829871
##  [812,]  4.870784
##  [813,]  4.359292
##  [814,]  1.988881
##  [815,]  4.786390
##  [816,]  5.009138
##  [817,]  4.310842
##  [818,]  3.952509
##  [819,]  4.759230
##  [820,]  3.654345
##  [821,]  3.430608
##  [822,]  1.992402
##  [823,] -0.612098
##  [824,]  3.378051
##  [825,]  4.978908
##  [826,]  1.866312
##  [827,]  6.134294
##  [828,]  2.426740
##  [829,]  6.136525
##  [830,]  6.523242
##  [831,]  1.802323
##  [832,]  3.780400
##  [833,]  1.983001
##  [834,]  1.923340
##  [835,]  4.063971
##  [836,]  1.116251
##  [837,]  3.243764
##  [838,]  3.926108
##  [839,]  5.718225
##  [840,]  3.059880
##  [841,]  2.837683
##  [842,]  1.308237
##  [843,]  1.698878
##  [844,]  0.421339
##  [845,]  0.064530
##  [846,]  4.034490
##  [847,]  1.587400
##  [848,]  0.114353
##  [849,]  6.164510
##  [850,]  5.888924
##  [851,]  1.604259
##  [852,]  3.287050
##  [853,]  4.680645
##  [854,]  5.565545
##  [855,]  5.313842
##  [856,]  4.385756
##  [857,]  2.989401
##  [858,]  2.274172
##  [859,]  4.503114
##  [860,]  5.026674
##  [861,]  1.834728
##  [862,]  0.252862
##  [863,]  2.093359
##  [864,]  4.583453
##  [865,]  3.680633
##  [866,]  2.091916
##  [867,]  6.451073
##  [868,]  2.451730
##  [869,]  1.580740
##  [870,]  3.848533
##  [871,]  3.042540
##  [872,]  1.218478
##  [873,]  3.456770
##  [874,]  5.598075
##  [875,]  1.955241
##  [876,]  5.535998
##  [877,]  1.115486
##  [878,]  0.762770
##  [879,]  6.434505
##  [880,]  2.016403
##  [881,]  4.410400
##  [882,]  1.746168
##  [883,]  4.323938
##  [884,]  3.381858
##  [885,]  2.963683
##  [886,]  4.317900
##  [887,]  1.863831
##  [888,]  6.493255
##  [889,]  2.028309
##  [890,]  6.629469
##  [891,]  4.965482
##  [892,]  5.223692
##  [893,]  5.219090
##  [894,]  2.666849
##  [895,]  4.198028
##  [896,]  6.722028
##  [897,]  5.006197
##  [898,]  4.052352
##  [899,]  5.910270
##  [900,]  4.291173
##  [901,]  4.876648
##  [902,]  3.151967
##  [903,]  2.625287
##  [904,]  1.732466
##  [905,]  2.324159
##  [906,]  4.277800
##  [907,]  6.918375
##  [908,]  4.942194
##  [909,]  2.876135
##  [910,]  5.369390
##  [911,]  1.855834
##  [912,]  3.552337
##  [913,]  6.534223
##  [914,]  4.920078
##  [915,]  4.168785
##  [916,]  3.443814
##  [917,]  0.856097
##  [918,]  4.721405
##  [919,]  3.385660
##  [920,]  1.695816
##  [921,]  4.339769
##  [922,]  2.039826
##  [923,]  0.250331
##  [924,]  5.829761
##  [925,]  3.428305
##  [926,]  1.184836
##  [927,]  1.871091
##  [928,]  4.577402
##  [929,]  6.725715
##  [930,]  1.070860
##  [931,]  5.911750
##  [932,]  2.963909
##  [933,]  6.531998
##  [934,]  5.141202
##  [935,]  4.722809
##  [936,]  3.838510
##  [937,]  5.686650
##  [938,]  5.134622
##  [939,]  3.994404
##  [940,]  4.490846
##  [941,]  3.912251
##  [942,]  7.104438
##  [943,]  5.187608
##  [944,]  3.811535
##  [945,]  1.532277
##  [946,]  6.169893
##  [947,]  2.984232
##  [948,]  1.151600
##  [949,]  3.100385
##  [950,]  3.429457
##  [951,]  2.368712
##  [952,]  1.429215
##  [953,]  3.789935
##  [954,]  1.796479
##  [955,]  4.826861
##  [956,]  4.162678
##  [957,]  5.174209
##  [958,]  3.993210
##  [959,]  2.863458
##  [960,]  7.067900
##  [961,]  1.935055
##  [962,]  0.824435
##  [963,] -0.245390
##  [964,]  4.105343
##  [965,]  1.449986
##  [966,]  1.652483
##  [967,]  4.175557
##  [968,]  3.717943
##  [969,]  0.984872
##  [970,]  3.028301
##  [971,]  6.919102
##  [972,]  3.848617
##  [973,]  5.957928
##  [974,]  3.693560
##  [975,]  3.026198
##  [976,]  2.066261
##  [977,]  4.167580
##  [978,]  2.882217
##  [979,]  0.249908
##  [980,]  1.473743
##  [981,]  3.677018
##  [982,]  3.625760
##  [983,]  7.030422
##  [984,]  6.350494
##  [985,]  6.244818
##  [986,]  4.314229
##  [987,]  0.412985
##  [988,]  5.400688
##  [989,]  6.835076
##  [990,]  5.927633
##  [991,]  4.045940
##  [992,]  6.617017
##  [993,]  2.315705
##  [994,]  3.055281
##  [995,]  1.323191
##  [996,]  0.781221
##  [997,]  7.359940
##  [998,]  0.498986
##  [999,]  1.431823
## [1000,]  5.998057

6 Referencias

Base Supermercado. Recuperado 27 de mayo de 2022, de https://www.kaggle.com/datasets/aungpyaeap/supermarket-sales?resource=download

Kottak, Conrad (2006), Introducción a la antropología cultural. Espejo para la humanidad, Madrid, McGraw Hill, 2006. Recuperado en 02 de junio de 2022, de https://scholar.google.com/scholar_lookup?title=+Introducci%C3%B3n+a+la+antropolog%C3%ADa+cultural.+Espejo+para+la+humanidad&author=Kottak+Conrad&publication_year=2006

Torres Gastelú, Carlos Arturo. (2012). La participación de las grandes cadenas de supermercados en las redes de comercialización de los pequeños productores. Nueva antropología, 25(77), 109-132. Recuperado en 02 de junio de 2022, de http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0185-06362012000200006&lng=es&tlng=es.

Vinatea, Eduardo (2008), Lecciones de antropología social y cultural, Madrid, Universidad Rey Juan Carlos / Dykinson. Recuperado en 02 de junio de 2022, de https://scholar.google.com/scholar_lookup?title=+Lecciones+de+antropolog%C3%ADa+social+y+cultural&author=Vinatea+Eduardo&publication_year=2008

Análisis de Ventas Supermercado

Francisco Alberto Villa Acevedo, José Alejandro Carreto Bruno, Marcela Canales Becerra

Junio 2022