## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

I. Introducción

La Mercatería, fundada en 2010, surgió con el propósito de fungir como un laboratorio integral para el estudio de mercadeo, logística y consumo masivo en el ámbito universitario. Esto con el fin de proporcionar a los estudiantes, la oportunidad de realizar actividades prácticas como el análisis de ventas.

A partir del 2017, la Mercatería evolucionó de ser un laboratorio académico a un establecimiento de comercio dentro de la Pontificia Universidad Javeriana Cali. Este cambio se originó al reconocer la necesidad de gestionar ventas reales, abandonando los supuestos y proporcionando así una experiencia de aprendizaje más completa. La iniciativa generó nuevas oportunidades laborales, como empleos para cajeros, personal encargado del suministro de mercancías, entre otros.

Adicionalmente, la propuesta de valor de la Mercatería, como un modelo de negocio se enfoca en satisfacer eficientemente las necesidades de los clientes ofreciendo una experiencia de compra óptima en el menor tiempo posible y a precios más bajos en comparación con otros establecimientos de comercio en la universidad como las cafeterías. Esta distinción permite a los consumidores elegir entre ahorrar más al dirigirse a la Mercatería o gastar su excedente en las cafeterías. Los consumidores de la Mercatería están mayoritariamente conformados por estudiantes, quienes tienen edades que oscilan entre los 18 y 22 años, representando el 70% del mercado de la Mercatería. Seguidos de los colaboradores de la universidad, que constituyen un 20%. Además, un 7% corresponde a personas involucradas en posgrados o seminarios, mientras que el 3% restante engloba a visitantes o contratistas.

Actualmente la Mercatería opera en dos puntos físicos, uno en el edificio Guayacanes (siendo el punto principal) y otro en el edificio Almendros. Sin embargo, con el objetivo de satisfacer las necesidades de una mayor población estudiantil, se ha implementado un nuevo enfoque mediante la introducción de máquinas expendedoras en varios edificios de la universidad, incluyendo Almendros, Saman, Cedros, Lago y Central.

Estas máquinas ofrecen una amplia variedad de productos de marcas reconocidas como Colombina, Manitoba, Margarita, Cristal, Coca Cola, Tosh, Nestlé, entre otras. Por lo tanto, resulta importante estudiar su comportamiento para comprender cómo funcionan y así identificar áreas de mejora que permitan optimizar el rendimiento.

Con este trabajo se busca analizar datos relacionados con las transacciones realizadas en dichas máquinas. La base de datos utilizada proporciona información desde febrero de 2022 hasta julio de 2023 sobre los productos ofrecidos, la cantidad vendida por familia y subfamilia, sus precios, utilidades, etc. Esto permite determinar la viabilidad de ofrecer ciertos productos en las máquinas y evaluar la estrategia de ubicación, con el fin de realizar ajustes según las necesidades específicas de los usuarios.

II. Problema de estudio

Con la implementación de las máquinas expendedoras, es fundamental evaluar tanto la efectividad y accesibilidad de su ubicación, así como la idoneidad de los productos ofrecidos para satisfacer las necesidades y preferencias de los usuarios. Esto implica identificar las familias de productos más vendidos y priorizar su exhibición, al tiempo que se retiran aquellos con escasa rotación. Esto permitirá mejorar la experiencia del usuario y maximizar el rendimiento de las máquinas. En esta ocasión, nos centraremos en analizar el comportamiento de las máquinas expendedoras de la Mercatería desde febrero de 2022 hasta julio de 2023.

III. Objetivos

General

Analizar el comportamiento de las máquinas expendedoras de la Mercatería en la Pontificia Universidad Javeriana Cali durante el periodo comprendido entre febrero de 2022 y julio de 2023, con el fin de identificar áreas de mejora que permitan optimizar su rendimiento y satisfacer eficientemente las necesidades y preferencias de los usuarios.

Específico

• Evaluar la efectividad y accesibilidad de la ubicación de las máquinas expendedoras, con el propósito de determinar si están ubicadas estratégicamente para alcanzar a la mayor cantidad de usuarios posibles.

• Analizar la idoneidad de los productos ofrecidos en las máquinas expendedoras, identificando las familias de productos más vendidos y priorizando su exhibición, mientras se evalúa la eliminación de aquellos con escasa rotación.

IV. Metodología

Para este trabajo, se utilizaron herramientas estadísticas y análisis gráfico en R Markdown, centrado especialmente en la relación entre las variables cuantitativas y cualitativas. Para ello, se llevó a cabo un análisis de diversos indicadores estadísticos, tales como la media, la mediana, la desviación estándar, entre otros.

Adicionalmente, se elaboraron gráficos estadísticos, como el histograma, el diagrama de barras y el gráfico de dispersión, lo cual permite visualizar de manera clara la distribución y la relación entre las variables de interés.

Por último, se construyó un diagrama de caja (boxplot) para una de las variables relevantes en el estudio con el de proporcionar información sobre la dispersión de los datos.

Identificación de dataset - Tratamiento de datos

La base de datos original está compuesta por 17 variables y 5023 observaciones en total. Sin embargo, para efectos del trabajo se realizaron varias filtraciones y cambios, tales como:

• Se eligieron 4 variables cualitativas y 6 variables cuantitativas.

• Se renombraron algunas variables para más facilidad.

• Se utilizó la función “replace_all” para cambiar el nombre de las observaciones en las variables: Categoria, Familia y Ubicación.

A continuación, se listan y definen las variables de interés tenidas en cuenta.

Variables cualitativas:

• Ubicacion: edificio donde se encuentra instalada la máquina expendedora de la Mercatería (“ALMENDROS”, “CEDROS UNO”,“CEDROS DOS,”CENTRAL UNO”,“CENTRAL DOS”,“CENTRAL TRES”,“LAGO UNO”,“LAGO DOS”,“SAMAN”).

• Categoria: indica el tipo de producto ofrecido por la Mercatería (“ALIMENTOS”,“BEBIDAS”).

• Familia: familia a la que pertenece el tipo de producto ofrecido por la Mercatería (“AGUA”,“AGUA CON GAS”,“BEBIDA AROMATICA”,“BEBIDA SABORIZADA”,“CONFITERIA”,“CONSERVAS”,“DESAYUNO”,“FIESTA”, “GALLETERIA”, “GASEOSAS”,“LACTEOS”,“PASABOCAS”,“PONQUES”,“REPOSTERIA).

• Subfamilia: subfamilia a la que pertenece el tipo de producto ofrecido por la Mercatería.

Variables cuantitativas:

• Unidades: cantidad de unidades vendidas en las máquinas expendedoras de la Mercatería.

• Precio: precio de cada producto puesto a la venta en las máquinas expendedoras en pesos colombianos.

• Costo_promedio_unitario: cálculo de la media del costo de los productos puestos a la venta en pesos colombianos.

• Margen_promedio: representa la ganancia promedio que se obtiene por cada unidad vendida.

• Ventas: es la cantidad total de ingresos generados por la venta de productos en las máquinas expendedoras durante un tiempo determinado en pesos colombianos.

• Utilidad: es la ganancia que se obtiene de la venta total de los productos en las máquinas expendedoras. Se calcula como el producto de las ventas totales con el margen promedio en pesos colombianos.

V. Resultados y análisis

##Variables cualitativas

library(table1)
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
table1(~., data = Mercateria)
Overall
(N=5023)
Ubicación
ALMENDROS 527 (10.5%)
CEDROS DOS 517 (10.3%)
CEDROS UNO 536 (10.7%)
CENTRAL DOS 528 (10.5%)
CENTRAL TRES 601 (12.0%)
CENTRAL UNO 579 (11.5%)
LAGO DOS 573 (11.4%)
LAGO UNO 566 (11.3%)
SAMAN 596 (11.9%)
Categoria
ALIMENTOS 3127 (62.3%)
BEBIDAS 1896 (37.7%)
Familia
AGUA 337 (6.7%)
AGUA CON GAS 3 (0.1%)
BEBIDA AROMATICA 7 (0.1%)
BEBIDA SABORIZADA 548 (10.9%)
CONFITERIA 1341 (26.7%)
CONSERVAS 19 (0.4%)
DESAYUNO 166 (3.3%)
FIESTA 376 (7.5%)
GALLETERIA 1076 (21.4%)
GASEOSAS 554 (11.0%)
LACTEOS 471 (9.4%)
PASABOCAS 90 (1.8%)
PONQUES 22 (0.4%)
REPOSTERIA 13 (0.3%)
Subfamilia
3010 - AGUA 134 (2.7%)
3012 - AGUA CON GAS 3 (0.1%)
3014 - AGUA SABORIZADA 203 (4.0%)
3027 - AVENA 102 (2.0%)
3028 - AVENA DESLACTOSADA 21 (0.4%)
3029 - AVENA LIGHT 51 (1.0%)
3064 - CEREALES 4 (0.1%)
3068 - CHOCOLATES 173 (3.4%)
3089 - CREMA DE CHOCOLATE 13 (0.3%)
3120 - ENERGIZANTE 178 (3.5%)
3134 - GALLETAS DULCES 824 (16.4%)
3135 - GALLETAS SALADAS 252 (5.0%)
3136 - GASEOSA 513 (10.2%)
3145 - GOLOSINAS 92 (1.8%)
3167 - JUGOS 276 (5.5%)
3178 - LECHE 41 (0.8%)
3180 - LECHE DESLACTOSADA 22 (0.4%)
3183 - LECHE SABORIZADA 206 (4.1%)
3194 - MALTA 41 (0.8%)
3236 - POLVO AZUCARADO 3 (0.1%)
3253 - SALCHICHAS 19 (0.4%)
3267 - SNACKS 1392 (27.7%)
3281 - TE 94 (1.9%)
3282 - TÈ 7 (0.1%)
3292 - TORTAS 22 (0.4%)
3311 - YOGURT 4 (0.1%)
3313 - YOGURT CON CEREAL 162 (3.2%)
3317 - YOGURT NIÑOS 24 (0.5%)
Missing 147 (2.9%)
Unidades
Mean (SD) 30.5 (34.6)
Median [Min, Max] 20.0 [1.00, 379]
Precio
Mean (SD) 2210 (929)
Median [Min, Max] 2100 [200, 5500]
Costo_promedio_unitario
Mean (SD) 1570 (723)
Median [Min, Max] 1520 [114, 3870]
Margen_promedio
Mean (SD) 31.5 (15.2)
Median [Min, Max] 32.0 [-762, 95.2]
Ventas
Mean (SD) 60300 (68200)
Median [Min, Max] 40800 [200, 777000]
Utilidad
Mean (SD) 19300 (26500)
Median [Min, Max] 11900 [-20000, 472000]

Ubicación

La Mercatería distribuye sus productos mediante nueve máquinas expendedoras, siendo tres de ellas en la plazoleta central, dos en Cedro, dos Lagos, una en Almendros y una en Saman.

En el gráfico se observa el rendimiento de las máquinas expendedoras, destacando que la máquina ubicada en Central tres, fue la más utilizada, alcanzando un 12% del total de ventas, con 601 transacciones. Esto se debe probablemente a su ubicación en la zona más transitada de la universidad, lo que la hace más visible y accesible. Por otro lado, la máquina situada en el edificio Cedro Rosado dos, fue la menos utilizada, con un 10,3% de participación en las ventas, totalizando 517 transacciones. Esto podría explicarse por la menor afluencia de personas en ese edificio, ya que es el más alejado de la universidad.

Categoría

Los productos de las máquinas expendedoras de la Mercatería se dividen en dos categorías: Alimentos y Bebidas. En el siguiente gráfico podemos observar que la mayoría de productos que se venden pertenecen a la categoría de alimentos, con un total de 3127 productos, el cual representa el 62.3%. Mientras que los productos de la categoría de bebidas se venden en menos cantidad, con un total de 1896, que representa el 37.7%.

Adicionalmente, en el diagrama de cajas correspondiente a la variable categoría, se observa que los datos están muy agrupados, indicando que los valores son muy similares entre sí. Aunque algunos productos se encuentran fuera del rango principal, no se consideran atípicos debido al gran tamaño de la base de datos. Por lo tanto, ambas cajas muestran que la mayoría de los datos están concentrados en un rango estrecho de valores.

Familia

Dentro de las 14 familias de productos de Mercatería, se observa que la mayoría de los productos vendidos en las máquinas expendedoras pertenecen a confitería, con un total de 1,341 productos (26.7%), incluyendo chocolates, golosinas y snacks. En contraste, los productos de agua con gas y bebida aromática son los menos vendidos, con solo 3 unidades (0.1%) y 7 unidades (0.1%) respectivamente.

Por otro lado, en cuanto al costo promedio de las familias de productos, se observa que las categorías con mayores costos son confitería, galletería y lácteos.

En relación con los ingresos y la utilidad por familia de productos, se evidencia que aunque confitería es aquella con más unidades vendidas, no es la que genera la mayor utilidad. De hecho, la familia que genera la mayor utilidad es el agua, a pesar de tener menos unidades vendidas. Además, se puede evidenciar que las familias de gaseosas, bebidas saborizadas y galletería también generan una alta utilidad. En contraste, las categorías de lácteos y pasabocas tienen una utilidad muy baja.

datos_combinados <- merge(datos_agrupados3, datos_agrupados, by = "Familia")
ggplot(datos_combinados, aes(x = Familia, y = Ventas)) + coord_flip()+  geom_bar(stat = "identity",col= "#104E8B",fill = "#97FFFF", width = 0.8) +
  geom_bar(stat = "identity", aes(y = Utilidad), position = position_dodge(), col= "#FF7F00", fill = "#FFAA99", width = 0.4) +
  labs(title = "Ingreso y utilidad por familia",
       x = "Familia",
       y = "Valor")

##Variables cuantitativas

Unidades vendidas

El promedio de ventas diarias es de 31 productos, contando con días con una sola venta y otros con 379 ventas. Su desviación estándar es de 34,6 y la mediana de 20.

Precios

El precio promedio de los productos puestos a la venta en las máquinas expendedoras es de 2210 pesos, además de encontrar que el producto más barato cuesta 200 pesos y el más caro 5500 pesos.

En este histograma, que muestra la frecuencia de los precios de los productos de las máquinas expendedoras, se observa que el precio más común es de 2000 pesos. Además, el histograma tiende a ser simétrico, reflejando un comportamiento equilibrado en la distribución de los precios.

Costos promedio unitarios

La media de los costos promedio unitarios de los productos de las máquinas expendedoras es de 1570 pesos, siendo el mínimo de 114 pesos y el máximo de 3870. Su desviación estándar es de 723 y la mediana de 1520.

En este histograma podemos ver la frecuencia con la que los productos toman ciertos costos unitarios, por ejemplo podemos ver que el costo unitario más recurrente está entre los 500 pesos y los 2000 pesos, estando presente en unos 1200 productos. Además podemos observar que este histograma cuenta con una asimetría positiva o sesgo hacia la derecha.

Margen

En cuanto al margen que aportan los productos de las máquinas expendedoras, el promedio aportado es de 31,5 pesos, además de tener un mínimo en negativo, -762 pesos, que representaría más costos que beneficios, y un máximo de de 95,2 pesos.

Ventas

El promedio de ventas totales que realizan las máquinas vending es de 60300 pesos, contando con un mínimo de 200 pesos y un máximo de 777000 pesos. Su mediana es de 40800.

Utilidad

La utilidad promedio que generan las máquinas vending es de 19300 pesos, con un mínimo que representa pérdidas de 20000 pesos, y con un máximo de utilidad de 472000 pesos

##Correlación

Gráfico de dispersión (diagrama de puntos) sobre el precio unitario y unidades vendidas

cor(Unidades,Precio)
## [1] -0.2169533
## `geom_smooth()` using formula = 'y ~ x'

En este gráfico que representa la demanda de productos, se evidencia una relación inversa o negativa entre el precio y la cantidad de unidades vendidas. Esto demuestra que a medida que el precio aumenta, la cantidad de unidades demandadas disminuye. Este comportamiento es consistente con la ley de la demanda, que establece que, en general, los consumidores tienden a comprar menos de un producto cuando su precio se incrementa. Esta relación negativa es claramente visible en la distribución de los datos, subrayando cómo los precios más altos desalientan la compra de productos en las máquinas expendedoras.

Gráfico de dispersión (diagrama de puntos) sobre la utilidad y unidades vendidas

cor(Unidades,Utilidad) 
## [1] 0.7551049
## `geom_smooth()` using formula = 'y ~ x'

En este gráfico, observamos la relación entre la cantidad de productos vendidos y la utilidad generada, destacando una relación positiva. A medida que se venden más productos, la utilidad generada también aumenta. Esto se debe a que, con un mayor volumen de ventas, los costos fijos se distribuyen entre más unidades, lo que reduce el costo por unidad y aumenta la rentabilidad.

Adicionalmente, el gráfico muestra un punto máximo de utilidad cerca de las 250 unidades vendidas, indicando que este es el nivel de ventas más rentable. A partir de este punto, cualquier aumento adicional en la cantidad vendida sigue contribuyendo positivamente a la utilidad. También se observa que hay puntos de pérdida entre las primeras 100 unidades vendidas. Esto sugiere que al principio, las ventas no son suficientes para cubrir los costos. Sin embargo, una vez que se supera este umbral, cada unidad adicional vendida contribuye de manera significativa a la utilidad total.

VII. Conclusiones

Podemos concluir que, en cuanto a la ubicación de las máquinas expendedoras, la venta por sectores está extendida entre los 500 y 600 productos vendidos, una variación que puede tener un gran impacto cuando se habla de elementos que tienen un costo añadido, y que si no se llegase a cierta expectativa de ventas por cada máquina estos costos pueden superar las ganancias y generar que la máquina comience a no ser rentable.

También en el gráfico de ingresos por familia podemos observar que la familia de productos que más vende es la Confitería, sin embargo, sus costos también son demasiado altos, generando así que su utilidad neta resulte siendo mucho menor. Por el contrario, la familia de productos de Agua es apenas la quinta familia con más ingresos, no obstante, sus costos son bastante menores que aquellos de la Confitería, generando así que en términos de utilidad neta esta sea la familia más rentable, con el puesto número 1 en el gráfico de utilidad por familias.

VII. Referencia

La base de datos fue proporcionada por la Mercateria con fines netamente académicos.

VIII. Anexos

https://docs.google.com/spreadsheets/d/18qDNR7KHoUzo20rfGzwmZTbemcVa0JWJ/edit?usp=sharing&ouid=114248374195984617084&rtpof=true&sd=true


Segunda entrega

Descripción

En este trabajo realizaremos pruebas de hipótesis y calcularemos intervalos de confianza para la base de datos de las máquinas expendedoras de la Mercatería, correspondiente de febrero de 2022 a julio de 2023. La base de datos original está compuesta por 17 variables y 5023 observaciones en total. Para efectos del trabajo se utilizan las variables cuantitativas “Unidades” y “Utilidad”. Además, se toma la variable cualitativa “Categorías”, la cual se conforma por las opciones “ALIMENTOS” y “BEBIDAS”.

Promedio y desviación estándar de la variable cuantitativa “Unidades”

## 
##  One Sample t-test
## 
## data:  Unidades
## t = 62.422, df = 5022, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  29.51618 31.43027
## sample estimates:
## mean of x 
##  30.47322
## [1] 34.59876

La media de la variable de unidades es 30.47322 y su desviación estándar es 34.59876. Con una confiabilidad del 95%, el promedio de unidades se encuentra en el intervalo (29.51618,31.43027).

Promedio y desviación estándar de la variable cuantitativa “Utilidad”

## 
##  One Sample t-test
## 
## data:  Utilidad
## t = 51.619, df = 5022, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  18570.54 20036.82
## sample estimates:
## mean of x 
##  19303.68
## [1] 26504.23

La media de la variable de utilidad es 19303.68 y su desviación estándar es 26504.23. Con una confiabilidad del 95%, el promedio de la utilidad se encuentra en el intervalo (18570.54, 20036.82).

Promedio de unidades por categorías

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ readr     2.1.5
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

Las unidades promedio de alimentos es de 27.68884, mientras que las unidades promedio de bebidas es de 35.06540.

La desviación de las unidades de la categoría Alimentos es de 32, aproximadamente. Y la desviación de las unidades de la categoría Bebidas es de 39, aproximadamente.

Promedio de utilidad por categorías

El promedio de la utilidad de los alimentos es de 13268.18,mientras que el promedio de las bebidas es de 29257.80.

La desviación de la utilidad de la categoría Alimentos es de 15377.46 Y la desviación de la utilidad de la categoría Bebidas es de 36226.05

Prueba de hipótesis

Prueba de hipótesis de la media para las “Unidades”

Queremos verificar si el promedio de unidades es menor a 35, utilizando un nivel de confianza del 95%.

𝐻0:𝜇 ≥ 35

𝐻1:𝜇 < 35

## 
##  One Sample t-test
## 
## data:  Unidades
## t = -9.2728, df = 5022, p-value < 2.2e-16
## alternative hypothesis: true mean is less than 35
## 95 percent confidence interval:
##      -Inf 31.27635
## sample estimates:
## mean of x 
##  30.47322

Si p- value < α rechazo 𝐻

2.2e-16 < 0.05

Como el valor p es mucho menor que el nivel de significancia de 0.05, se rechaza la hipótesis nula. Esto indica que hay suficiente evidencia para afirmar que el promedio de unidades es menor a 35. El intervalo de confianza es (−Inf,31.27635).Esto quiere decir que, con un 95% de confianza, el verdadero promedio de unidades está por debajo de 31.27635.

Prueba de hipótesis de la media para las “Utilidad”

Se estima que el promedio de la utilidad es mayor a 20.000, utilizando un nivel de confianza del 99%.

𝐻0:𝜇 ≤ 20000

𝐻1:𝜇 > 20000

## 
##  One Sample t-test
## 
## data:  Utilidad
## t = -1.862, df = 5022, p-value = 0.9687
## alternative hypothesis: true mean is greater than 20000
## 99 percent confidence interval:
##  18433.42      Inf
## sample estimates:
## mean of x 
##  19303.68

Si p- value < α rechazo 𝐻0

0.9687 < 0.01

Como el valor p (0.9687) es mucho mayor que el nivel de significancia de 0.01, no se rechaza la hipótesis nula. Esto significa que no hay suficiente evidencia para concluir que el promedio de la utilidad es mayor a 20.000. El intervalo de confianza es (18433.42, Inf).Esto significa que, con un 99% de confianza, el verdadero promedio de utilidad está por encima de 18433.42.

Prueba de hipótesis de la proporción de “ALIMENTOS”

Se estima que la proporcion de alimentos es mayor o igual del 70%, con una confiabilidad del 99%.

𝐻0: p ≥ 0.7

𝐻1: p < 0.7

## 
##  1-sample proportions test with continuity correction
## 
## data:  3127 out of 5023, null probability 0.7
## X-squared = 143.16, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is less than 0.7
## 99 percent confidence interval:
##  0.0000000 0.6384066
## sample estimates:
##         p 
## 0.6225363

Si p- value < α rechazo 𝐻0

2.2e-16 < 0.01

Como el valor p es mucho más pequeño que 0.01,se rechaza la hipótesis nula. Por lo tanto, se puede afirmar que la proporción de alimentos en la muestra es menor al 70%. El intervalo de confianza es (0, 0.6384066).Esto significa que, con un 99% de confianza, la proporción de alimentos está por debajo de 0.6384066.

Prueba de hipótesis de la proporción de “BEBIDAS”

En el análisis se considera que la proporcion de bebidas es menor o igual al 30%.

𝐻0: p ≤ 0.30

𝐻1: p > 0.30

## 
##  1-sample proportions test with continuity correction
## 
## data:  1896 out of 5023, null probability 0.3
## X-squared = 143.16, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is greater than 0.3
## 95 percent confidence interval:
##  0.3661832 1.0000000
## sample estimates:
##         p 
## 0.3774637

Si p- value < α rechazo 𝐻0

2.2e-16 < 0.05

Como el valor p es mucho menor que 0.05, se rechaza la hipótesis nula. Esto significa que la proporción de bebidas en la muestra es mayor al 30%. El intervalo de confianza es (0.3661832, 1).Esto significa que, con un 95% de confianza, la proporción de alimentos está por encima de 0.3661832, y debajo de 1.

Diferencia de medias entre las unidades de los alimentos y las bebidas

Se considera que el promedio de las unidades de los alimentos es superior al de las bebidas por al menos 8

𝐻0:μA − μB ≤ 8

𝐻1:μA − μB > 8

## 
##  Welch Two Sample t-test
## 
## data:  UniA and UniB
## t = -14.619, df = 3403.7, p-value = 1
## alternative hypothesis: true difference in means is greater than 8
## 95 percent confidence interval:
##  -9.107088       Inf
## sample estimates:
## mean of x mean of y 
##  27.68884  35.06540

Si p- value < α rechazo 𝐻0

1 < 0.05

Dado que el valor p es 1, no se puede rechazar la hipótesis nula. Esto significa que no hay evidencia para afirmar que el promedio de las unidades de alimentos es superior al de las bebidas por más de 8 unidades. El intervalo de confianza del 95% es (-9.107088, Inf), lo que impone que,la diferencia entre los promedios de las unidades de alimentos y bebidas podría ser cualquier valor mayor o igual a -9.107088.

Diferencia de medias de la utilidad de los alimentos y las bebidas

Se considera que el promedio de utilidad entre alimentos y bebidas es igual.

𝐻0: μA - μB = 0

𝐻1: μA - μB ≠ 0

## 
##  Welch Two Sample t-test
## 
## data:  UtilA and UtilB
## t = -18.248, df = 2314.9, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
##  -18248.49 -13730.74
## sample estimates:
## mean of x mean of y 
##  13268.18  29257.80

Si p- value < α rechazo 𝐻0

2.2e-16 < 0.01

Dado que el valor p es 2.2e-16, y este valor es mucho menor que 0.01, se rechaza la hipótesis nula. Por lo tanto, el promedio de la utilidad entre los alimentos y las bebidas es significativamente diferente. El intervalo de confianza del 99% indica que la diferencia entre los promedios de utilidad de los alimentos y bebidas se encuentra entre -18,248.49 y -13,730.74. Como este intervalo es negativo, podemos concluir que la utilidad promedio de los alimentos es menor que la de las bebidas.

Diferencia de proporciones

Se estima que la proporción de alimentos es diferente a la de bebidas. Con una confiabilidad del 90%.

𝐻0: PA - PB = 0

𝐻1: PA - PB ≠ 0

## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(3127, 1896) out of c(5023, 5023)
## X-squared = 602.39, df = 1, p-value < 2.2e-16
## alternative hypothesis: two.sided
## 90 percent confidence interval:
##  0.2289632 0.2611821
## sample estimates:
##    prop 1    prop 2 
## 0.6225363 0.3774637

Si p- value < α rechazo 𝐻0

2.2e-16 < 0.1

Dado que el valor p es mucho menor que 0.1, se rechaza la hipótesis nula. Por lo tanto, se concluye que existe evidencia para afirmar que la proporción de alimentos es diferente a la proporción de bebidas. El intervalo de confianza del 90% indica que la diferencia entre las proporciones de alimentos y bebidas se encuentra entre 0.2289 y 0.2612. Teniendo en cuenta que este intervalo es positivo, podemos concluir que la proporción de alimentos es mayor que la de bebidas.