library(readxl)

Cargar el conjunto de datos

#Cargar
plaza <- read_xlsx("PLAZA.xlsx")
head(plaza)

3. Tabla de frecuencia para las variables

# Crear la tabla de frecuencia para las variables Género y Opinión
tabla_frecuencia <- table(plaza$Género, plaza$Opinión)
tabla_frecuencia
##            
##             Buena Malo Muy Bueno Regular
##   femenino     15    2        11      26
##   masculino     4    0         6       9

Realizar mínimo 3 interpretaciones para cada tabla.

1. Preferencias de opinión por género:

Observamos que tanto hombres como mujeres tienen preferencias similares en cuanto a la opinión sobre la experiencia de compra en Plaza Vía. La categoría “Regular” es la más frecuente tanto para hombres como para mujeres, lo que sugiere que una proporción considerable de ambos géneros considera su experiencia de compra como regular. Sin embargo, el género femenino tiene una mayor proporción de respuestas “Buena” y “Muy Bueno” en comparación con el género masculino, lo que podría indicar una mayor satisfacción entre las mujeres en este supermercado.

2. Satisfacción del cliente por género:

A partir de la tabla, podemos inferir que las mujeres tienden a tener una opinión más positiva sobre su experiencia de compra en Plaza Vía en comparación con los hombres. Mientras que las mujeres muestran una distribución más equilibrada entre las respuestas “Buena”, “Muy Bueno” y “Regular”, los hombres tienden a inclinarse más hacia respuestas “Regular” y tienen menos respuestas en las categorías “Buena” y “Muy Bueno”.

3. Oportunidades de mejora para ambos géneros:

Aunque la mayoría de los clientes, tanto hombres como mujeres, califican su experiencia como “Regular”, hay una cantidad significativa que también considera su experiencia como “Buena” o “Muy Bueno”. Esto sugiere que Plaza Vía tiene áreas donde puede mejorar para proporcionar una experiencia más satisfactoria para todos los clientes, independientemente de su género. Las áreas de mejora podrían identificarse mediante un análisis más detallado de las áreas de insatisfacción mencionadas por los clientes.

4. Realizar una tabla de distribución de frecuencia agrupada por intervalos para una variable cuantitativa continua o cuantitativa discreta.

# Crear los intervalos
intervalos <- cut(plaza$`Monto Pagado`, breaks = c(0, 100, 200, 300, 400, 500, Inf),
                  labels = c("0 - 100", "101 - 200", "201 - 300", "301 - 400", "401 - 500", "Más de 500"))

# Crear la tabla de distribución de frecuencia
tabla_frecuencia <- table(intervalos)

# Mostrar la tabla de distribución de frecuencia
print(tabla_frecuencia)
## intervalos
##    0 - 100  101 - 200  201 - 300  301 - 400  401 - 500 Más de 500 
##         20         25         10          6          7          5

Realizar mínimo 3 interpretaciones para cada tabla.

1. Distribución de montos de compra:

La tabla muestra cómo se distribuyen los montos de compra de los clientes de Plaza Vía en diferentes rangos. Observamos que la mayoría de las compras se encuentran en el rango de 101 a 200, seguido por el rango de 0 a 100. Esto podría indicar que la mayoría de los clientes realizan compras dentro de estos intervalos de precios.

2. Patrones de gasto:

Podemos observar que solo un pequeño número de compras (5) supera los 500. Esto sugiere que la mayoría de los clientes de Plaza Vía realizan compras de menor cuantía. Esto podría influir en las estrategias de marketing y promociones de la tienda, centrándose en productos y ofertas dentro de los rangos de precios más comunes.

3. Identificación de segmentos de clientes:

La distribución por intervalos nos permite identificar segmentos de clientes según sus hábitos de compra. Por ejemplo, los clientes que realizan compras en el rango de 101 a 200 pueden tener diferentes preferencias y comportamientos de compra en comparación con aquellos que gastan más de 500. Esta información podría ser útil para personalizar las estrategias de marketing y fidelización de clientes.

5. Realizar gráficos estadísticos para dos variables e interpretar. (Elija UD)

1. Gráfico de Barras - Género y Opinión:

library(ggplot2)

ggplot(plaza, aes(x = Opinión, fill = Género)) +
  geom_bar(position = "dodge") +
  labs(title = "Opinión de Clientes por Género", x = "Opinión", y = "Frecuencia")

Interpretación:

Este gráfico de barras muestra la distribución de opiniones de los clientes de Plaza Vía según su género. Podemos observar si hay diferencias en las opiniones entre hombres y mujeres. Por ejemplo, podemos ver si las mujeres tienden a calificar los productos de manera diferente en comparación con los hombres.

2. Gráfico de Pastel - Distribución de Género:

ggplot(plaza, aes(x = "", fill = Género)) +
  geom_bar(width = 1) +
  coord_polar("y", start = 0) +
  labs(title = "Distribución de Género")

Interpretación:

Este gráfico de pastel muestra la distribución de género entre los clientes de Plaza Vía. Nos da una idea visual de la proporción de hombres y mujeres que frecuentan la tienda. Podemos ver si hay una clara predominancia de un género sobre el otro.

3. Gráfico de Densidad - Monto Pagado por Género:

ggplot(plaza, aes(x = `Monto Pagado`, fill = Género)) +
  geom_density(alpha = 0.5) +
  labs(title = "Densidad del Monto Pagado por Género", x = "Monto Pagado")

Interpretación:

Este gráfico de densidad nos muestra cómo se distribuyen los montos pagados en función del género. Podemos ver si hay diferencias en los patrones de gasto entre hombres y mujeres. Por ejemplo, podemos observar si un género tiende a gastar más que el otro en general, o si hay superposición en las distribuciones de gasto.

6. Realizar medidas estadísticas (Estudiadas) para dos variables cuantitativas e interpretar.

# Para calcular la media de la variable Monto Pagado
media_monto_pagado <- mean(plaza$`Monto Pagado`)
print(paste("La media del Monto Pagado es:", media_monto_pagado))
## [1] "La media del Monto Pagado es: 206.095890410959"
# Para calcular la mediana del Monto Pagado
mediana_monto_pagado <- median(plaza$`Monto Pagado`)
print(paste("La mediana del Monto Pagado es:", mediana_monto_pagado))
## [1] "La mediana del Monto Pagado es: 144"
# Para calcular la desviación estándar del Monto Pagado
desviacion_monto_pagado <- sd(plaza$`Monto Pagado`)
print(paste("La desviación estándar del Monto Pagado es:", desviacion_monto_pagado))
## [1] "La desviación estándar del Monto Pagado es: 145.734077116084"

Interpretación:

Media del Monto Pagado (206.095890410959):

La media del Monto Pagado es el valor promedio que los clientes gastan en Plaza Vía en una compra. En promedio, los clientes gastan alrededor de 206.095890410959 unidades monetarias por compra en Plaza Vía. Esta medida puede ayudar a tener una idea general del gasto típico de los clientes en el supermercado.

Mediana del Monto Pagado (144):

La mediana del Monto Pagado es el valor que se encuentra en el centro de todos los montos pagados, ordenados de menor a mayor. En este caso, la mediana es 144, lo que significa que el 50% de las compras tienen un monto pagado igual o menor a 144, y el otro 50% tienen un monto pagado igual o mayor a 144. La mediana es útil para entender el gasto típico sin verse afectado por valores extremadamente altos o bajos.

Desviación Estándar del Monto Pagado (145.734077116084):

La desviación estándar del Monto Pagado indica la dispersión o variabilidad de los montos pagados con respecto a la media. En este caso, la desviación estándar es de aproximadamente 145.73, lo que sugiere que los montos pagados tienden a variar alrededor de 145.734077116084 unidades monetarias respecto a la media. Una desviación estándar alta indica que los montos pagados están más dispersos alrededor de la media, mientras que una desviación estándar baja indica que los montos pagados están más concentrados alrededor de la media.