library(readxl)
ruta <- "D:\\ZEGUEL IPAE\\CICLO 4\\ESTADÍSTICA APLICADA A LA COMPUTACIÓN [GESTIÓN DE SISTEMAS DE INFOR\\PLAZA VIA (2).xlsx"


Datos_sustitutorio <- read_excel(ruta)


Datos_sustitutorio

Distribucion de frecuencias

tabla_frecuencia1 <- table(Datos_sustitutorio$Local, Datos_sustitutorio$Género)


tabla_frecuencia1
##                
##                 femenino masculino
##   Centro civico       10         3
##   San Borja           26        10
##   Surco               18         6

Observando la tabla, podemos ver que en el distrito de San Borja es donde más clientes se registraron, con 26 clientes de género femenino y 10 de género masculino. Esto sugiere que el distrito de San Borja tiene una mayor cantidad de clientes en comparación con los otros distritos.

En el distrito de Centro Cívico, hay menos clientes registrados en comparación con San Borja y Surco. Esto indica que el distrito de Centro Cívico puede tener una menor afluencia de clientes en el supermercado.

No parece haber una clara asociación entre el género y el distrito de residencia de los clientes, ya que la proporción de género femenino y masculino varía en cada distrito sin seguir un patrón claro.

Distribucion de frecuencias agrupadas por intervalos

intervalos <- cut(Datos_sustitutorio$`Monto Pagado`, breaks = 5)  

tabla_de_frecuencia <- table(intervalos)

tabla_de_frecuencia
## intervalos
## (54.5,152]  (152,249]  (249,346]  (346,443]  (443,540] 
##         38         16          4          7          8

La tabla de frecuencia agrupada por intervalos para la variable Monto Pagado muestra lo siguiente:

Esto significa que la mayoría de los montos pagados se encuentran en el intervalo de (54.5,152] mientras que hay menos observaciones en los intervalos de mayor valor.

Graficos estadisticos

library(ggplot2)


ggplot(Datos_sustitutorio, aes(x = Opinión, fill = Género)) +
  geom_bar(position = "stack") +
  labs(title = "Distribución de opiniones por género",
       x = "Opinión", y = "Cantidad de clientes") +
  theme_minimal()

ggplot(Datos_sustitutorio, aes(x = Opinión, y = Género)) +
  geom_point() +
  labs(title = "Relación entre género y opinión",
       x = "Opinión", y = "Género") +
  theme_minimal()

Distribucion de opiniones por genero:

En la categoría Bueno, los hombres tienen una frecuencia que va desde 0 hasta 4, mientras que las mujeres tienen una frecuencia de 4 a 19.

Para la categoría Malo, solo las mujeres tienen una frecuencia que va desde 0 hasta 2.

En la categoría Muy Bueno, los hombres tienen una frecuencia que va desde 0 hasta 6, y las mujeres tienen una frecuencia de 6 a 17.

Finalmente, en la categoría Regular, los hombres tienen una frecuencia que va desde 0 hasta 9, y las mujeres tienen una frecuencia de 9 a 35.

Relacion entre genero y opinion:

Medidas estadisticas

mean_monto <- mean(Datos_sustitutorio$`Monto Pagado`)
median_monto <- median(Datos_sustitutorio$`Monto Pagado`)
sd_monto <- sd(Datos_sustitutorio$`Monto Pagado`)

mean_visita <- mean(Datos_sustitutorio$`Visita Mensual`)
median_visita <- median(Datos_sustitutorio$`Visita Mensual`)
sd_visita <- sd(Datos_sustitutorio$`Visita Mensual`)

correlation <- cor(Datos_sustitutorio$`Monto Pagado`, Datos_sustitutorio$`Visita Mensual`)

# Imprimir los resultados
cat("Medidas estadísticas para la variable 'Monto Pagado':\n")
## Medidas estadísticas para la variable 'Monto Pagado':
cat("Media:", mean_monto, "\n")
## Media: 206.0959
cat("Mediana:", median_monto, "\n")
## Mediana: 144
cat("Desviación estándar:", sd_monto, "\n\n")
## Desviación estándar: 145.7341
cat("Medidas estadísticas para la variable 'Visita Mensual':\n")
## Medidas estadísticas para la variable 'Visita Mensual':
cat("Media:", mean_visita, "\n")
## Media: 8.520548
cat("Mediana:", median_visita, "\n")
## Mediana: 9
cat("Desviación estándar:", sd_visita, "\n\n")
## Desviación estándar: 4.598036
cat("Correlación entre 'Monto Pagado' y 'Visita Mensual':", correlation, "\n")
## Correlación entre 'Monto Pagado' y 'Visita Mensual': 0.2026127

Para la variable Monto Pagado:

La media es aproximadamente 206.10 soles, lo que significa que el gasto promedio de los clientes en el supermercado es alrededor de 206.10 soles. La mediana es 144 soles, lo que indica que el valor central de los montos pagados por los clientes es de 144 soles. La desviación estándar es aproximadamente 145.73 soles, lo que sugiere que hay una variabilidad considerable en los montos pagados por los clientes.

Para la variable Visita Mensual:

La media es aproximadamente 8.52 visitas mensuales, lo que indica que, en promedio, los clientes visitan el supermercado alrededor de 8.52 veces al mes. La mediana es 9 visitas mensuales, lo que significa que la mitad de los clientes realizan 9 visitas o menos al mes. La desviación estándar es aproximadamente 4.60 visitas, lo que sugiere que hay una variabilidad moderada en el número de visitas mensuales de los clientes. La correlación entre Monto Pagado y Visita Mensual es aproximadamente 0.20.