library(readxl)
ruta <- "D:\\ZEGUEL IPAE\\CICLO 4\\ESTADÍSTICA APLICADA A LA COMPUTACIÓN [GESTIÓN DE SISTEMAS DE INFOR\\PLAZA VIA (2).xlsx"
Datos_sustitutorio <- read_excel(ruta)
Datos_sustitutorio
tabla_frecuencia1 <- table(Datos_sustitutorio$Local, Datos_sustitutorio$Género)
tabla_frecuencia1
##
## femenino masculino
## Centro civico 10 3
## San Borja 26 10
## Surco 18 6
Observando la tabla, podemos ver que en el distrito de San Borja es donde más clientes se registraron, con 26 clientes de género femenino y 10 de género masculino. Esto sugiere que el distrito de San Borja tiene una mayor cantidad de clientes en comparación con los otros distritos.
En el distrito de Centro Cívico, hay menos clientes registrados en comparación con San Borja y Surco. Esto indica que el distrito de Centro Cívico puede tener una menor afluencia de clientes en el supermercado.
No parece haber una clara asociación entre el género y el distrito de residencia de los clientes, ya que la proporción de género femenino y masculino varía en cada distrito sin seguir un patrón claro.
intervalos <- cut(Datos_sustitutorio$`Monto Pagado`, breaks = 5)
tabla_de_frecuencia <- table(intervalos)
tabla_de_frecuencia
## intervalos
## (54.5,152] (152,249] (249,346] (346,443] (443,540]
## 38 16 4 7 8
La tabla de frecuencia agrupada por intervalos para la variable Monto Pagado muestra lo siguiente:
En el intervalo de (54.5,152) hay 38 observaciones
En el intervalo de (152,249) hay 16 observaciones
En el intervalo de (249,346) hay 4 observaciones
En el intervalo de (346,443) hay 7 observaciones
En el intervalo de (443,540) hay 8 observaciones
Esto significa que la mayoría de los montos pagados se encuentran en el intervalo de (54.5,152] mientras que hay menos observaciones en los intervalos de mayor valor.
library(ggplot2)
ggplot(Datos_sustitutorio, aes(x = Opinión, fill = Género)) +
geom_bar(position = "stack") +
labs(title = "Distribución de opiniones por género",
x = "Opinión", y = "Cantidad de clientes") +
theme_minimal()
ggplot(Datos_sustitutorio, aes(x = Opinión, y = Género)) +
geom_point() +
labs(title = "Relación entre género y opinión",
x = "Opinión", y = "Género") +
theme_minimal()
Distribucion de opiniones por genero:
En la categoría Bueno, los hombres tienen una frecuencia que va desde 0 hasta 4, mientras que las mujeres tienen una frecuencia de 4 a 19.
Para la categoría Malo, solo las mujeres tienen una frecuencia que va desde 0 hasta 2.
En la categoría Muy Bueno, los hombres tienen una frecuencia que va desde 0 hasta 6, y las mujeres tienen una frecuencia de 6 a 17.
Finalmente, en la categoría Regular, los hombres tienen una frecuencia que va desde 0 hasta 9, y las mujeres tienen una frecuencia de 9 a 35.
Relacion entre genero y opinion:
Para la categoría Buena, hay puntos tanto para el género masculino como para el femenino, indicando que ambos géneros tienen opiniones positivas sobre el servicio.
Para la categoría Mala, la mayoría de los puntos se encuentran en el género femenino, sugiriendo que las opiniones negativas son más comunes entre las clientes mujeres.
Para la categoría Muy Bueno, nuevamente vemos puntos tanto para hombres como para mujeres, pero parece haber una mayor concentración de opiniones positivas en el género femenino.
En cuanto a la categoría Regular, hay una mayor cantidad de puntos en el género femenino, lo que sugiere que las opiniones neutras o promedio son más comunes entre las mujeres.
mean_monto <- mean(Datos_sustitutorio$`Monto Pagado`)
median_monto <- median(Datos_sustitutorio$`Monto Pagado`)
sd_monto <- sd(Datos_sustitutorio$`Monto Pagado`)
mean_visita <- mean(Datos_sustitutorio$`Visita Mensual`)
median_visita <- median(Datos_sustitutorio$`Visita Mensual`)
sd_visita <- sd(Datos_sustitutorio$`Visita Mensual`)
correlation <- cor(Datos_sustitutorio$`Monto Pagado`, Datos_sustitutorio$`Visita Mensual`)
# Imprimir los resultados
cat("Medidas estadísticas para la variable 'Monto Pagado':\n")
## Medidas estadísticas para la variable 'Monto Pagado':
cat("Media:", mean_monto, "\n")
## Media: 206.0959
cat("Mediana:", median_monto, "\n")
## Mediana: 144
cat("Desviación estándar:", sd_monto, "\n\n")
## Desviación estándar: 145.7341
cat("Medidas estadísticas para la variable 'Visita Mensual':\n")
## Medidas estadísticas para la variable 'Visita Mensual':
cat("Media:", mean_visita, "\n")
## Media: 8.520548
cat("Mediana:", median_visita, "\n")
## Mediana: 9
cat("Desviación estándar:", sd_visita, "\n\n")
## Desviación estándar: 4.598036
cat("Correlación entre 'Monto Pagado' y 'Visita Mensual':", correlation, "\n")
## Correlación entre 'Monto Pagado' y 'Visita Mensual': 0.2026127
Para la variable Monto Pagado:
La media es aproximadamente 206.10 soles, lo que significa que el gasto promedio de los clientes en el supermercado es alrededor de 206.10 soles. La mediana es 144 soles, lo que indica que el valor central de los montos pagados por los clientes es de 144 soles. La desviación estándar es aproximadamente 145.73 soles, lo que sugiere que hay una variabilidad considerable en los montos pagados por los clientes.
Para la variable Visita Mensual:
La media es aproximadamente 8.52 visitas mensuales, lo que indica que, en promedio, los clientes visitan el supermercado alrededor de 8.52 veces al mes. La mediana es 9 visitas mensuales, lo que significa que la mitad de los clientes realizan 9 visitas o menos al mes. La desviación estándar es aproximadamente 4.60 visitas, lo que sugiere que hay una variabilidad moderada en el número de visitas mensuales de los clientes. La correlación entre Monto Pagado y Visita Mensual es aproximadamente 0.20.