EVALUACIÓN DE RECUPERACIÓN

##Nombres y Apellidos: Katherine J. Soto Tenazoa

INSTRUCCIONES: • Lee los casos que se presentan a continuación y responde a cada pregunta. • Cada respuesta debe estar detallada (paso a paso) según desarrollado en clase. • La evaluación es individual. • Todo las tablas y/u operaciones que requieren cálculos deben ser realizadas en R – Rstudio. • Realizar lo que pide el ejercicio (Por ejemplo, si plantea dos variables debe elegir solo dos de manera aleatoria) • La evaluación se presenta en horario de clase el día 23/02/2024 • El envío es mediante EVA (no se va a calificar otro medio) • Cada resultado deber ser original, se procede a evaluar antiplagio de superar un valor de 25% la nota será 0 • Los resultados deben cargarse en formato html y publicado en rpus • Entregables: Enlace RPUBS y archivo .html

library(readxl)
## Warning: package 'readxl' was built under R version 4.3.2

###Cargar el conjunto de datos

#Cargar
plazavia <- read_xlsx("PLAZAVIA.xlsx")
head(plazavia)
## # A tibble: 6 × 8
##   Local     Género   Pago     Opinión  `Producto Marca` Productos `Monto Pagado`
##   <chr>     <chr>    <chr>    <chr>               <dbl>     <dbl>          <dbl>
## 1 Surco     femenino TCrédito Regular                 3        17            419
## 2 Surco     femenino Contado  Muy Bue…                3        13            323
## 3 San Borja femenino TCrédito Malo                    1        11             84
## 4 San Borja femenino TCrédito Regular                 0        11             65
## 5 San Borja femenino TCrédito Buena                   3        15            371
## 6 San Borja femenino TDébito  Buena                   3        17            419
## # ℹ 1 more variable: `Visita Mensual` <dbl>

##1. CASO 1: La tienda del rubro electrodomésticos “ElectroMedia SAC” registra ciertas variables de sus clientes cuando realizan una compra. El objetivo es agrupar a sus clientes con características similares de compra, para luego enviar correos electrónicos promocionales a personas que probablemente puedan realizar una compra de sus productos. Algunos registros se muestran a continuación: (3 puntos)

1

Con esta información completar el siguiente cuadro

2

##2.Caso II: “Plaza Vía” Es un supermercado local que continuamente realiza análisis de sus clientes, los análisis que se hacen son, por ejemplo: seguimiento de compras, satisfacción del cliente, quejas y reclamos, entre otros. Para este caso utilice el conjunto de datos enviado “Caso Plaza Via.xlsx”, y plantee cada uno de los puntos dados: 1. Fundamentos del estudio. (2 puntos)

  • Objetivo: Realizar un análisis de los clientes de “Plaza Vía” con el fin de comprender y mejorar aspectos clave como el comportamiento de compra, satisfacción del cliente y gestionar de manera eficiente las quejas y reclamos, entre otros.

  • Población: La población comprende a todos los individuos que llevan a cabo compras en “Plaza Vía”.

  • Muestra: Clientes de Plaza Vía.

  • Unidad de análisis: Seguimiento de compras, satisfacción del cliente, quejas y reclamos, entre otros.

  1. Variables y tipo de variables: (3 puntos)

    3

##3. Realizar una tabla de distribución de frecuencia para dos variables cualitativas. Realizar mínimo 3 interpretaciones para cada tabla (3 puntos)

# Verificar el nombre de la columna
colnames(plazavia)
## [1] "Local"          "Género"         "Pago"           "Opinión"       
## [5] "Producto Marca" "Productos"      "Monto Pagado"   "Visita Mensual"
# Verificar la estructura de datos
str(plazavia)
## tibble [73 × 8] (S3: tbl_df/tbl/data.frame)
##  $ Local         : chr [1:73] "Surco" "Surco" "San Borja" "San Borja" ...
##  $ Género        : chr [1:73] "femenino" "femenino" "femenino" "femenino" ...
##  $ Pago          : chr [1:73] "TCrédito" "Contado" "TCrédito" "TCrédito" ...
##  $ Opinión       : chr [1:73] "Regular" "Muy Bueno" "Malo" "Regular" ...
##  $ Producto Marca: num [1:73] 3 3 1 0 3 3 1 2 3 1 ...
##  $ Productos     : num [1:73] 17 13 11 11 15 17 18 17 18 20 ...
##  $ Monto Pagado  : num [1:73] 419 323 84 65 371 419 131 204 444 144 ...
##  $ Visita Mensual: num [1:73] 10 13 3 9 6 14 13 11 14 3 ...
# Tabla de frecuencia para la variable "Genero"
tabla_frecuencia_genero <- table(plazavia$Género)
print(tabla_frecuencia_genero)
## 
##  femenino masculino 
##        54        19
# Tabla de frecuencia para la variable "Visita Mensual"
tabla_frecuencia_MontoPagado <- table(plazavia$`Visita Mensual`)
print(tabla_frecuencia_MontoPagado)
## 
##  2  3  4  5  6  7  8  9 10 11 12 13 14 15 
##  8  7  4  7  4  4  2  3  6  3  3  6  8  8
# Tabla de Frecuencia
tabla_frecuencia_cualitativa <- table(plazavia$Género, plazavia$`Visita Mensual`)

# Muestra la tabla de frecuencia
print(tabla_frecuencia_cualitativa)
##            
##             2 3 4 5 6 7 8 9 10 11 12 13 14 15
##   femenino  5 6 3 6 2 4 2 3  5  0  2  5  5  6
##   masculino 3 1 1 1 2 0 0 0  1  3  1  1  3  2

#Gráficos Estadisticos

# Cargar la biblioteca ggplot2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
# Gráfico de barras
plot(tabla_frecuencia_cualitativa)

ggplot(data=plazavia, aes(y=Género))+
  geom_bar()+
  theme_classic()

# Gráfico Circular
pie(tabla_frecuencia_cualitativa)

Interpretación: 1. Después de analizar la tabla de distribución de frecuencia, se observa que las visitas mensuales están relativamente equilibradas entre hombres y mujeres. Ambos géneros contribuyen de manera similar a la cantidad total de visitas. 2. Al calcular las sumas totales de visitas mensuales, se encuentra que, en promedio, las mujeres tienden a realizar ligeramente más visitas mensuales que los hombres. Esta diferencia podría ser un punto clave a considerar en estrategias de marketing y promociones específicas. 3. Esta Información nos ha permitiendo identificar tendencias estacionales para poder entender los hábitos de visita de los diferentes géneros y ajustar estrategias comerciales para maximizar la participación de ambos grupos.

##4. Realizar una tabla de distribución de frecuencia agrupada por intervalos para una variable cuantitativa continua o cuantitativa discreta (3 puntos) Realizar mínimo 3 interpretaciones para cada tabla

# Establecer los intervalos para agrupar
intervalos <- seq(0, max(plazavia$`Monto Pagado`), by = 100)

# Crear la tabla de distribución de frecuencia agrupada
tabla_frecuencia_intervalos <- cut(plazavia$`Monto Pagado`, breaks = intervalos, include.lowest = TRUE)

# Mostrar la tabla
table(tabla_frecuencia_intervalos)
## tabla_frecuencia_intervalos
##   [0,100] (100,200] (200,300] (300,400] (400,500] 
##        20        25        10         6         7

Interpretación: 1.La forma general de la distribución parece seguir una tendencia decreciente a medida que los montos pagados aumentan. Esto podría ser una indicación de que la mayoría de los clientes realiza compras más pequeñas, pero hay algunos clientes que realizan transacciones de mayor cuantía, contribuyendo a la distribución. 2.Identificar los intervalos donde la frecuencia es más alta. Estos rangos podrían indicar los niveles de precio más atractivos para la mayoría de los clientes. Considera ajustar estrategias de precios, promociones o descuentos dentro de estos rangos para maximizar la participación del cliente. 3.Utilizar la distribución para prever la demanda futura en diferentes segmentos de clientes. Esto podría ayudar en la planificación del inventario, la gestión de la cadena de suministro y la asignación de recursos para satisfacer las necesidades específicas de cada segmento.

##5. Realizar gráficos estadísticos para dos variables e interpretar (Elija UD) (3 puntos)

# Cargar librerías necesarias
library(ggplot2)

# Crear un gráfico de barras
grafico_opinion <- ggplot(plazavia, aes(x = Opinión, fill = Género)) +
  geom_bar(position = "dodge", stat = "count") +
  labs(title = "Distribución de Opiniones por Género",
       x = "Opinión",
       y = "Cantidad") +
  scale_fill_manual(values = c("#56B4E9", "#D55E00"))  # Colores para distinguir género

# Mostrar el gráfico
print(grafico_opinion)

Interpretación: - La mayoría de los clientes, ya sean hombres o mujeres, muestran una inclinación a emitir opiniones favorables, calificándolas como “Muy Bueno” o “Bueno”. Este patrón indica que, en general, la satisfacción con los servicios de Plaza Vía es elevada, sin importar el género de los clientes.

##6. Realizar medidas estadísticas (Estudiadas) para dos variables cuantitativas e interpretar. (3 puntos)

#Medidas estadísticas de tendencia

# Calcular la media por género
media_por_genero <- tapply(plazavia$`Monto Pagado`, plazavia$Género, mean)

# Mostrar los resultados
print(media_por_genero)
##  femenino masculino 
##  212.6852  187.3684

#Medidas estadísticas de posición

# Calcular cuantiles para el monto pagado
cuantiles_monto <- quantile(plazavia$`Monto Pagado`, probs = c(0.25, 0.5, 0.75))
print("Cuantiles para el Monto Pagado:")
## [1] "Cuantiles para el Monto Pagado:"
print(cuantiles_monto)
## 25% 50% 75% 
## 100 144 275
# Calcular el valor mínimo y máximo del monto pagado
min_monto <- min(plazavia$`Monto Pagado`)
max_monto <- max(plazavia$`Monto Pagado`)
print(paste("Valor mínimo del Monto Pagado:", min_monto))
## [1] "Valor mínimo del Monto Pagado: 55"
print(paste("Valor máximo del Monto Pagado:", max_monto))
## [1] "Valor máximo del Monto Pagado: 540"
# Calcular el rango del monto pagado
rango_monto <- range(plazavia$`Monto Pagado`)
print(paste("Rango del Monto Pagado:", rango_monto))
## [1] "Rango del Monto Pagado: 55"  "Rango del Monto Pagado: 540"

Interpretación: - Se observa una variabilidad significativa en los montos pagados por los clientes, como se evidencia en los cuantiles. El 25% de los clientes tiene un monto pagado igual o inferior a 100, mientras que el 75% tiene un monto igual o inferior a 275. La mediana (50%) se sitúa en 144, indicando que la mitad de los clientes realiza pagos por debajo de este valor.