I. CASO 1:

La tienda del rubro electrodomésticos “ElectroMedia SAC” registra ciertas variables de sus clientes cuando realizan una compra. El objetivo es agrupar a sus clientes con características similares de compra, para luego enviar correos electrónicos promocionales a personas que probablemente puedan realizar una compra de sus productos. Algunos registros se muestran a continuación:

VARIABLES

  • Edad: Edad del cliente - Variable cuantitativa continua

  • Casa Propia: Si-No cuenta con cosa - variable cualitativa nominal

  • Numeros de hijos: Numero de hijos del cliente - variable cuantitativa discreta

  • Estado civil: Estado Civil del cliente - variable cualitativa nominal

  • Marca de TV adquirido: Marca de TV - variable cualitativa nominal

II. Caso 2:

“Plaza Vía” Es un supermercado local que continuamente realiza análisis de sus clientes, los análisis que se hacen son, por ejemplo: seguimiento de compras, satisfacción del cliente, quejas y reclamos, entre otros. Para este caso utilice el conjunto de datos enviado “Caso Plaza Via.xlsx”, y plantee cada uno de los puntos dados:

library(readxl)
plaza <- read_excel("PLAZAVIA.xlsx")
head(plaza)
## # A tibble: 6 × 8
##   Local     Género   Pago     Opinión  `Producto Marca` Productos `Monto Pagado`
##   <chr>     <chr>    <chr>    <chr>               <dbl>     <dbl>          <dbl>
## 1 Surco     femenino TCrédito Regular                 3        17            419
## 2 Surco     femenino Contado  Muy Bue…                3        13            323
## 3 San Borja femenino TCrédito Malo                    1        11             84
## 4 San Borja femenino TCrédito Regular                 0        11             65
## 5 San Borja femenino TCrédito Buena                   3        15            371
## 6 San Borja femenino TDébito  Buena                   3        17            419
## # ℹ 1 more variable: `Visita Mensual` <dbl>

1. Fundamentos del estudio

Objetivo

Evaluar la satisfacción de los residentes y visitantes de Plaza Vía con sus servicios y instalaciones

Poblacion

La población general serían los clientes de Plaza Vía.

Muestra

La muestra serían 73 de los clientes de Plaza Vía, seleccionados para realizar el analisis.

Unidad de Analisis

La unidad de análisis es el Cliente de Plaza via.

2. Variables y tipo de variables

  • Local: Descripción del lugar - Cualitativa nominal

  • Género: Genero del cliente - Variable completa

  • Pago: Metodo de pago utilizado - Cualitativa nominal

  • Opinión: Niveles de satisfaccion - Cualitativa ordinal

  • Producto Marca: Marca de los productos - Cualitativa nominal

  • Productos: Productos comprados - cuantitativa discreta

  • Monto Pagado: Monto que consumio - Cuantitativa continua

  • Visita Mensual: Número de visitas mensuales - Cuantitativa discreta

3. Tabla de distribución de frecuencia para dos variables cualitativas

* Variable Género

library(summarytools)
freq(plaza$Género, report.nas = FALSE)
## Frequencies  
## plaza$Género  
## Type: Character  
## 
##                   Freq        %   % Cum.
## --------------- ------ -------- --------
##        femenino     54    73.97    73.97
##       masculino     19    26.03   100.00
##           Total     73   100.00   100.00
  • El 73.97% de los clientes son de genero femenino
  • El 26.03% de los clientes son de genero Masculino

* Variable Pago

library(summarytools)
freq(plaza$Pago, report.nas = FALSE)
## Frequencies  
## plaza$Pago  
## Type: Character  
## 
##                  Freq        %   % Cum.
## -------------- ------ -------- --------
##        Contado     16    21.92    21.92
##       TCrédito     24    32.88    54.79
##        TDébito     33    45.21   100.00
##          Total     73   100.00   100.00
  • El 21.92% de los clientes paga al Contado
  • El 32.88% de los Clientes paga con tarjeta de credito
  • El 45.21% de los Clientes paga con tarjeta de debito

4. Tabla de distribución de frecuencia agrupada por intervalos

Variable Productos

library(agricolae)
listax = hist(plaza$Productos,plot = FALSE)
tablaf = table.freq(listax)
tablaf
##   Lower Upper Main Frequency Percentage CF   CPF
## 1     8    10    9        11       15.1 11  15.1
## 2    10    12   11        10       13.7 21  28.8
## 3    12    14   13         8       11.0 29  39.7
## 4    14    16   15         6        8.2 35  47.9
## 5    16    18   17        15       20.5 50  68.5
## 6    18    20   19        10       13.7 60  82.2
## 7    20    22   21        13       17.8 73 100.0

5. Gráficos estadísticos para dos variables e interpretar

* Variable Genero

barplot(prop.table(table(plaza$Género))*100,
        main="Distribución de los clientes según su Sexo", 
        col=3,xlab="Sexo",ylab="% de clientes")

Interpretacion : Mas del 70% de los clientes son de genero Femenino

* Variable Productos

hist(plaza$Productos, breaks = "Sturges",
     xlab="Productos",
         ylab="Número de clientes",col="green")

6. Medidas estadísticas

Variable Visita Mensual

1. Media Aritmetica

mean(plaza$'Visita Mensual')
## [1] 8.520548

Interpretacion: El promedio de visitas mensuales es de 8.520548 veces.

2. Mediana

median(plaza$'Visita Mensual')
## [1] 9

El valor de la mediana es 9. Interpretacion: El 50% de los clientes visita la tienda un maximo de 9 veces al mes. El otro 50% visita un minimo de 9 veces.

3. Moda

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:agricolae':
## 
##     skewness
mfv(plaza$'Visita Mensual')
## [1]  2 14 15

Interpretación: La cantidad de visitas más frecuentes (que más se repiten) son 2, 14 y 15 respectivamente.

4. Rango

range(plaza$'Visita Mensual')
## [1]  2 15

5. Varianza

var(plaza$'Visita Mensual')
## [1] 21.14193

6. Desviasion Estandar

sd(plaza$'Visita Mensual')
## [1] 4.598036

Interpretación: La varibilidad promedio de los datos respecto a la media es de 4.598036.

7. Coeficiente de variacion

coeficiente_var=sd(plaza$'Visita Mensual')/mean(plaza$'Visita Mensual')*100
coeficiente_var
## [1] 53.96409

Interpretación: como el CV es 53.96409 > 30%, entonces la distribución de las edades no es homogénea y la media no es representativa.

Variable Monto Pagado

1. Media Aritmetica

mean(plaza$'Monto Pagado')
## [1] 206.0959

Interpretacion: El monto Pagado promedio de los clientes es: $ 206.0959

2. Mediana

median(plaza$'Monto Pagado')
## [1] 144

El valor de la mediana es: 144 Interpretacion: El 50% de los clientes de la tienda su monto Pagado maximo es de $144. El otro 50% su valor minimo es de $144.

3. Moda

library(modeest)
mfv(plaza$'Monto Pagado')
## [1] 158

Interpretacion: El monto mas frecuente es de $158.

4. Rango

range(plaza$'Monto Pagado')
## [1]  55 540

5. Varianza

var(plaza$'Monto Pagado')
## [1] 21238.42

6. Desviasion Estandar

sd(plaza$'Monto Pagado')
## [1] 145.7341

Interpretación: La varibilidad promedio de los datos respecto a la media es de 145.7341.

7. Coeficiente de variacion

coeficiente_var=sd(plaza$'Monto Pagado')/mean(plaza$'Monto Pagado')*100
coeficiente_var
## [1] 70.71178

Interpretación: como el CV es 70.71178 > 30%, entonces la distribución de los montos no es homogénea y la media no es representativa.