CASO 1: Informe de ElectroMedia SAC

Variables y tipo de variables
Variables y tipo de variables
banco <- read.csv("eletromediaSAC.csv", 
                    sep = ",", stringsAsFactors = TRUE) 
## Warning in scan(file = file, what = what, sep = sep, quote = quote, dec = dec,
## : EOF within quoted string
head(banco)
##   Edad CasaPropia NumeroDeHijos EstadoCivil
## 1   66         Si             2       Viudo
## 2   52         Si             3      Casado
## 3   22         No             0      Casado
## 4   25         No             1     Soltero
## 5   66         Si             2  Divorciado
##                                                                                                                                                MarcaTvAdquirido
## 1                                                                                                                                                       Samsung
## 2                                                                                                                                                       Samsung
## 3                                                                                                                                                            LG
## 4                                                                                                                                                            LG
## 5 Samsung\n39,Si,2,Casado,LG\n26,No,2,Soltero,LG\n40,Si,1,Casado,LG\n53,Si,2,Divorciado,LG\n64,Si,3,Casado,Samsung\n58,Si,2,Casado,LG\n33,No,1,Casado,Samsung\n

CASO 1: Informe de ElectroMedia SAC

Variables y tipo de variables
Variables y tipo de variables

CASO 2: Informe de Plaza Via

Es un supermercado local que continuamente realiza análisis de sus clientes, los análisis que se hacen son, por ejemplo: seguimiento de compras, satisfacción del cliente, quejas y reclamos, entre otros.

banco <- read.csv("PLAZA-VIA-_2_.csv", 
                    sep = ",", stringsAsFactors = TRUE) 
head(banco)
##       Local   Género     Pago   Opinión Producto.Marca Productos Monto.Pagado
## 1     Surco femenino TCrédito   Regular              3        17          419
## 2     Surco femenino  Contado Muy Bueno              3        13          323
## 3 San Borja femenino TCrédito      Malo              1        11           84
## 4 San Borja femenino TCrédito   Regular              0        11           65
## 5 San Borja femenino TCrédito     Buena              3        15          371
## 6 San Borja femenino  TDébito     Buena              3        17          419
##   Visita.Mensual
## 1             10
## 2             13
## 3              3
## 4              9
## 5              6
## 6             14

1. Fundamentos del estudio.

Objetivo de estudio: Puede ser mejorar la satisfacción del cliente y aumentar la fidelidad del cliente a través de un mejor entendimiento de sus necesidades y preferencias. Población de estudio: Todos los clientes de “Plaza Vía” que realizan compras en el supermercado. Muestra: Una selección representativa de clientes de “Plaza Vía” que pueden brindar información relevante sobre sus hábitos de compra, satisfacción, quejas y reclamos. Unidad de análisis: En este caso, la unidad de análisis serían los individuos (clientes) dentro de la muestra seleccionada.

2. Variables y tipo de variables: (3 puntos)

Variables y tipo de variables
Variables y tipo de variables

3. Realizar una tabla de distribución de frecuencia para dos variables cualitativas.

Realizar mínimo 3 interpretaciones para cada tabla

Variable genero

library(agricolae)
tabla_frecuencia_Producto.Marca <- table.freq(hist(banco$Producto.Marca, breaks = "sturges", plot = FALSE))
tabla_frecuencia_Producto.Marca
##   Lower Upper Main Frequency Percentage CF   CPF
## 1   0.0   0.5 0.25        21       28.8 21  28.8
## 2   0.5   1.0 0.75        21       28.8 42  57.5
## 3   1.0   1.5 1.25         0        0.0 42  57.5
## 4   1.5   2.0 1.75         6        8.2 48  65.8
## 5   2.0   2.5 2.25         0        0.0 48  65.8
## 6   2.5   3.0 2.75        24       32.9 72  98.6
## 7   3.0   3.5 3.25         0        0.0 72  98.6
## 8   3.5   4.0 3.75         1        1.4 73 100.0

Variable Productos

library(agricolae)
tabla_frecuencia_Productos <- table.freq(hist(banco$Productos, breaks = "sturges", plot = FALSE))
tabla_frecuencia_Productos
##   Lower Upper Main Frequency Percentage CF   CPF
## 1     8    10    9        11       15.1 11  15.1
## 2    10    12   11        10       13.7 21  28.8
## 3    12    14   13         8       11.0 29  39.7
## 4    14    16   15         6        8.2 35  47.9
## 5    16    18   17        15       20.5 50  68.5
## 6    18    20   19        10       13.7 60  82.2
## 7    20    22   21        13       17.8 73 100.0

4. Realizar una tabla de distribución de frecuencia agrupada por intervalos para una variable cuantitativa continua o cuantitativa discreta (3 puntos)

Realizar mínimo 3 interpretaciones para cada tabla

library(agricolae)
tabla_frecuencia_Monto.Pagado <- table.freq(hist(banco$Monto.Pagado, breaks = "sturges", plot = FALSE))
tabla_frecuencia_Monto.Pagado
##    Lower Upper Main Frequency Percentage CF   CPF
## 1     50   100   75        20       27.4 20  27.4
## 2    100   150  125        18       24.7 38  52.1
## 3    150   200  175         7        9.6 45  61.6
## 4    200   250  225         9       12.3 54  74.0
## 5    250   300  275         1        1.4 55  75.3
## 6    300   350  325         3        4.1 58  79.5
## 7    350   400  375         3        4.1 61  83.6
## 8    400   450  425         6        8.2 67  91.8
## 9    450   500  475         1        1.4 68  93.2
## 10   500   550  525         5        6.8 73 100.0

5. Realizar gráficos estadísticos para dos variables e interpretar (Elija UD) (3 puntos)

# 1
library(ggplot2)
ggplot(data=banco, aes(y=Género))+
  geom_bar()+
  theme_classic()

# 2
plot(banco$Pago, main="Pedidos realizados", xlab="Tipo de pago", ylab="Cantidad",col=c(2,"pink"))

# 3
library(ggplot2)
ggplot(data = banco, aes(x = Opinión, y = Género)) +
  geom_point() +
  labs(x = "Opiniones", y = "Genero")

6. Realizar medidas estadísticas (Estudiadas) para dos variables cuantitativas e interpretar. (3 puntos)

Medidas estadísticas de tendencia

#Producto.Marca

Media

Producto.Marca <- banco$Producto.Marca
promedio = sum(Producto.Marca)/length(Producto.Marca)
promedio
## [1] 1.493151

Mediana

median(Producto.Marca)
## [1] 1

Moda

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:agricolae':
## 
##     skewness
mfv(Producto.Marca)
## [1] 3

#Productos

Media

Productos <- banco$Productos
promedio = sum(Productos)/length(Productos)
promedio
## [1] 15.79452

Mediana

median(Productos)
## [1] 17

Moda

library(modeest)
mfv(Productos)
## [1] 22

#Monto.Pagado

Media

Monto.Pagado <- banco$Monto.Pagado
promedio = sum(Monto.Pagado)/length(Monto.Pagado)
promedio
## [1] 206.0959

Mediana

median(Monto.Pagado)
## [1] 144

Moda

library(modeest)
mfv(Monto.Pagado)
## [1] 158

#Visita.Mensual

Media

Visita.Mensual <- banco$Visita.Mensual
promedio = sum(Visita.Mensual)/length(Visita.Mensual)
promedio
## [1] 8.520548

Mediana

median(Visita.Mensual)
## [1] 9

Moda

library(modeest)
mfv(Visita.Mensual)
## [1]  2 14 15

Medidas estadísticas de posición

quantile(banco$Monto.Pagado)
##   0%  25%  50%  75% 100% 
##   55  100  144  275  540

Segun los resultados: El valor minimo del monto pagado es 55

### Cuartil 1 \((Q_1)\) interpretación: es $ 100; El 25% de los clientes que accedieron al website, su monto máximo de monto pagado es $ 100

### Cuartil 2 \((Q_2)\) interpretación: es $ 144; El 50% de los clientes que accedieron al website, su monto máximo de monto pagado es $ 144

### Cuartil 3 \((Q_3)\) interpretación: es $ 275; El 75% de los clientes que accedieron al website, su monto máximo de monto pagado es $ 275

Dividir en 10 grupo (deciles)

quantile(banco$Monto.Pagado, probs = seq(0, 1, 0.1))
##    0%   10%   20%   30%   40%   50%   60%   70%   80%   90%  100% 
##  55.0  70.0  97.0 110.0 120.0 144.0 162.6 227.0 351.8 439.0 540.0

Dividir en 100 grupo (percentiles)

quantile(banco$Monto.Pagado, probs = seq(0, 1, 0.01))
##     0%     1%     2%     3%     4%     5%     6%     7%     8%     9%    10% 
##  55.00  55.00  59.40  65.00  65.00  65.00  65.00  65.00  65.00  67.40  70.00 
##    11%    12%    13%    14%    15%    16%    17%    18%    19%    20%    21% 
##  70.00  73.20  78.24  84.00  84.00  84.00  84.00  84.00  92.84  97.00  97.36 
##    22%    23%    24%    25%    26%    27%    28%    29%    30%    31%    32% 
##  99.52 100.00 100.00 100.00 100.00 104.40 110.00 110.00 110.00 110.00 110.04 
##    33%    34%    35%    36%    37%    38%    39%    40%    41%    42%    43% 
## 110.76 111.00 112.80 119.28 120.00 120.00 120.00 120.00 120.00 122.64 130.56 
##    44%    45%    46%    47%    48%    49%    50%    51%    52%    53%    54% 
## 131.00 131.00 132.56 141.92 144.00 144.00 144.00 144.00 150.16 158.00 158.00 
##    55%    56%    57%    58%    59%    60%    61%    62%    63%    64%    65% 
## 158.00 158.00 158.00 158.00 158.00 162.60 179.16 195.08 203.36 204.88 212.80 
##    66%    67%    68%    69%    70%    71%    72%    73%    74%    75%    76% 
## 221.24 227.00 227.00 227.00 227.00 227.00 227.00 233.16 248.36 275.00 309.56 
##    77%    78%    79%    80%    81%    82%    83%    84%    85%    86%    87% 
## 323.00 323.00 323.00 351.80 371.00 371.00 371.00 394.04 419.00 419.00 419.00 
##    88%    89%    90%    91%    92%    93%    94%    95%    96%    97%    98% 
## 419.00 421.00 439.00 444.00 455.52 490.08 522.60 538.20 540.00 540.00 540.00 
##    99%   100% 
## 540.00 540.00

Asimetría y curtosis

Asimetría

library(fBasics)
## 
## Attaching package: 'fBasics'
## The following objects are masked from 'package:modeest':
## 
##     ghMode, ghtMode, gldMode, hypMode, nigMode, skewness
## The following objects are masked from 'package:agricolae':
## 
##     kurtosis, skewness
skewness(banco$Monto.Pagado)
## [1] 1.055262
## attr(,"method")
## [1] "moment"

Resultado: [1] 1.055262

hist(banco$Monto.Pagado)

Curtosis

kurtosis(banco$Monto.Pagado)
## [1] -0.1916686
## attr(,"method")
## [1] "excess"