banco <- read.csv("eletromediaSAC.csv",
sep = ",", stringsAsFactors = TRUE)
## Warning in scan(file = file, what = what, sep = sep, quote = quote, dec = dec,
## : EOF within quoted string
head(banco)
## Edad CasaPropia NumeroDeHijos EstadoCivil
## 1 66 Si 2 Viudo
## 2 52 Si 3 Casado
## 3 22 No 0 Casado
## 4 25 No 1 Soltero
## 5 66 Si 2 Divorciado
## MarcaTvAdquirido
## 1 Samsung
## 2 Samsung
## 3 LG
## 4 LG
## 5 Samsung\n39,Si,2,Casado,LG\n26,No,2,Soltero,LG\n40,Si,1,Casado,LG\n53,Si,2,Divorciado,LG\n64,Si,3,Casado,Samsung\n58,Si,2,Casado,LG\n33,No,1,Casado,Samsung\n
Es un supermercado local que continuamente realiza análisis de sus clientes, los análisis que se hacen son, por ejemplo: seguimiento de compras, satisfacción del cliente, quejas y reclamos, entre otros.
banco <- read.csv("PLAZA-VIA-_2_.csv",
sep = ",", stringsAsFactors = TRUE)
head(banco)
## Local Género Pago Opinión Producto.Marca Productos Monto.Pagado
## 1 Surco femenino TCrédito Regular 3 17 419
## 2 Surco femenino Contado Muy Bueno 3 13 323
## 3 San Borja femenino TCrédito Malo 1 11 84
## 4 San Borja femenino TCrédito Regular 0 11 65
## 5 San Borja femenino TCrédito Buena 3 15 371
## 6 San Borja femenino TDébito Buena 3 17 419
## Visita.Mensual
## 1 10
## 2 13
## 3 3
## 4 9
## 5 6
## 6 14
Objetivo de estudio: Puede ser mejorar la satisfacción del cliente y aumentar la fidelidad del cliente a través de un mejor entendimiento de sus necesidades y preferencias. Población de estudio: Todos los clientes de “Plaza Vía” que realizan compras en el supermercado. Muestra: Una selección representativa de clientes de “Plaza Vía” que pueden brindar información relevante sobre sus hábitos de compra, satisfacción, quejas y reclamos. Unidad de análisis: En este caso, la unidad de análisis serían los individuos (clientes) dentro de la muestra seleccionada.
Realizar mínimo 3 interpretaciones para cada tabla
Variable genero
library(agricolae)
tabla_frecuencia_Producto.Marca <- table.freq(hist(banco$Producto.Marca, breaks = "sturges", plot = FALSE))
tabla_frecuencia_Producto.Marca
## Lower Upper Main Frequency Percentage CF CPF
## 1 0.0 0.5 0.25 21 28.8 21 28.8
## 2 0.5 1.0 0.75 21 28.8 42 57.5
## 3 1.0 1.5 1.25 0 0.0 42 57.5
## 4 1.5 2.0 1.75 6 8.2 48 65.8
## 5 2.0 2.5 2.25 0 0.0 48 65.8
## 6 2.5 3.0 2.75 24 32.9 72 98.6
## 7 3.0 3.5 3.25 0 0.0 72 98.6
## 8 3.5 4.0 3.75 1 1.4 73 100.0
Variable Productos
library(agricolae)
tabla_frecuencia_Productos <- table.freq(hist(banco$Productos, breaks = "sturges", plot = FALSE))
tabla_frecuencia_Productos
## Lower Upper Main Frequency Percentage CF CPF
## 1 8 10 9 11 15.1 11 15.1
## 2 10 12 11 10 13.7 21 28.8
## 3 12 14 13 8 11.0 29 39.7
## 4 14 16 15 6 8.2 35 47.9
## 5 16 18 17 15 20.5 50 68.5
## 6 18 20 19 10 13.7 60 82.2
## 7 20 22 21 13 17.8 73 100.0
Realizar mínimo 3 interpretaciones para cada tabla
library(agricolae)
tabla_frecuencia_Monto.Pagado <- table.freq(hist(banco$Monto.Pagado, breaks = "sturges", plot = FALSE))
tabla_frecuencia_Monto.Pagado
## Lower Upper Main Frequency Percentage CF CPF
## 1 50 100 75 20 27.4 20 27.4
## 2 100 150 125 18 24.7 38 52.1
## 3 150 200 175 7 9.6 45 61.6
## 4 200 250 225 9 12.3 54 74.0
## 5 250 300 275 1 1.4 55 75.3
## 6 300 350 325 3 4.1 58 79.5
## 7 350 400 375 3 4.1 61 83.6
## 8 400 450 425 6 8.2 67 91.8
## 9 450 500 475 1 1.4 68 93.2
## 10 500 550 525 5 6.8 73 100.0
# 1
library(ggplot2)
ggplot(data=banco, aes(y=Género))+
geom_bar()+
theme_classic()
# 2
plot(banco$Pago, main="Pedidos realizados", xlab="Tipo de pago", ylab="Cantidad",col=c(2,"pink"))
# 3
library(ggplot2)
ggplot(data = banco, aes(x = Opinión, y = Género)) +
geom_point() +
labs(x = "Opiniones", y = "Genero")
Medidas estadísticas de tendencia
#Producto.Marca
Media
Producto.Marca <- banco$Producto.Marca
promedio = sum(Producto.Marca)/length(Producto.Marca)
promedio
## [1] 1.493151
Mediana
median(Producto.Marca)
## [1] 1
Moda
library(modeest)
##
## Attaching package: 'modeest'
## The following object is masked from 'package:agricolae':
##
## skewness
mfv(Producto.Marca)
## [1] 3
#Productos
Media
Productos <- banco$Productos
promedio = sum(Productos)/length(Productos)
promedio
## [1] 15.79452
Mediana
median(Productos)
## [1] 17
Moda
library(modeest)
mfv(Productos)
## [1] 22
#Monto.Pagado
Media
Monto.Pagado <- banco$Monto.Pagado
promedio = sum(Monto.Pagado)/length(Monto.Pagado)
promedio
## [1] 206.0959
Mediana
median(Monto.Pagado)
## [1] 144
Moda
library(modeest)
mfv(Monto.Pagado)
## [1] 158
#Visita.Mensual
Media
Visita.Mensual <- banco$Visita.Mensual
promedio = sum(Visita.Mensual)/length(Visita.Mensual)
promedio
## [1] 8.520548
Mediana
median(Visita.Mensual)
## [1] 9
Moda
library(modeest)
mfv(Visita.Mensual)
## [1] 2 14 15
Medidas estadísticas de posición
quantile(banco$Monto.Pagado)
## 0% 25% 50% 75% 100%
## 55 100 144 275 540
Segun los resultados: El valor minimo del monto pagado es 55
### Cuartil 1 \((Q_1)\) interpretación: es $ 100; El 25% de los clientes que accedieron al website, su monto máximo de monto pagado es $ 100
### Cuartil 2 \((Q_2)\) interpretación: es $ 144; El 50% de los clientes que accedieron al website, su monto máximo de monto pagado es $ 144
### Cuartil 3 \((Q_3)\) interpretación: es $ 275; El 75% de los clientes que accedieron al website, su monto máximo de monto pagado es $ 275
Dividir en 10 grupo (deciles)
quantile(banco$Monto.Pagado, probs = seq(0, 1, 0.1))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 55.0 70.0 97.0 110.0 120.0 144.0 162.6 227.0 351.8 439.0 540.0
Dividir en 100 grupo (percentiles)
quantile(banco$Monto.Pagado, probs = seq(0, 1, 0.01))
## 0% 1% 2% 3% 4% 5% 6% 7% 8% 9% 10%
## 55.00 55.00 59.40 65.00 65.00 65.00 65.00 65.00 65.00 67.40 70.00
## 11% 12% 13% 14% 15% 16% 17% 18% 19% 20% 21%
## 70.00 73.20 78.24 84.00 84.00 84.00 84.00 84.00 92.84 97.00 97.36
## 22% 23% 24% 25% 26% 27% 28% 29% 30% 31% 32%
## 99.52 100.00 100.00 100.00 100.00 104.40 110.00 110.00 110.00 110.00 110.04
## 33% 34% 35% 36% 37% 38% 39% 40% 41% 42% 43%
## 110.76 111.00 112.80 119.28 120.00 120.00 120.00 120.00 120.00 122.64 130.56
## 44% 45% 46% 47% 48% 49% 50% 51% 52% 53% 54%
## 131.00 131.00 132.56 141.92 144.00 144.00 144.00 144.00 150.16 158.00 158.00
## 55% 56% 57% 58% 59% 60% 61% 62% 63% 64% 65%
## 158.00 158.00 158.00 158.00 158.00 162.60 179.16 195.08 203.36 204.88 212.80
## 66% 67% 68% 69% 70% 71% 72% 73% 74% 75% 76%
## 221.24 227.00 227.00 227.00 227.00 227.00 227.00 233.16 248.36 275.00 309.56
## 77% 78% 79% 80% 81% 82% 83% 84% 85% 86% 87%
## 323.00 323.00 323.00 351.80 371.00 371.00 371.00 394.04 419.00 419.00 419.00
## 88% 89% 90% 91% 92% 93% 94% 95% 96% 97% 98%
## 419.00 421.00 439.00 444.00 455.52 490.08 522.60 538.20 540.00 540.00 540.00
## 99% 100%
## 540.00 540.00
Asimetría y curtosis
Asimetría
library(fBasics)
##
## Attaching package: 'fBasics'
## The following objects are masked from 'package:modeest':
##
## ghMode, ghtMode, gldMode, hypMode, nigMode, skewness
## The following objects are masked from 'package:agricolae':
##
## kurtosis, skewness
skewness(banco$Monto.Pagado)
## [1] 1.055262
## attr(,"method")
## [1] "moment"
Resultado: [1] 1.055262
hist(banco$Monto.Pagado)
Curtosis
kurtosis(banco$Monto.Pagado)
## [1] -0.1916686
## attr(,"method")
## [1] "excess"