#Caso de la telefonía una empresa de telefonía local, constantemente evalua la satisfacción de sus cliente cuando visitan el CAC (Centro de atención al cliente). La compañia registra datos de : * El género del cliente * La sucursal donde fue atendido * Número de reclamos hasta la fecha * Número de llamada que ha realizado al CAC * Edad - Minutos consumidos de su plan - Monto de pago del cliente * Tiempo de espera el cliente hasta ser atendido en el CAC * Opinión frente a la atención El principal objetivo es realizar un análisis de satisfacción del cliente.
# Carga de datos
telco <- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv",
encoding = "latin1", sep = ";", stringsAsFactors = T)
#Mostrar datos:
head(telco)
#Resumen
summary(telco)
## Código Género Sucursal Reclamos Llamadas
## CLIPE1 : 1 Femenino :38 Suc. Centro:23 Min. : 1.000 Min. : 1.000
## CLIPE10: 1 Masculino:42 Suc. Este :22 1st Qu.: 2.000 1st Qu.: 3.000
## CLIPE11: 1 Suc. Norte :16 Median : 3.000 Median : 5.000
## CLIPE12: 1 Suc. Sur :19 Mean : 3.587 Mean : 4.912
## CLIPE13: 1 3rd Qu.: 4.250 3rd Qu.: 7.000
## CLIPE14: 1 Max. :11.000 Max. :13.000
## (Other):74
## Edad Minutos Monto Tiempo
## Min. :20.00 Min. :17.50 Min. : 74.10 Min. : 0.300
## 1st Qu.:26.00 1st Qu.:31.62 1st Qu.: 84.17 1st Qu.: 1.700
## Median :30.50 Median :37.45 Median : 89.95 Median : 3.300
## Mean :30.29 Mean :37.49 Mean : 92.31 Mean : 6.034
## 3rd Qu.:35.00 3rd Qu.:43.15 3rd Qu.: 99.00 3rd Qu.: 5.575
## Max. :40.00 Max. :62.20 Max. :119.10 Max. :36.000
##
## Opinión
## Bueno :15
## Excelente:14
## Muy Bueno:18
## Pésimo :24
## Regular : 9
##
##
#Detección de outtliers univariado - gráfica El análisis solo se realiza para variable cuantitativas ## Gráfico de cajas Gráfico de cajas y bigotes
#Gráfico de cajas y bigotes
boxplot(telco$Edad)
Según los resultados, la edad no tiene valores atípicos Obteniendo
valores atípicos para la variable monto de pago
boxplot(telco$Monto)
#Para todo
boxplot(telco)
#Para tiempo
boxplot(telco$Tiempo)
Según los resultados, se identifica valores atípicos. Vamos a
indentificarlo y plantear estrategia de corrección
# Calcular el RIC (RIC = Q3 - Q1)
q1 <- quantile(telco$Tiempo, 0.25)
q3 <- quantile(telco$Tiempo, 0.75)
RIC <- q3-q1
RIC
## 75%
## 3.875
## 75%
## 3.875
# Limites o bigotes (Superior e inferior)
bigote_inferior <- q1-1.5*RIC
bigote_superior <- q3+1.5*RIC
# Identificar lo valores atípicos
outliers_det <- telco$Tiempo[telco$Tiempo < bigote_inferior | telco$Tiempo > bigote_superior]
outliers_det
## [1] 16.9 14.5 11.5 20.5 11.5 20.5 16.5 26.6 22.7 12.5 23.7 36.0 16.9 14.5 11.7
## [16] 20.5
##Corrección ###Elimiar los atípicos
telco_sin_atipicos <- telco[telco$Tiempo %in% outliers_det,]
telco_sin_atipicos
Para confirmar vamos a realizar un gráfico de cajas con la nueva data
boxplot(telco_sin_atipicos$Tiempo)
##Corrección por transformación ##Corrección por imputación