Caso telefonía

una empresa de telefonía local, constantemente evalua la satisfacción de sus cliente cuando visitan el CAC (Centro de atención al cliente). La compañia registra datos de :

El principal objetivo es realizar un análisis de satisfacción del cliente

# Carga de datos
telco <- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv",
                  encoding = "latin1", sep = ";", stringsAsFactors = T)
# Mostrar datos
head(telco)
# Resumen
summary(telco)
##      Código         Género          Sucursal     Reclamos         Llamadas     
##  CLIPE1 : 1   Femenino :38   Suc. Centro:23   Min.   : 1.000   Min.   : 1.000  
##  CLIPE10: 1   Masculino:42   Suc. Este  :22   1st Qu.: 2.000   1st Qu.: 3.000  
##  CLIPE11: 1                  Suc. Norte :16   Median : 3.000   Median : 5.000  
##  CLIPE12: 1                  Suc. Sur   :19   Mean   : 3.587   Mean   : 4.912  
##  CLIPE13: 1                                   3rd Qu.: 4.250   3rd Qu.: 7.000  
##  CLIPE14: 1                                   Max.   :11.000   Max.   :13.000  
##  (Other):74                                                                    
##       Edad          Minutos          Monto            Tiempo      
##  Min.   :20.00   Min.   :17.50   Min.   : 74.10   Min.   : 0.300  
##  1st Qu.:26.00   1st Qu.:31.62   1st Qu.: 84.17   1st Qu.: 1.700  
##  Median :30.50   Median :37.45   Median : 89.95   Median : 3.300  
##  Mean   :30.29   Mean   :37.49   Mean   : 92.31   Mean   : 6.034  
##  3rd Qu.:35.00   3rd Qu.:43.15   3rd Qu.: 99.00   3rd Qu.: 5.575  
##  Max.   :40.00   Max.   :62.20   Max.   :119.10   Max.   :36.000  
##                                                                   
##       Opinión  
##  Bueno    :15  
##  Excelente:14  
##  Muy Bueno:18  
##  Pésimo   :24  
##  Regular  : 9  
##                
## 

Detección de outtliers univariado - gráfica

El análisis solo se realiza para variable cuantitativas

Gráfico de cajas

Gráfico de cajas y bigotes

#Gráfico de cajas y bigotes
boxplot(telco$Edad)

Según los resultados, la edad no tiene valores atípicos

Obteniendo valores atípicos para la variable monto de pago

boxplot(telco$Monto)

Para todo

boxplot(telco)

Para tiempo

boxplot(telco$Tiempo)

Según los resultados, se identifica valores atípicos. Vamos a identificarlo y plantear estrategia de corrección

# Calcular el RIC (RIC = Q3 - Q1)
q1 <- quantile(telco$Tiempo, 0.25)
q3 <- quantile(telco$Tiempo, 0.75)
RIC <- q3-q1
RIC
##   75% 
## 3.875
# Limites o bigotes (Superior e inferior)
bigote_inferior <- q1-1.5*RIC
bigote_inferior
##     25% 
## -4.1125
bigote_superior <- q3+1.5*RIC
bigote_superior
##     75% 
## 11.3875
# Identificar lo valores atípicos
outliers_det <- telco$Tiempo[telco$Tiempo < bigote_inferior | telco$Tiempo > bigote_superior]
outliers_det
##  [1] 16.9 14.5 11.5 20.5 11.5 20.5 16.5 26.6 22.7 12.5 23.7 36.0 16.9 14.5 11.7
## [16] 20.5

Correción

Eliminar los atípicos

telco_sin_atipicos <- telco[!telco$Tiempo %in% outliers_det,]
telco_sin_atipicos

Para confirmar vamos a realizar un gráfico de cajas con la nueva data

boxplot(telco_sin_atipicos$Tiempo)