Caso telefonia

Una empresa de telefonia local, constante evalua la satisfacio de sus clientes cuando visitan el CAC (Centro al cliente). La compañia registra datos de:

El principal objetivo es realizar un analisis de satisfacion del cliente

telco <- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv",
                  encoding = "latin1", sep = ";", stringsAsFactors = T)
head(telco)
# Resumen 
summary(telco)
##      Código         Género          Sucursal     Reclamos         Llamadas     
##  CLIPE1 : 1   Femenino :38   Suc. Centro:23   Min.   : 1.000   Min.   : 1.000  
##  CLIPE10: 1   Masculino:42   Suc. Este  :22   1st Qu.: 2.000   1st Qu.: 3.000  
##  CLIPE11: 1                  Suc. Norte :16   Median : 3.000   Median : 5.000  
##  CLIPE12: 1                  Suc. Sur   :19   Mean   : 3.587   Mean   : 4.912  
##  CLIPE13: 1                                   3rd Qu.: 4.250   3rd Qu.: 7.000  
##  CLIPE14: 1                                   Max.   :11.000   Max.   :13.000  
##  (Other):74                                                                    
##       Edad          Minutos          Monto            Tiempo      
##  Min.   :20.00   Min.   :17.50   Min.   : 74.10   Min.   : 0.300  
##  1st Qu.:26.00   1st Qu.:31.62   1st Qu.: 84.17   1st Qu.: 1.700  
##  Median :30.50   Median :37.45   Median : 89.95   Median : 3.300  
##  Mean   :30.29   Mean   :37.49   Mean   : 92.31   Mean   : 6.034  
##  3rd Qu.:35.00   3rd Qu.:43.15   3rd Qu.: 99.00   3rd Qu.: 5.575  
##  Max.   :40.00   Max.   :62.20   Max.   :119.10   Max.   :36.000  
##                                                                   
##       Opinión  
##  Bueno    :15  
##  Excelente:14  
##  Muy Bueno:18  
##  Pésimo   :24  
##  Regular  : 9  
##                
## 

Dteccion de outtliers univariable - grafica

El analisis solo se realiza para variable cuantitativa

Grafico de cajas

# Grafico de cajas y bigotes
boxplot(telco$Edad)

Segun los resultados. La edad no tiene valores atipicos

Obteniendo valores

boxplot(telco$Monto)

Para todo

boxplot(telco)

Para tiempo

boxplot(telco$Tiempo)

Segun los resultados. Se identifica valores atipicos. vamos a identificarlo y plantear estrategia de correccion

# Calcular 
q1 <- quantile(telco$Tiempo, 0.25)
q3 <- quantile(telco$Tiempo, 0.75)
RIC <- q3 - q1
RIC
##   75% 
## 3.875
# Limites o bigotes (Superior e inferior)
bigote_inferior <- q1 - 1.5*RIC
bigote_inferior
##     25% 
## -4.1125
bigote_superior <- q3 + 1.5*RIC
bigote_superior
##     75% 
## 11.3875
# Identificar los valores atipicos
outliers_det <- telco$Tiempo[telco$Tiempo < bigote_inferior | telco$Tiempo > bigote_superior]
outliers_det
##  [1] 16.9 14.5 11.5 20.5 11.5 20.5 16.5 26.6 22.7 12.5 23.7 36.0 16.9 14.5 11.7
## [16] 20.5

Correccion

Eliminar los atipicos

telco_sin_atipicos <- telco[!telco$Tiempo %in% outliers_det,]
telco_sin_atipicos

Para confirmar vamos a realizar un grafico de cajas con la nueva data

boxplot(telco_sin_atipicos$Tiempo)

Correccion por transformacion

Correccion por imputacion

Recomendacion avance para trabajo final

Buscar un conjunto de datos y aplicar todo lo estudiado (puede ser el mismo caso de evaluacion anterior) o recomendable buscar un caso que tenga missing y partir de alli para