#Caso de la telefonía una empresa de telefonía local, constantemente evalua la satisfacción de sus cliente cuando visitan el CAC (Centro de atención al cliente). La compañia registra datos de : * El género del cliente * La sucursal donde fue atendido * Número de reclamos hasta la fecha * Número de llamada que ha realizado al CAC * Edad - Minutos consumidos de su plan - Monto de pago del cliente * Tiempo de espera el cliente hasta ser atendido en el CAC * Opinión frente a la atención El principal objetivo es realizar un análisis de satisfacción del cliente.

# Carga de datos
telco <- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv",
                  encoding = "latin1", sep = ";", stringsAsFactors = T)
#Mostrar datos:
head(telco)
#Resumen
summary(telco)
##      Código         Género          Sucursal     Reclamos         Llamadas     
##  CLIPE1 : 1   Femenino :38   Suc. Centro:23   Min.   : 1.000   Min.   : 1.000  
##  CLIPE10: 1   Masculino:42   Suc. Este  :22   1st Qu.: 2.000   1st Qu.: 3.000  
##  CLIPE11: 1                  Suc. Norte :16   Median : 3.000   Median : 5.000  
##  CLIPE12: 1                  Suc. Sur   :19   Mean   : 3.587   Mean   : 4.912  
##  CLIPE13: 1                                   3rd Qu.: 4.250   3rd Qu.: 7.000  
##  CLIPE14: 1                                   Max.   :11.000   Max.   :13.000  
##  (Other):74                                                                    
##       Edad          Minutos          Monto            Tiempo      
##  Min.   :20.00   Min.   :17.50   Min.   : 74.10   Min.   : 0.300  
##  1st Qu.:26.00   1st Qu.:31.62   1st Qu.: 84.17   1st Qu.: 1.700  
##  Median :30.50   Median :37.45   Median : 89.95   Median : 3.300  
##  Mean   :30.29   Mean   :37.49   Mean   : 92.31   Mean   : 6.034  
##  3rd Qu.:35.00   3rd Qu.:43.15   3rd Qu.: 99.00   3rd Qu.: 5.575  
##  Max.   :40.00   Max.   :62.20   Max.   :119.10   Max.   :36.000  
##                                                                   
##       Opinión  
##  Bueno    :15  
##  Excelente:14  
##  Muy Bueno:18  
##  Pésimo   :24  
##  Regular  : 9  
##                
## 

#Detección de outtliers univariado - gráfica El análisis solo se realiza para variable cuantitativas ## Gráfico de cajas Gráfico de cajas y bigotes

#Gráfico de cajas y bigotes
boxplot(telco$Edad)

Según los resultados, la edad no tiene valores atípicos Obteniendo valores atípicos para la variable monto de pago

boxplot(telco$Monto)

#Para todo

boxplot(telco)

#Para tiempo

boxplot(telco$Tiempo)

Según los resultados, se identifica valores atípicos. Vamos a indentificarlo y plantear estrategia de corrección

# Calcular el RIC (RIC = Q3 - Q1)
q1 <- quantile(telco$Tiempo, 0.25)
q3 <- quantile(telco$Tiempo, 0.75)
RIC <- q3-q1
RIC
##   75% 
## 3.875
## 75%
## 3.875
# Limites o bigotes (Superior e inferior)
bigote_inferior <- q1-1.5*RIC
bigote_superior <- q3+1.5*RIC
# Identificar lo valores atípicos
outliers_det <- telco$Tiempo[telco$Tiempo < bigote_inferior | telco$Tiempo > bigote_superior]
outliers_det
##  [1] 16.9 14.5 11.5 20.5 11.5 20.5 16.5 26.6 22.7 12.5 23.7 36.0 16.9 14.5 11.7
## [16] 20.5

##Corrección ###Elimiar los atípicos

telco_sin_atipicos <- telco[telco$Tiempo %in% outliers_det,]
telco_sin_atipicos

Para confirmar vamos a realizar un gráfico de cajas con la nueva data

boxplot(telco_sin_atipicos$Tiempo)

##Corrección por transformación ##Corrección por imputación