Una empresa de telefonia local, constante evalua la satisfacio de sus clientes cuando visitan el CAC (Centro al cliente). La compañia registra datos de:
El principal objetivo es realizar un analisis de satisfacion del cliente
telco <- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv",
encoding = "latin1", sep = ";", stringsAsFactors = T)
head(telco)
# Resumen
summary(telco)
## Código Género Sucursal Reclamos Llamadas
## CLIPE1 : 1 Femenino :38 Suc. Centro:23 Min. : 1.000 Min. : 1.000
## CLIPE10: 1 Masculino:42 Suc. Este :22 1st Qu.: 2.000 1st Qu.: 3.000
## CLIPE11: 1 Suc. Norte :16 Median : 3.000 Median : 5.000
## CLIPE12: 1 Suc. Sur :19 Mean : 3.587 Mean : 4.912
## CLIPE13: 1 3rd Qu.: 4.250 3rd Qu.: 7.000
## CLIPE14: 1 Max. :11.000 Max. :13.000
## (Other):74
## Edad Minutos Monto Tiempo
## Min. :20.00 Min. :17.50 Min. : 74.10 Min. : 0.300
## 1st Qu.:26.00 1st Qu.:31.62 1st Qu.: 84.17 1st Qu.: 1.700
## Median :30.50 Median :37.45 Median : 89.95 Median : 3.300
## Mean :30.29 Mean :37.49 Mean : 92.31 Mean : 6.034
## 3rd Qu.:35.00 3rd Qu.:43.15 3rd Qu.: 99.00 3rd Qu.: 5.575
## Max. :40.00 Max. :62.20 Max. :119.10 Max. :36.000
##
## Opinión
## Bueno :15
## Excelente:14
## Muy Bueno:18
## Pésimo :24
## Regular : 9
##
##
El analisis solo se realiza para variable cuantitativa
# Grafico de cajas y bigotes
boxplot(telco$Edad)
Segun los resultados. La edad no tiene valores atipicos
Obteniendo valores
boxplot(telco$Monto)
boxplot(telco)
boxplot(telco$Tiempo)
Segun los resultados. Se identifica valores atipicos. vamos a identificarlo y plantear estrategia de correccion
# Calcular
q1 <- quantile(telco$Tiempo, 0.25)
q3 <- quantile(telco$Tiempo, 0.75)
RIC <- q3 - q1
RIC
## 75%
## 3.875
# Limites o bigotes (Superior e inferior)
bigote_inferior <- q1 - 1.5*RIC
bigote_inferior
## 25%
## -4.1125
bigote_superior <- q3 + 1.5*RIC
bigote_superior
## 75%
## 11.3875
# Identificar los valores atipicos
outliers_det <- telco$Tiempo[telco$Tiempo < bigote_inferior | telco$Tiempo > bigote_superior]
outliers_det
## [1] 16.9 14.5 11.5 20.5 11.5 20.5 16.5 26.6 22.7 12.5 23.7 36.0 16.9 14.5 11.7
## [16] 20.5
telco_sin_atipicos <- telco[!telco$Tiempo %in% outliers_det,]
telco_sin_atipicos
Para confirmar vamos a realizar un grafico de cajas con la nueva data
boxplot(telco_sin_atipicos$Tiempo)
Buscar un conjunto de datos y aplicar todo lo estudiado (puede ser el mismo caso de evaluacion anterior) o recomendable buscar un caso que tenga missing y partir de alli para