data(Telco_Cusomer_Churn)
## Warning in data(Telco_Cusomer_Churn): data set 'Telco_Cusomer_Churn' not found
summary(Telco_Cusomer_Churn)
##   customerID           gender          SeniorCitizen      Partner         
##  Length:7043        Length:7043        Min.   :0.0000   Length:7043       
##  Class :character   Class :character   1st Qu.:0.0000   Class :character  
##  Mode  :character   Mode  :character   Median :0.0000   Mode  :character  
##                                        Mean   :0.1621                     
##                                        3rd Qu.:0.0000                     
##                                        Max.   :1.0000                     
##                                                                           
##   Dependents            tenure      PhoneService       MultipleLines     
##  Length:7043        Min.   : 0.00   Length:7043        Length:7043       
##  Class :character   1st Qu.: 9.00   Class :character   Class :character  
##  Mode  :character   Median :29.00   Mode  :character   Mode  :character  
##                     Mean   :32.37                                        
##                     3rd Qu.:55.00                                        
##                     Max.   :72.00                                        
##                                                                          
##  InternetService    OnlineSecurity     OnlineBackup       DeviceProtection  
##  Length:7043        Length:7043        Length:7043        Length:7043       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  TechSupport        StreamingTV        StreamingMovies      Contract        
##  Length:7043        Length:7043        Length:7043        Length:7043       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  PaperlessBilling   PaymentMethod      MonthlyCharges    TotalCharges   
##  Length:7043        Length:7043        Min.   : 18.25   Min.   :  18.8  
##  Class :character   Class :character   1st Qu.: 35.50   1st Qu.: 401.4  
##  Mode  :character   Mode  :character   Median : 70.35   Median :1397.5  
##                                        Mean   : 64.76   Mean   :2283.3  
##                                        3rd Qu.: 89.85   3rd Qu.:3794.7  
##                                        Max.   :118.75   Max.   :8684.8  
##                                                         NA's   :11      
##     Churn          
##  Length:7043       
##  Class :character  
##  Mode  :character  
##                    
##                    
##                    
## 

Interpretación

En la tabla anterior se presentan estadísticas descriptivas para el conjunto de datos Telco_Cusomer_Churn, donde se pudo observar lo siguiente:

La permanencia de los clientes tiende a ser relativamente corta, ya que la mediana es de 29 meses y más de la mitad no alcanza a cumplir tres años en la compañía.

Los cargos mensuales se concentran alrededor de 70, pero existen planes mucho más costosos que elevan el promedio, lo que refleja una oferta diversa de servicios y la presencia de valores extremos.

Los cargos totales muestran una fuerte asimetría: la mayoría de clientes acumula montos bajos a moderados, mientras que unos pocos concentran valores muy altos; los registros con permanencia igual a cero explican los once casos faltantes en esta variable. ## Matriz correlación

library(corrplot)

num_vars <- Telco_Cusomer_Churn[, c("tenure", "MonthlyCharges", "TotalCharges")]

M <- cor(num_vars, use = "complete.obs")

corrplot(M, method = "color", type = "upper",
         addCoef.col = "black", # añade los coeficientes
         tl.col = "black", tl.srt = 45,
         col = colorRampPalette(c("red", "white", "blue"))(200),
         title = "Matriz de Correlación",
         mar = c(0,0,2,0))

Interpretación

  1. tenure vs TotalCharges
  1. MonthlyCharges vs TotalCharges
  1. tenure vs MonthlyCharges

Diagrama de cajas Cargos mensuales vs Rotación

library(ggplot2)

p4 <- ggplot(Telco_Cusomer_Churn, aes(x = Churn, y = MonthlyCharges, fill = Churn)) +
  geom_boxplot() +
  labs(title = "Cargos Mensuales según Fuga de Clientes (Churn)",
       x = "Fuga (Churn)", 
       y = "Cargos Mensuales") +
  scale_fill_manual(values = c("No" = "aliceblue", "Yes" = "#f82020"))

p4

Interpretación

  1. Clientes que NO se fueron (Churn = No)
  • Tienen una distribución más concentrada en valores bajos e intermedios de cargos mensuales.
  • La mediana suele estar en un nivel menor que la de los clientes que sí se fueron.
  • Esto sugiere que quienes pagan menos mensualmente tienden a no irse de la compañía.
  1. Clientes que SÍ se fueron (Churn = Yes)
  • Tienen una mediana de cargos mensuales más alta.
  • Presentan menor dispersión, es decir, los clientes que se fueron estaban pagando tarifas muy elevadas.
  • Esto puede indicar que los planes más costosos generan mayor probabilidad de fuga.
## Warning: Removed 11 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

Interpretación

  1. Clientes que NO se fueron (Churn = No)
  • Presentan cargos totales mucho más altos en promedio que los clientes que sí se fueron. - Esto tiene sentido porque la mayoría de estos clientes permanecieron más tiempo en la empresa, lo que incrementa el acumulado de cargos.

  • La caja es más “alta” y extendida hacia valores grandes, lo que muestra clientes de larga permanencia.

  1. Clientes que SÍ se fueron (Churn = Yes)
  • Sus cargos totales son más bajos en comparación.

  • La mediana y la dispersión son significativamente menores, indicando que estos clientes no permanecieron tanto tiempo y, por lo tanto, acumularon menos pagos.

Proporción hombre-mujer

library(ggplot2)

p6 <- ggplot(Telco_Cusomer_Churn, aes(x = Churn, fill = gender)) +
  geom_bar(position = "fill") +
  labs(title = "Distribución de Género según Fuga de Clientes (Churn)",
       x = "Fuga (Churn)",
       y = "Proporción") +
  scale_fill_manual(values = c("Female" = "orchid", "Male" = "#89aaec"))

p6

Interpretación

  1. Clientes que NO se fueron (Churn = No)
  • La proporción de hombres y mujeres es bastante equilibrada.
  • No se observa una diferencia significativa en la permanencia de clientes según género.
  1. Clientes que SÍ se fueron (Churn = Yes)
  • Nuevamente, las proporciones de hombres y mujeres son muy similares.
  • Esto sugiere que el género no influye de manera importante en la decisión de abandonar la compañía.
  1. Comparación general
  • El género no parece ser un factor determinante en la fuga de clientes.

Diagrama de dispersión, antiegüedad del cliente vs cargos mensuales

library(ggplot2)

p7 <- ggplot(Telco_Cusomer_Churn, aes(x = tenure, y = MonthlyCharges)) +
  geom_point(alpha = 0.4, color = "steelblue") +
  geom_smooth(method = "lm", se = TRUE, color = "red") +
  labs(title = "Relación entre Antigüedad y Cargos Mensuales",
       x = "Antigüedad (meses)",
       y = "Cargos Mensuales")

p7
## `geom_smooth()` using formula = 'y ~ x'

Calcular correlación

cor(Telco_Cusomer_Churn$tenure, Telco_Cusomer_Churn$MonthlyCharges, use = "complete.obs")
## [1] 0.2478999
modelo <- lm(MonthlyCharges ~ tenure, data = Telco_Cusomer_Churn)
summary(modelo)
## 
## Call:
## lm(formula = MonthlyCharges ~ tenure, data = Telco_Cusomer_Churn)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -57.498 -27.251   6.245  24.943  54.376 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 54.92978    0.57476   95.57   <2e-16 ***
## tenure       0.30372    0.01415   21.47   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 29.15 on 7041 degrees of freedom
## Multiple R-squared:  0.06145,    Adjusted R-squared:  0.06132 
## F-statistic:   461 on 1 and 7041 DF,  p-value: < 2.2e-16

Interpretación

El análisis de la relación entre la antigüedad del cliente y los cargos mensuales muestra una pendiente positiva de aproximadamente 0.30, lo que significa que por cada mes adicional de permanencia, el valor de los cargos mensuales aumenta en promedio treinta centavos. Aunque existe una relación lineal positiva entre la antigüedad y los cargos mensuales, esta relación es débil. La mayor parte de las diferencias en los montos pagados por los clientes se debe a otros factores, principalmente los planes y servicios contratados, más que al tiempo que llevan en la compañía.

Panel grafico 4,5,6 y 7

library(gridExtra)

grid.arrange(p4, p5, p6, p7, ncol = 2)
## Warning: Removed 11 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
## `geom_smooth()` using formula = 'y ~ x'