1 ImportaciĂ³n de datos

## 'data.frame':    7043 obs. of  21 variables:
##  $ customerID      : Factor w/ 7043 levels "0002-ORFBO","0003-MKNFE",..: 5376 3963 2565 5536 6512 6552 1003 4771 5605 4535 ...
##  $ gender          : Factor w/ 2 levels "Female","Male": 1 2 2 2 1 1 2 1 1 2 ...
##  $ SeniorCitizen   : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Partner         : Factor w/ 2 levels "No","Yes": 2 1 1 1 1 1 1 1 2 1 ...
##  $ Dependents      : Factor w/ 2 levels "No","Yes": 1 1 1 1 1 1 2 1 1 2 ...
##  $ tenure          : int  1 34 2 45 2 8 22 10 28 62 ...
##  $ PhoneService    : Factor w/ 2 levels "No","Yes": 1 2 2 1 2 2 2 1 2 2 ...
##  $ MultipleLines   : Factor w/ 3 levels "No","No phone service",..: 2 1 1 2 1 3 3 2 3 1 ...
##  $ InternetService : Factor w/ 3 levels "DSL","Fiber optic",..: 1 1 1 1 2 2 2 1 2 1 ...
##  $ OnlineSecurity  : Factor w/ 3 levels "No","No internet service",..: 1 3 3 3 1 1 1 3 1 3 ...
##  $ OnlineBackup    : Factor w/ 3 levels "No","No internet service",..: 3 1 3 1 1 1 3 1 1 3 ...
##  $ DeviceProtection: Factor w/ 3 levels "No","No internet service",..: 1 3 1 3 1 3 1 1 3 1 ...
##  $ TechSupport     : Factor w/ 3 levels "No","No internet service",..: 1 1 1 3 1 1 1 1 3 1 ...
##  $ StreamingTV     : Factor w/ 3 levels "No","No internet service",..: 1 1 1 1 1 3 3 1 3 1 ...
##  $ StreamingMovies : Factor w/ 3 levels "No","No internet service",..: 1 1 1 1 1 3 1 1 3 1 ...
##  $ Contract        : Factor w/ 3 levels "Month-to-month",..: 1 2 1 2 1 1 1 1 1 2 ...
##  $ PaperlessBilling: Factor w/ 2 levels "No","Yes": 2 1 2 1 2 2 2 1 2 1 ...
##  $ PaymentMethod   : Factor w/ 4 levels "Bank transfer (automatic)",..: 3 4 4 1 3 3 2 4 3 1 ...
##  $ MonthlyCharges  : num  29.9 57 53.9 42.3 70.7 ...
##  $ TotalCharges    : num  29.9 1889.5 108.2 1840.8 151.7 ...
##  $ Churn           : Factor w/ 2 levels "No","Yes": 1 1 2 1 2 2 1 1 2 1 ...
##       customerID      gender     SeniorCitizen    Partner    Dependents
##  0002-ORFBO:   1   Female:3488   Min.   :0.0000   No :3641   No :4933  
##  0003-MKNFE:   1   Male  :3555   1st Qu.:0.0000   Yes:3402   Yes:2110  
##  0004-TLHLJ:   1                 Median :0.0000                        
##  0011-IGKFF:   1                 Mean   :0.1621                        
##  0013-EXCHZ:   1                 3rd Qu.:0.0000                        
##  0013-MHZWF:   1                 Max.   :1.0000                        
##  (Other)   :7037                                                       
##      tenure      PhoneService          MultipleLines     InternetService
##  Min.   : 0.00   No : 682     No              :3390   DSL        :2421  
##  1st Qu.: 9.00   Yes:6361     No phone service: 682   Fiber optic:3096  
##  Median :29.00                Yes             :2971   No         :1526  
##  Mean   :32.37                                                          
##  3rd Qu.:55.00                                                          
##  Max.   :72.00                                                          
##                                                                         
##              OnlineSecurity              OnlineBackup 
##  No                 :3498   No                 :3088  
##  No internet service:1526   No internet service:1526  
##  Yes                :2019   Yes                :2429  
##                                                       
##                                                       
##                                                       
##                                                       
##             DeviceProtection              TechSupport  
##  No                 :3095    No                 :3473  
##  No internet service:1526    No internet service:1526  
##  Yes                :2422    Yes                :2044  
##                                                        
##                                                        
##                                                        
##                                                        
##               StreamingTV              StreamingMovies           Contract   
##  No                 :2810   No                 :2785   Month-to-month:3875  
##  No internet service:1526   No internet service:1526   One year      :1473  
##  Yes                :2707   Yes                :2732   Two year      :1695  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  PaperlessBilling                   PaymentMethod  MonthlyCharges  
##  No :2872         Bank transfer (automatic):1544   Min.   : 18.25  
##  Yes:4171         Credit card (automatic)  :1522   1st Qu.: 35.50  
##                   Electronic check         :2365   Median : 70.35  
##                   Mailed check             :1612   Mean   : 64.76  
##                                                    3rd Qu.: 89.85  
##                                                    Max.   :118.75  
##                                                                    
##   TotalCharges    Churn     
##  Min.   :  18.8   No :5174  
##  1st Qu.: 401.4   Yes:1869  
##  Median :1397.5             
##  Mean   :2283.3             
##  3rd Qu.:3794.7             
##  Max.   :8684.8             
##  NA's   :11

2 EstadĂ­sticas descriptivas

##       customerID      gender     SeniorCitizen    Partner    Dependents
##  0002-ORFBO:   1   Female:3488   Min.   :0.0000   No :3641   No :4933  
##  0003-MKNFE:   1   Male  :3555   1st Qu.:0.0000   Yes:3402   Yes:2110  
##  0004-TLHLJ:   1                 Median :0.0000                        
##  0011-IGKFF:   1                 Mean   :0.1621                        
##  0013-EXCHZ:   1                 3rd Qu.:0.0000                        
##  0013-MHZWF:   1                 Max.   :1.0000                        
##  (Other)   :7037                                                       
##      tenure      PhoneService          MultipleLines     InternetService
##  Min.   : 0.00   No : 682     No              :3390   DSL        :2421  
##  1st Qu.: 9.00   Yes:6361     No phone service: 682   Fiber optic:3096  
##  Median :29.00                Yes             :2971   No         :1526  
##  Mean   :32.37                                                          
##  3rd Qu.:55.00                                                          
##  Max.   :72.00                                                          
##                                                                         
##              OnlineSecurity              OnlineBackup 
##  No                 :3498   No                 :3088  
##  No internet service:1526   No internet service:1526  
##  Yes                :2019   Yes                :2429  
##                                                       
##                                                       
##                                                       
##                                                       
##             DeviceProtection              TechSupport  
##  No                 :3095    No                 :3473  
##  No internet service:1526    No internet service:1526  
##  Yes                :2422    Yes                :2044  
##                                                        
##                                                        
##                                                        
##                                                        
##               StreamingTV              StreamingMovies           Contract   
##  No                 :2810   No                 :2785   Month-to-month:3875  
##  No internet service:1526   No internet service:1526   One year      :1473  
##  Yes                :2707   Yes                :2732   Two year      :1695  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  PaperlessBilling                   PaymentMethod  MonthlyCharges  
##  No :2872         Bank transfer (automatic):1544   Min.   : 18.25  
##  Yes:4171         Credit card (automatic)  :1522   1st Qu.: 35.50  
##                   Electronic check         :2365   Median : 70.35  
##                   Mailed check             :1612   Mean   : 64.76  
##                                                    3rd Qu.: 89.85  
##                                                    Max.   :118.75  
##                                                                    
##   TotalCharges    Churn     
##  Min.   :  18.8   No :5174  
##  1st Qu.: 401.4   Yes:1869  
##  Median :1397.5             
##  Mean   :2283.3             
##  3rd Qu.:3794.7             
##  Max.   :8684.8             
##  NA's   :11
## 
## Female   Male 
##   3488   3555
## 
##   No  Yes 
## 5174 1869
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    9.00   29.00   32.37   55.00   72.00
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.25   35.50   70.35   64.76   89.85  118.75
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    18.8   401.4  1397.5  2283.3  3794.7  8684.8      11

Resultados categĂ³ricos:

  • GĂ©nero: 3488 mujeres y 3555 hombres. La distribuciĂ³n es prĂ¡cticamente equilibrada.

  • Fuga (Churn): 5174 clientes no se fugaron y 1869 sĂ­ lo hicieron, lo que representa aproximadamente un 26,5% de fuga. Esto significa que 1 de cada 4 clientes abandona la compañía.

Resultados numéricos:

  • AntigĂ¼edad (tenure):
    Va de 0 a 72 meses, con media de 32,4 y mediana de 29. Esto indica que la mayoría de los clientes ha permanecido entre 2 y 3 años, aunque existe un grupo grande que se va en menos de 1 año.

  • Cargos mensuales (MonthlyCharges):
    VarĂ­an entre 18,25 y 118,75, con media de 64,8 y mediana de 70,4. La diferencia entre media y mediana sugiere que hay mĂ¡s clientes en planes intermedios, pero tambiĂ©n existe una franja importante en planes mĂ¡s costosos.

  • Cargos totales (TotalCharges):
    Van de 18,8 hasta 8684, con media de 2283 y mediana de 1397. La mediana menor que la media muestra que hay outliers de clientes con cargos muy altos (probablemente los mĂ¡s antiguos). AdemĂ¡s, hay 11 valores faltantes (NA’s) que deben revisarse o limpiarse para anĂ¡lisis posteriores.

ConclusiĂ³n: La compañía tiene una clientela equilibrada en gĂ©nero, con gran variabilidad en antigĂ¼edad y costos. Aunque la mayorĂ­a paga entre 30 y 90 al mes, la tasa de fuga del 26% refleja un problema importante de retenciĂ³n.

3 Punto 3 - Matriz de correlaciĂ³n (variables numĂ©ricas)

Observaciones del grĂ¡fico:

  • tenure vs TotalCharges: correlaciĂ³n fuerte y positiva (cĂ­rculo grande y oscuro). Tiene sentido, porque entre mĂ¡s tiempo lleva un cliente, mayor es el monto acumulado en cargos totales.

  • tenure vs MonthlyCharges: correlaciĂ³n muy baja (cĂ­rculo pequeño y claro). Esto indica que el costo mensual no depende del tiempo que lleve el cliente, sino del plan que tenga contratado.

  • MonthlyCharges vs TotalCharges: correlaciĂ³n positiva moderada-alta. Clientes con cargos mensuales mĂ¡s altos tienden a acumular tambiĂ©n cargos totales mĂ¡s altos, aunque no tan fuertemente como tenure con TotalCharges (porque el total depende tanto del plan como del tiempo).

ConclusiĂ³n:
La variable TotalCharges estĂ¡ fuertemente determinada por la antigĂ¼edad del cliente, mientras que MonthlyCharges es mĂ¡s independiente. Esto muestra que el factor clave para el gasto acumulado es cuĂ¡nto tiempo permanece el cliente en la compañía.

4 Boxplot Cargos Mensuales vs RotaciĂ³n

Observaciones del grĂ¡fico:

  • Los clientes que sĂ­ se fugaron tienen en promedio cargos mensuales mĂ¡s altos que los que se quedaron. La mediana en el grupo de los que se fugaron estĂ¡ por encima de 75, mientras que en el grupo de los que se quedaron estĂ¡ alrededor de 65.

  • La dispersiĂ³n tambiĂ©n es mayor en el grupo de fuga, lo que muestra que hay bastante variabilidad entre los clientes que abandonan.

ConclusiĂ³n:
Los clientes con planes mĂ¡s caros tienden a fugarse mĂ¡s que aquellos con planes mĂ¡s econĂ³micos, lo que sugiere que el precio es un factor relevante en la rotaciĂ³n de clientes.

5 Punto 5 - Boxplot Cargos Totales vs RotaciĂ³n

Observaciones del grĂ¡fico:

  • Los clientes que no se fugan presentan cargos totales acumulados mucho mĂ¡s altos en promedio. La mediana en este grupo estĂ¡ cerca de 2000, mientras que en los que sĂ­ se fugan apenas ronda los 1000.

  • Quienes permanecen mĂ¡s tiempo acumulan pagos mayores, mientras que los que se fugan llevan menos tiempo en la empresa.

ConclusiĂ³n: El nivel de cargos totales estĂ¡ fuertemente relacionado con la permanencia. Los clientes que se quedan generan mayor facturaciĂ³n acumulada para la empresa, mientras que los que se fugan suelen hacerlo temprano en la relaciĂ³n comercial.

6 Barras apiladas RotaciĂ³n vs GĂ©nero

Observaciones del grĂ¡fico:

  • La distribuciĂ³n entre hombres y mujeres es muy similar tanto en los clientes que se fugan como en los que se quedan.

ConclusiĂ³n:
El abandono de la compañía afecta a hombres y mujeres de forma parecida. No se observa una relaciĂ³n clara entre el gĂ©nero y la probabilidad de fuga.

7 RelaciĂ³n AntigĂ¼edad vs Cargos Mensuales

## [1] 0.2478999
## 
## Call:
## lm(formula = MonthlyCharges ~ tenure, data = telco)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -57.498 -27.251   6.245  24.943  54.376 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 54.92978    0.57476   95.57   <2e-16 ***
## tenure       0.30372    0.01415   21.47   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 29.15 on 7041 degrees of freedom
## Multiple R-squared:  0.06145,    Adjusted R-squared:  0.06132 
## F-statistic:   461 on 1 and 7041 DF,  p-value: < 2.2e-16

CorrelaciĂ³n: 0.248 indica una relaciĂ³n positiva pero dĂ©bil entre la antigĂ¼edad y los cargos mensuales.

Modelo lineal:

  • Intercepto: 54.93 representa el valor esperado de los cargos mensuales cuando la antigĂ¼edad es 0 meses (clientes nuevos).

  • Pendiente: 0.304 por cada mes adicional de antigĂ¼edad, en promedio el cargo mensual aumenta en 0.30 unidades.

  • R² = 0.061: el modelo explica solo un 6,1% de la variabilidad de los cargos mensuales, lo cual es bajo.

InterpretaciĂ³n del grĂ¡fico:

La nube de puntos muestra una gran dispersiĂ³n: clientes con la misma antigĂ¼edad pueden tener cargos mensuales muy distintos.

  • La recta roja de regresiĂ³n tiene pendiente positiva, confirmando la tendencia general: a mayor tiempo, ligeramente mayores cargos mensuales.

  • Sin embargo, como la correlaciĂ³n es baja, se concluye que la antigĂ¼edad no es un predictor fuerte del cargo mensual.

ConclusiĂ³n:
Aunque estadĂ­sticamente la relaciĂ³n es significativa, en la prĂ¡ctica la influencia de la antigĂ¼edad sobre el cargo mensual es dĂ©bil. Los cargos mensuales dependen mĂ¡s del tipo de plan contratado que del tiempo en la empresa.

8 Panel grĂ¡fico