Telecomunicaciones

La base con la que se trabajará es una base de telecomunicaciones en la cual cada registro es basado en un cliente y sus características particulares sobre los servicios que otorga esta empresa.

La base contiene 21 variables, de las cuales 3 variables son numéricas y las restantes (18) son cualitativas. El número de observaciones es 7043

Las variables son las siguientes:

Ahora, un resumen estadístico sobre las variables cuantitativas:

uniques uniqueness nan mode min max mean median first_qtl third_qtl stddev
tenure 73 1.04 0 1 0.00 72.00 32.37115 29.000 9.00 55.000 24.55948
MonthlyCharges 1,585 22.50 0 20.05 18.25 118.75 64.76169 70.350 35.50 89.850 30.09005
TotalCharges 6,531 92.73 11 20.2 18.80 8,684.80 2,283.30044 1,397.475 401.45 3,794.738 2,266.77136

uniques representa los valores únicos en cada variable, uniqueness es la proporción de valores únicos para cada variable; El importe total cobrado a los clientes (TotalChrages) son los datos más variables. mode es la moda de las variables, min y maxson los valores mínimo y máximo de cada variable, mean es el promedio de cada variable, por lo que el monto total promedio es de 2283.30044 unidades monetarias aunque la mayoría de los clientes sólo ha aportado 20.2 unidades; la razón de esta diferencia es debido a la alta variabilidad que hay entre las cantidades totales que han pagado los usuarios a la compañia; de echo, como se observa en la tabla stddev es la desviación estandar de cada variable, en partícular en la variable TotalChrages se tiene un resultado de 2,266.77136.

Además median es la mediana de cada variable. Por último, first_qtl y third_qtl son el primer y tercer cuantil de cada variable.

La variable nan representa la cantidad de valores perdidos; como vemos hay 11 clientes a los cuales no se le tiene asignado un monto total.

Como se aprecia, la variable TotalCharges es la única donde hay valores perdidos pero aún así tienen algún plazo sobre su contrato, al menos tiene algún tipo de servicio (Internet o Telefónico) y no han abandonado el servicio con la empresa; otra variable a resaltar es que la variable tenure que es el número de meses que el cliente ha permanecido con la compañia tienen valor 0 por lo que se infiere que tienen valores perdidos la variable TotalCharges por que recientemente (menos de un mes) se contrato algún servicio con la empresa y no se ha realizado ningún pago (no ha transcurrido ni un mes) correspondiente al servicio otorgado, al menos hasta el término del estudio.

En un análisis de supervivencia se pueden tener datos donde algunos individuos entraron al estudio cerca del final del periodo de dicho estudio, considerando que estos individuos dan información al análisis, por lo cual no se eliminarán estos datos aunque representen un 0.156% de los datos.

Se imputará el valor 0 a estos valores ya que, por el significado de la variable TotalCharges, se puede interpretar que no han pagado nada a la empresa por concepto de renta de servicios.

Otro punto curioso sobre la base es que existen un 8.70% del total de clientes en la base que tienen el mismo pago mensual por su servicio y la cantidad total pagada a la empresa, por lo que hay 624 clientes de 7043 que no tienen ni dos meses con algún servicio porporcionado por la compañia.

De la misma manera, un análisis rapido para las variables cualitativas:

uniques uniqueness nan mode
customerID 7,043 100.00 0 0002-ORFBO
gender 2 0.03 0 Male
SeniorCitizen 2 0.03 0 0
Partner 2 0.03 0 No
Dependents 2 0.03 0 No
PhoneService 2 0.03 0 Yes
MultipleLines 3 0.04 0 No
InternetService 3 0.04 0 Fiber optic
OnlineSecurity 3 0.04 0 No
OnlineBackup 3 0.04 0 No
DeviceProtection 3 0.04 0 No
TechSupport 3 0.04 0 No
StreamingTV 3 0.04 0 No
StreamingMovies 3 0.04 0 No
Contract 3 0.04 0 Month-to-month
PaperlessBilling 2 0.03 0 Yes
PaymentMethod 4 0.06 0 Electronic check
Churn 2 0.03 0 No

Como se observa, la mayoría de los clientes son de genero masculino, no tienen una pareja, sí tienen servicio telefónico, el internet es de fibra óptica, no tienen servicios “extras”" de internet, pagan mediante cheque electrónico, pagan mes con mes y no han abanadonado la compañía.

Ahora, unas gráficas sobre los datos para tener una representación visual del comportamiento de las variables:

Las lineas negras regresentan las densidades de cada varbiable numérica y el gráfico restante en cada panel es un histográma de cada variable.

Como se puede apreciar, hay una gran tendencia sobre los pagos por pagos pequeños y una menor concentración de pagos altos. Algo interesante que se puede apreciar en la gráfica correspondiente a la variable Tenure es que en las cantidades extremas de los meses (el menor y el mayor número de meses) es donde existe una mayor cantidad de personas, por lo que una gran cantidad de clientes entra a la compañía y otra cuando se tienen más de 60 meses con algún servicio proporcionado por la compañia.

En cuanto a la distribución de los generos de los clientes sobre la base, se tienen cantidades similares entre ellos, por lo que no hay una preferencia de algún genero con la empresa. Se tiene una gran cantidad de personas jovenes que contraran algún servicio con la empresa.

Es curioso ver que la mayoría de clientes que no han dejado de tener algún servicio con la empresa tienen pareja y la mayoría de las personas que han dejado de tener algún servicio con la empresa no tienen pareja.

Gracias las gráficas anteriores, el 65% de los clientes que no han dejado la empresa, no tienen alguna persona dependiente de ellas como un hijo, sus padres, etc. Para los clientes que han dejado la empresa, aproximadamente un 83% de las personas no tienen alguna persona dependiente. Esto hace ver que los clientes se quedan o no con algún servicio de la empresa solo por tener alguna persona que necesite de el economicamente.

Ahora, recordando que los servicios principales que ofrece la empresa son servicio de internet y servicio de telefonía, se aprecia que la mayoría de clientes tiene servicio telefónico y que aquellos que cuentan con este servicio, la mayoría no tienen más de una linea telefónica.

El anterior parrrafo hace referencia a todos los clientes sin importar si salieron o no de la empresa, por lo que en la siguiente gráfica ya se aprecia esta relación incluyendo tambíen el servicio de internet

Para los clientes que se han ido de la empresa, existen datos en que, algunos no tenía servicio de internet, o servicio de telefonía ya que se tiene al menos un servicio cuando se tiene algún contrato con la empresa, en caso contrario, los datos son truncados.

La mayoría de los usuarios que estan con de la empresa tiene servicio telefónico y aquellos que tienen servicio de internet, la mayoría tienen un internet tipo DSL.

Cabe resaltar que, de los usuarios que han dejado la empresa, la mayoría tiene servicio de fibra óptica, lo que da paso a pensar que posiblemente, el servicio de fibra óptica de la empresa debería mejorar, esto se complemente con el hecho de que los usuarios que tienen servicio de internet, la minoría tiene servicio de fibra óptica.

Con el servicio de internet se tienen algunos servicios extras

Los servicios extra como Seguridad en linea, Servicio de respaldo de información, Protección a dispositivos y soporte técnico, no son adquiridos por la mayoría de los usuarios que contraran algún servicio de internet; el servicio extra, entre los listados, que más contraran los usuarios es el servicio de Backup.

Estos servicios no varían en proporciones sobre el tipo de servicio de internet que se contrate sobre el internet tipo DSL, en cuanto al servicio de fibra óptica, la mayoría de los usuario que tienen internet prefieren no contratar el servicio de seguridad en linea ni el soporte técnico; esto da mayor importancia cuando la mayoría de usuarios que salieron de la empresa y tenía un contrato con servicio de internet, tenía servicio de fibre óptica.

Además de los anteriores servicios, como se vio en la descripción de los datos, existen otros servicios extra pero que estan relacionados con servicios de Streeming cuando se tiene algún servicio de internet

Los usuarios no muestran tendencia a elegir un servicio de streaming o no. De echo, esto mismo sucede con los usuarios que han permanecido con la empresa y los que se han ido.

En cuanto a las demás combinaciones entre el tipo de servicio de internet y si tienen o no un servicio extra, se tienen los siguientes resultados donde se muestra la proporción de usuarios que tienen un servicio extra en específico y que tienen internet.

En general, los usuarios prefieren no tener un servicio extra de internet excepto que sea un servicio de Streaming si se tiene un servicio de fibra óptica.

¿Cuentan con el Servicio? Fibra óptica DSL
Online Security 27.1% 48.7%
No 72.9% 51.3%
Online Backup 43.4% 44.9%
No 56.6% 551.%
Device Protection 43.8% 44%
No 56.2% 56%
Tech Support 28% 48.7%
No 72.2% 51.3%
Streaming TV 56.5% 39.5%
No 43.% 60.5%
Streaming Movies 56.6% 40.5%
No 43.4% 59.5%

Finalizamos este análisis exploratorio de las variables con las variables restantes y su comportamiento con la salida o permanencia de la empresa.

Los usuarios prefieren tener servicio de facturación electrónica y contratos mes a mes.

Y los clientes prefieren pagar con un envío de cheque y para aquellos que han dejado la empresa, la mayoría pagaba con cheque electrónico.

Análisis de Supervivencia

Para un análisis de supervivencia en esta base de datos, se tomará para el tiempo en el que suceden los eventos la variable tenure ya que está variable es la que nos indica hasta que tiempo (en meses) los usuarios estuvieron con la empresa.

Otra variable que se se usará bastante es la variable churn ya que está es la variable objetivo que nos inidica cuando un cliente ha dejado la empresa, lo cual se buscará evitar.

La variable Churn contiene dos valores: “Yes” y “No” los cuales, se considerará que el evento de interes (salida de la empresa) sucedio si se tiene el valor “Yes” y aquellos clientes que no han dejado de tener algún tipo de servicio con la empresa se considerarán como eventos censurados (el tiempo de tenure para estos clientes se considerará censurado), es decir, que no sucedio el evento de interés pero llegarón hasta el termino del estudio.

Lo anterior es una gráfica de la función de supervivencia estimada por el método de Kaplan Meier sobre los datos proporcionados (el tiempo y los datos de muerte y censura, tenure y Churn respectivamente) sin considerar alguna estratificación con alguna característica que tengan los usuarios y con intervalos de confianza al 95%.

Como se puede apreciar, el comportamiendo es suave en la curva a medida que avanza el tiempo, pero cuando se llega a los 72 meses, se tiene una proababilidad del 59.3% de que el cliente permanezca más tiempo en la empresa del que ya se ha logrado.

Recordemos, por las primeras gráficas, que los meses donde existen las mayorías de personas es en los meses extremos del estudio, en particular, en el primer mes; del primer mes se tiene una probabilidad de llegar a más de ese mes del 100%, la probabilidad de llegar a más de dos meses es del 94.59613%. Este cambio en la transición de los meses es la más drástica de acuerdo a los datos proporcionados.

Pero, con esta metodología para estimar la permanencia en la empresa, ¿Cómo se ve el riesgo a medida que aumentan los meses?

El comportamiento del riesgo acumulado, como se menciono antes, es más drástico en los primeros meses, después en los últimos meses el riesgo a que un cliente no desee estar con la empresa aumenta.

Es decir, con los datos obtenidos, 54 meses es el tiempo promedio que permanece un cliente con la empresa

Ahora, se verá si existe algun comportamiento distinto considerando las características que pueden tener los usuarios o los contratos a los que estan ligados.

La gráfica superior hace referencia a la supervivencia considerando si se tiene o no una pareja y la inferior si se tiene o no dependientes.

El comportamiento con estas dos gráficas es similar, pero si se observa con detenimiento, la probabilidad de permanecer con la empresa si se tiene pareja o no, es mayor, en cada caso correspondiente a tener o no personas dependientes. Es decir, si el usuario tiene pareja, es más probable que, a medida que transcurre el tiempo, la probablidad de permanecer en la empresa sea más baja en comparación de tener un hijo o alguna otra persona que dependa del usuario.

Aunque en ambos casos, se tiene una mayor probabilidad de mantener un contrato con la empresa si no se tiene pareja o si no se tiene alguna persona dependiente del usuario.

Las gráficas correspondientes cuando se considera si es mayor de edad y tiene servicio de facturación electrónica el usuario son similares, en primer caso, la probabilidad de permanecer en la empresa disminuye si el usuario es no considerado como una persona joven y si el usuario no tiene el servicio de facturación elerctrónica, sube la probabilidad de permanencia.

Para estas y las demás funciones de supervivencia, se realizará la prueba de Log-Rank para determinar si es significativa la segmentación que se propone al considerar características de los usuarios o los servicios a los que los usuarios estan sujetos

## Call:
## survdiff(formula = Surv(tenure, Churn) ~ Partner, data = Telecom, 
##     rho = 0)
## 
##                N Observed Expected (O-E)^2/E (O-E)^2/V
## Partner=No  3641     1200      773       236       424
## Partner=Yes 3402      669     1096       166       424
## 
##  Chisq= 424  on 1 degrees of freedom, p= <2e-16
## Call:
## survdiff(formula = Surv(tenure, Churn) ~ Dependents, data = Telecom, 
##     rho = 0)
## 
##                   N Observed Expected (O-E)^2/E (O-E)^2/V
## Dependents=No  4933     1543     1234      77.3       233
## Dependents=Yes 2110      326      635     150.3       233
## 
##  Chisq= 233  on 1 degrees of freedom, p= <2e-16

Algo curioso sucede cuando se considera como valor de estratificación la variable de servicio telefónico.

La gráfica muestra que la probabilidad de salir o permanecer con la empresa si se tiene servicio telefónico es muy similar, por lo que esta variable debería ser una de las que la empresa no debería enfocarse tanto si quiere aumentar el número de clientes que permanecen con ella.

Realizando la prueba estadística Log-Rank

## Call:
## survdiff(formula = Surv(tenure, Churn) ~ PhoneService, data = Telecom, 
##     rho = 0)
## 
##                     N Observed Expected (O-E)^2/E (O-E)^2/V
## PhoneService=No   682      170      178    0.3828     0.431
## PhoneService=Yes 6361     1699     1691    0.0404     0.431
## 
##  Chisq= 0.4  on 1 degrees of freedom, p= 0.5

Se comprueba que las curvas de supervivencia, segmentando la información por la opción de tener o no servicio telefónico, no son diferentes, por lo que, realmente, no existe una distintción entre tener o no este servicio en particular.

Ahora, con el servicio de internet y los sevicios extra que estos pueden otorgar pasa algo diferente.

Estadísticamente, hacer esta segmentación hace que las curvas de supervivencia sean distintas entre ellas, o al menos no se tiene la evidencia para asegurar que las funciones de supervivencia son iguales entre ellas.

## Call:
## survdiff(formula = Surv(tenure, Churn) ~ InternetService, data = Telecom, 
##     rho = 0)
## 
##                                N Observed Expected (O-E)^2/E (O-E)^2/V
## InternetService=DSL         2421      459      649      55.4      86.4
## InternetService=Fiber optic 3096     1297      832     260.1     477.1
## InternetService=No          1526      113      388     195.4     251.2
## 
##  Chisq= 520  on 2 degrees of freedom, p= <2e-16

Al contrario de contar o no con un servicio telefónico, tener o no internet si afecta considerablemente las probabilidades de permanecer con la empresa, de echo, no tener servicio de internet es el mejor escenario en el que se tiene la menor probabilidad de irse de la empresa a medidad que aumenta el tiempo. Esta probabilidad de dejar la empresa aumenta si se tiene DSL como tipo de internet y aún peor, aumenta si se tiene un internet de fibra óptica hasta un 41.7% de probabilidad de permanecer con la empresa despúes de 72 meses.

Esto sustenta mejor las gráficas que se obtuvieron en el análisis exploratorio, ya que la mayoría de usuarios que ya no tenián algún servicio con la empresa, si habían tenido internet, este erá de fibra óptica.

Para los servicios extra, afecta más no tener estos que no tener internet.

Como se aprecia, en todas las gráficas de supervivencia estimadas mediante el método de Kaplan Meier, se tiene que no tener servicio de internet, la probabilidad de permanecer con la empresa es más alta que contar con cualquier tipo de internet y con algún servicio extra; pero, al tener internet, no contar con algún servicio extra aumenta considerablemente la probabilidad de salida de los usuarios con la empresa.

El pero caso es cuando no se tiene el servicio de Seguridad en linea, ya que la probabilidad de permanecer más de 72 meses es del 33%.

De echo, en las siguientes gráficas se ve como la cantidad de usuarios que no tenían algún tipo de servicio extra son mayores que los que tenían algún servicio extra de internet, al ya no estar en la empresa.

Como se mostro anteriormente, parece que al no tener internet, los usuarios permanencen más tiempo con la empresa; esto mismo sucede también con los servicios Streaming y al no contar con estos servicios extra, también aumenta esta probabilidad en el riesgo de no renovar contrato con la empresa.

Por la prueba Log-Rank, todas las segmentaciones son significativas, a continuación se muestra solo uno de los resultados de esta prueba, las demás son equivalentes obteniendo cada una un p-value de 2e-16, es decir, una probabilidad muy baja que hace posible rechazar la hipótesis nula en la prueba de Log-Rank; esta prueba de hipótesis, en su hipotesis nula dice que las curvas de supervivencia son equivalentes entre ellas para todos los tiempos del estudio; la otra hipótesis rechaza lo anterior haciendo que, al menos para algún tiempo, en al menos dos curvas, estas no son equivalentes.

## Call:
## survdiff(formula = Surv(tenure, Churn) ~ TechSupport, data = Telecom, 
##     rho = 0)
## 
##                                    N Observed Expected (O-E)^2/E (O-E)^2/V
## TechSupport=No                  3473     1446      788       549       985
## TechSupport=No internet service 1526      113      388       195       251
## TechSupport=Yes                 2044      310      692       211       349
## 
##  Chisq= 990  on 2 degrees of freedom, p= <2e-16

Como en el caso anterior de los demás servicios de internet, esta segmentación hace que no se tenga evidencia para decir que las curvas de supervivencia son equivalentes entre ellas; se muestra a continuación para el caso de StreamingTV, para StreamingMovies se tienen resultados equivalentes en el rechazo de la hipótesis nula.

## Call:
## survdiff(formula = Surv(tenure, Churn) ~ StreamingTV, data = Telecom, 
##     rho = 0)
## 
##                                    N Observed Expected (O-E)^2/E (O-E)^2/V
## StreamingTV=No                  2810      942      624    162.47    252.07
## StreamingTV=No internet service 1526      113      388    195.36    251.20
## StreamingTV=Yes                 2707      814      857      2.14      4.09
## 
##  Chisq= 368  on 2 degrees of freedom, p= <2e-16

Finalmente, ¿Cómo es el comportamiento con el tipo de contrato?

Esta curva es interesante, ya que el aumento en el contrato, aumenta la probabilidad de permanencia con la empresa lo cual tiene mucho sentido al considerar como medición del tiempo los meses.

Cabe resaltar que, con esta estratificación, se obtiene un caso donde se tiene la menor probabilidad de supervivencia que considerando cualquier otra covariable, en este caso tener un contrato de temporalidad un mes, las probabilidad de retirarse de la empresa después de 72 meses es muy alta.

Considerando que el tiempo máximo que se tiene registrado son 72 meses, lo que son 6 años, solo se tiene oportunidad de tener 3 contratos de 2 años de servicio, aún así, por las primeras gráficas, estos útlimos meses tienen una gran concentración de clientes.

## Call:
## survdiff(formula = Surv(tenure, Churn) ~ Contract, data = Telecom, 
##     rho = 0)
## 
##                            N Observed Expected (O-E)^2/E (O-E)^2/V
## Contract=Month-to-month 3875     1655      708      1265      2304
## Contract=One year       1473      166      471       197       270
## Contract=Two year       1695       48      690       597      1061
## 
##  Chisq= 2353  on 2 degrees of freedom, p= <2e-16

Estadísticamente, el tipo de contrato logra hacer que se tenga una buena segmentación de la información.

Otro tipo de modelación estadística que se utilizará para estos datos es mediante modelos de riesgos proporcionales de Cox

El modelo propuesto, después de realizar varias maneras posibles, se obtiene de los siguientes resultados para el modelo propuesto final.

\[h(t|X) = h_0(t)*(0.06661*\mbox{Se tiene seguridad Online}+0.48889 *\mbox{Tiene servicio Online Backup}\]

\[+0.63188 *\mbox{Se tiene servicio técnico}+0.78314*\mbox{Se tiene servicio de películas}+0.95856*\mbox{El pago es mediante tarjeta}\] \[+ 1.90068*\mbox{El pago es mediante cheque electrónico}+1.80699*\mbox{Se paga mediante envio de cheque}+0.56830*\mbox{Se tiene pareja}\]

\[+1.26946*\mbox{Se tiene servicio de internet de fibra óptica}+0.21368*\mbox{Contrato por un año}+0.05136*\mbox{Contrato por dos años})\] donde \(h_0(t)\) es la función de riesgo base.

Las pruebas de significancia de las variables tomadas se muestran a continuación

## Call:
## coxph(formula = Surv(tenure, Churn) ~ I(OnlineSecurity) + I(OnlineBackup) + 
##     I(TechSupport) + I(StreamingMovies) + I(PaymentMethod) + 
##     I(Partner) + I(InternetService) + I(Contract), data = Telecom %>% 
##     filter(OnlineBackup != "No internet service"))
## 
##   n= 5517, number of events= 1756 
## 
##                                             coef exp(coef) se(coef)
## I(OnlineSecurity)Yes                    -0.68791   0.50262  0.06661
## I(OnlineBackup)Yes                      -0.71561   0.48889  0.05476
## I(TechSupport)Yes                       -0.45906   0.63188  0.06539
## I(StreamingMovies)Yes                   -0.24444   0.78314  0.05075
## I(PaymentMethod)Credit card (automatic) -0.04232   0.95856  0.09310
## I(PaymentMethod)Electronic check         0.64221   1.90068  0.07297
## I(PaymentMethod)Mailed check             0.59166   1.80699  0.09431
## I(Partner)Yes                           -0.56510   0.56830  0.05167
## I(InternetService)Fiber optic            0.23859   1.26946  0.05802
## I(Contract)One year                     -1.54326   0.21368  0.08963
## I(Contract)Two year                     -2.96899   0.05136  0.17297
##                                               z Pr(>|z|)    
## I(OnlineSecurity)Yes                    -10.328  < 2e-16 ***
## I(OnlineBackup)Yes                      -13.069  < 2e-16 ***
## I(TechSupport)Yes                        -7.021 2.21e-12 ***
## I(StreamingMovies)Yes                    -4.817 1.46e-06 ***
## I(PaymentMethod)Credit card (automatic)  -0.455    0.649    
## I(PaymentMethod)Electronic check          8.801  < 2e-16 ***
## I(PaymentMethod)Mailed check              6.274 3.53e-10 ***
## I(Partner)Yes                           -10.937  < 2e-16 ***
## I(InternetService)Fiber optic             4.112 3.92e-05 ***
## I(Contract)One year                     -17.218  < 2e-16 ***
## I(Contract)Two year                     -17.165  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##                                         exp(coef) exp(-coef) lower .95
## I(OnlineSecurity)Yes                      0.50262     1.9896   0.44111
## I(OnlineBackup)Yes                        0.48889     2.0454   0.43914
## I(TechSupport)Yes                         0.63188     1.5826   0.55587
## I(StreamingMovies)Yes                     0.78314     1.2769   0.70900
## I(PaymentMethod)Credit card (automatic)   0.95856     1.0432   0.79868
## I(PaymentMethod)Electronic check          1.90068     0.5261   1.64739
## I(PaymentMethod)Mailed check              1.80699     0.5534   1.50203
## I(Partner)Yes                             0.56830     1.7596   0.51357
## I(InternetService)Fiber optic             1.26946     0.7877   1.13300
## I(Contract)One year                       0.21368     4.6798   0.17926
## I(Contract)Two year                       0.05136    19.4723   0.03659
##                                         upper .95
## I(OnlineSecurity)Yes                      0.57272
## I(OnlineBackup)Yes                        0.54428
## I(TechSupport)Yes                         0.71827
## I(StreamingMovies)Yes                     0.86504
## I(PaymentMethod)Credit card (automatic)   1.15045
## I(PaymentMethod)Electronic check          2.19291
## I(PaymentMethod)Mailed check              2.17387
## I(Partner)Yes                             0.62887
## I(InternetService)Fiber optic             1.42235
## I(Contract)One year                       0.25472
## I(Contract)Two year                       0.07208
## 
## Concordance= 0.847  (se = 0.008 )
## Rsquare= 0.402   (max possible= 0.994 )
## Likelihood ratio test= 2832  on 11 df,   p=<2e-16
## Wald test            = 1662  on 11 df,   p=<2e-16
## Score (logrank) test = 2401  on 11 df,   p=<2e-16

Conclusiones

Gracias a todo lo que se expuesto en este trabajo, se tienen algunas variables que deben ser consideradas con mayor fuerza que otras para que se tenga la mayor retención de clientes; entre las variables que puede prestar menor atención es en el servicio telefónico, si son mayores de edad y el genero del usuario. Por otro lado, las variables donde se debe tener mayor interes es sobre los derivados al servicio de internet y el mismo servicio, posiblemente mejorar el servicio de internet con fibra óptica y otorgar más beneficios por el servicio de internet, ya que, entre más servicios extra de internet se tengan, menor será la probabilidad de abandonar la empresa.

Otro punto a considerar, si se desea tener a clientes por más tiempo, como es obvio, es hacer contratos con un periodo de pago más largo como lo es a dos años.