Objetivo del análisis

El objetivo del análisis es identificar los clientes con mayor probabilidad de abandonar el servicio y reconocer los factores comerciales asociados al churn, con el fin de orientar acciones de retención más focalizadas.

El reporte busca responder tres preguntas de negocio: qué tan alto es el churn observado, en qué segmentos se concentra el mayor riesgo y qué clientes deberían priorizarse para una intervención comercial.

Conclusiones ejecutivas

Uno de cada cuatro clientes abandonó el servicio.

El riesgo de abandono se concentra especialmente en clientes con baja antigüedad, contrato mensual, servicio de fibra óptica, método de pago Electronic check y cargos mensuales medios o altos.

Estos patrones permiten orientar las acciones comerciales hacia segmentos con mayor probabilidad de abandono.

La recomendación principal es usar el scoring de churn como herramienta de priorización comercial, empezando por los clientes con mayor probabilidad estimada de abandono y complementando el modelo con criterios de valor económico, costo de intervención y capacidad operativa de la campaña.

Calidad de la información

Antes de estimar los modelos se inspeccionó la calidad de los datos para identificar registros repetidos, valores perdidos, valores fuera de rango, valores extremos y posibles saltos no graduales en las variables numéricas incluidas en el análisis.

Depuración inicial de la base
Indicador Valor
Registros eliminados por TotalCharges perdido 11
Porcentaje eliminado 0.16%
Clientes conservados para el análisis 7032

La variable TotalCharges presentó 11 valores perdidos, equivalentes al 0,16 % de la base. Dado que la proporción es muy baja, se eliminaron esos registros antes de continuar con el análisis. La base depurada conserva 7.032 clientes.

Además de esta depuración, se revisó la estructura general de los datos, la presencia de valores perdidos, la posible existencia de valores fuera de rango y el comportamiento de las variables numéricas en términos de gradualidad. Esta revisión permite separar el control de calidad de la formulación de objetivos y deja explícito que la modelización se realizó sobre una base inspeccionada antes del entrenamiento de los modelos.

Panorama general de la base depurada
Indicador Valor
Clientes analizados 7032
Variables disponibles 21
Clientes con churn 1869
Tasa general de churn 26.6%
Cargo mensual promedio $64.8
Antigüedad promedio 32.4 meses

La base depurada conserva 7.032 clientes y permite trabajar con una cartera suficientemente amplia para el análisis de churn. La tasa general de abandono es de 26,6 %, lo que indica que cerca de uno de cada cuatro clientes ha dejado el servicio. Este valor debe tomarse como línea base para comparar segmentos: los grupos con tasas superiores a este nivel serán los principales candidatos para acciones de retención.

El cargo mensual promedio es de $64,8 y la antigüedad promedio es de 32,4 meses. Esto sugiere una cartera con clientes de permanencia intermedia, aunque el promedio puede ocultar diferencias relevantes entre clientes nuevos y antiguos. Por esa razón, el siguiente paso debe ser revisar cómo cambia el churn según la antigüedad, el tipo de contrato y los servicios contratados.

Magnitud del churn

La tasa general de churn permite establecer la línea base del análisis. A partir de este valor se compararán los segmentos de clientes para identificar grupos con riesgo superior al promedio.

El churn observado es de 26,6 %. En términos de negocio, esto significa que la empresa perdió 1.869 clientes dentro de la base analizada. La magnitud del abandono justifica pasar de una lectura descriptiva a una estrategia de priorización: identificar qué segmentos concentran el riesgo y qué clientes deberían recibir primero una acción de retención.

La tasa general de churn es el porcentaje total de clientes que abandonaron el servicio en la base analizada. En este caso, 1.869 de los 7.032 clientes depurados registran abandono, lo que equivale a una tasa general de churn de 26,6 %. Esta tasa funciona como línea base para comparar segmentos: los grupos con valores superiores al 26,6 % presentan un riesgo de abandono mayor al observado en la cartera total.

Churn por tipo de contrato

El tipo de contrato permite observar si el abandono se concentra en clientes con menor compromiso contractual. Esta lectura es útil para definir estrategias diferenciadas de retención, fidelización y migración hacia planes de mayor permanencia.

El tipo de contrato muestra una diferencia clara en el riesgo de abandono. Los clientes con contratos mensuales presentan la mayor tasa de churn, por encima de la línea base general. En contraste, los contratos de uno y dos años muestran niveles de abandono menores, lo que sugiere que la permanencia contractual funciona como una señal fuerte de estabilidad del cliente.

Desde una perspectiva comercial, este hallazgo apunta a dos frentes: intervenir de forma temprana a los clientes con contrato mensual y diseñar incentivos para migrar hacia modalidades contractuales de mayor permanencia.

# Churn por antigüedad del cliente

La antigüedad permite identificar en qué momento de la relación comercial se concentra el abandono. Esta lectura ayuda a diferenciar acciones de bienvenida, acompañamiento temprano, fidelización y recuperación de clientes en riesgo.

La antigüedad del cliente muestra una relación clara con el churn. En los primeros 12 meses, la tasa de abandono alcanza 47,7 %, casi el doble de la tasa general de la base, que es 26,6 %. Entre los 13 y 24 meses el churn baja a 28,7 %, todavía ligeramente por encima del nivel general.

A partir de los 25 meses, el riesgo cae por debajo de la línea base. Los clientes con 25 a 48 meses presentan una tasa de churn de 20,4 %, y quienes tienen 49 meses o más registran 9,5 %. Esto sugiere que el abandono se concentra en la etapa temprana de la relación comercial. Desde una perspectiva de negocio, las acciones de retención deberían priorizar los primeros 24 meses, con especial atención al primer año.

Churn por tipo de servicio de internet

El tipo de servicio de internet permite observar si el abandono se concentra en determinados productos. Esta lectura es útil para revisar la propuesta de valor, la experiencia de servicio y los segmentos donde puede ser necesario reforzar la retención.

El tipo de servicio de internet muestra una diferencia marcada en el churn. Los clientes con fibra óptica presentan una tasa de abandono de 41,9 %, muy por encima de la tasa general de la base, que es 26,6 %. En contraste, los clientes con DSL registran una tasa de 19,0 %, y quienes no tienen servicio de internet presentan una tasa de 7,4 %.

Este resultado no debe interpretarse de inmediato como un problema técnico de la fibra óptica. También puede reflejar diferencias en precio, expectativas del cliente, competencia comercial o perfil de quienes contratan este servicio. Desde una perspectiva de negocio, la fibra óptica aparece como un segmento prioritario para investigar experiencia de servicio, sensibilidad al precio y razones específicas de abandono.

# Churn por método de pago

El método de pago puede reflejar diferencias en fricción operativa, automatización del cobro y perfil del cliente. Esta lectura ayuda a identificar si ciertos medios de pago concentran mayor riesgo de abandono.

El método de pago muestra una diferencia sustantiva en el riesgo de abandono. Los clientes que pagan mediante Electronic check presentan una tasa de churn de 45,3 %, muy por encima de la tasa general de la base, que es 26,6 %. En los demás métodos de pago, las tasas son claramente menores: 19,2 % en Mailed check, 16,7 % en transferencia bancaria automática y 15,3 % en tarjeta de crédito automática.

Este patrón sugiere que el pago electrónico no automático concentra un grupo de clientes más vulnerable al abandono. Desde una perspectiva de negocio, conviene revisar si este método de pago está asociado a menor vinculación contractual, menor antigüedad, mayor sensibilidad al precio o menor adopción de pagos automáticos. Una acción práctica sería promover la migración hacia medios automáticos de pago, acompañada de beneficios de permanencia o reducción de fricción en el cobro.

Churn por nivel de cargo mensual

El cargo mensual permite evaluar si el abandono se concentra en clientes con mayor valor de factura. Esta lectura es relevante porque el churn en clientes de mayor cargo mensual puede representar mayor pérdida potencial de ingresos.

El cargo mensual muestra un patrón relevante para la gestión comercial. La tasa de churn es baja en los clientes con cargo mensual bajo, 11,3 %, y aumenta en los grupos de mayor facturación. En el grupo de cargo medio alto, con un cargo mensual promedio de $80,3, el churn alcanza 37,5 %, muy por encima de la tasa general de 26,6 %. En el grupo de cargo alto, con un cargo mensual promedio de $100,9, la tasa se mantiene elevada, 32,9 %.

El hallazgo sugiere que el abandono no solo debe medirse por cantidad de clientes, sino también por valor económico potencial. Los clientes con cargos mensuales medios y altos combinan mayor riesgo de abandono y mayor impacto sobre ingresos recurrentes. Estos segmentos deberían ser prioritarios para acciones de retención, revisión de precios, beneficios asociados al plan y mejora de la experiencia de servicio.

Base preparada para modelización
indicador valor
Registros para modelización 7032
Variables predictoras 19
Variable objetivo Churn
Variables con mayor separación preliminar de la tasa de churn
Variable Tipo Tasa mínima Tasa máxima Brecha Grupo de mayor riesgo Clientes en grupo Churn del grupo
tenure Numérica agrupada en cuartiles 7.8% 50.7% 42.9 pp Cuartil 1: valores bajos 1758 50.7%
Contract Categórica 2.8% 42.7% 39.9 pp Month-to-month 3875 42.7%
InternetService Categórica 7.4% 41.9% 34.5 pp Fiber optic 3096 41.9%
OnlineSecurity Categórica 7.4% 41.8% 34.3 pp No 3497 41.8%
TechSupport Categórica 7.4% 41.6% 34.2 pp No 3472 41.6%
OnlineBackup Categórica 7.4% 39.9% 32.5 pp No 3087 39.9%
DeviceProtection Categórica 7.4% 39.1% 31.7 pp No 3094 39.1%
PaymentMethod Categórica 15.3% 45.3% 30 pp Electronic check 2365 45.3%
TotalCharges Numérica agrupada en cuartiles 14.5% 43.5% 29 pp Cuartil 1: valores bajos 1758 43.5%
StreamingMovies Categórica 7.4% 33.7% 26.3 pp No 2781 33.7%
MonthlyCharges Numérica agrupada en cuartiles 11.3% 37.5% 26.2 pp Cuartil 3 1758 37.5%
StreamingTV Categórica 7.4% 33.5% 26.1 pp No 2809 33.5%
PaperlessBilling Categórica 16.4% 33.6% 17.2 pp Yes 4168 33.6%
Dependents Categórica 15.5% 31.3% 15.7 pp No 4933 31.3%
Partner Categórica 19.7% 33% 13.3 pp No 3639 33%
SeniorCitizen Numérica agrupada en cuartiles 22.6% 35.6% 13 pp Cuartil 4: valores altos 1758 35.6%
MultipleLines Categórica 25% 28.6% 3.6 pp Yes 2967 28.6%
PhoneService Categórica 25% 26.7% 1.7 pp Yes 6352 26.7%
gender Categórica 26.2% 27% 0.8 pp Female 3483 27%

La exploración preliminar muestra que el churn no se distribuye de manera homogénea en la cartera. Las mayores brechas aparecen en variables que expresan permanencia, compromiso contractual y configuración del servicio. La antigüedad del cliente es la señal con mayor separación: en el cuartil de menor tenure, la tasa de churn alcanza 50,7 %, mientras que en el grupo de menor riesgo baja a 7,8 %. Esto indica que el abandono temprano es uno de los focos principales del problema.

El tipo de contrato también muestra una diferencia sustantiva. Los clientes con contrato mensual presentan una tasa de churn de 42,7 %, frente a una tasa mínima de 2,8 % en otros tipos de contrato. Esta brecha de 39,9 puntos porcentuales sugiere que la permanencia contractual es una señal fuerte para anticipar abandono.

También aparecen como señales relevantes el servicio de fibra óptica, la ausencia de servicios complementarios como OnlineSecurity, TechSupport, OnlineBackup y DeviceProtection, y el método de pago Electronic check. Estas variables no deben interpretarse todavía como causas del churn, pero sí como indicios útiles para el modelo predictivo y para la lectura de negocio.

En contraste, variables como gender, PhoneService y MultipleLines muestran brechas pequeñas, por lo que parecen aportar menor capacidad de segmentación preliminar. Esta lectura ayuda a enfocar el modelo en señales comercialmente relevantes y evita extender el reporte con descripciones variable por variable.

Variables con mayor separación preliminar

La brecha de churn resume cuánto cambia la tasa de abandono dentro de cada variable. Una brecha alta indica que la variable separa mejor grupos de mayor y menor riesgo, por lo que puede aportar información útil al modelo predictivo.

La brecha de churn permite identificar qué variables separan mejor grupos con distinto nivel de riesgo. Las mayores diferencias aparecen en tenure, Contract, InternetService y servicios complementarios como OnlineSecurity y TechSupport.

Por ejemplo, en InternetService, la brecha corresponde a la diferencia entre el grupo con mayor churn, Fiber optic, y el grupo con menor churn. Esta lectura ayuda a reconocer señales preliminares que el modelo predictivo puede usar para ordenar clientes según su probabilidad de abandono.

Separación entre entrenamiento y prueba

La base se divide en dos conjuntos. El 70 % de los registros se usa para entrenar el modelo y el 30 % restante para evaluar su desempeño. Esta separación permite estimar mejor cómo podría comportarse el modelo ante clientes no observados durante el entrenamiento.

Separación de la base para modelización
conjunto registros tasa_churn
Entrenamiento 4924 26.6%
Prueba 2108 26.6%
Comparación de modelos predictivos en la base de prueba
modelo AUC Accuracy Precision Cobertura Especificidad
Regresión logística 0.856 81.4% 67% 59.1% 89.5%
Random Forest 0.850 80.2% 73.4% 39.8% 94.8%
Árbol de decisión 0.810 79.7% 64.3% 53% 89.3%

La comparación de modelos muestra que la regresión logística obtiene el mejor desempeño general en la base de prueba. Su AUC es 0,856, superior al de Random Forest, 0,850, y al del árbol de decisión, 0,810. Esto indica que la regresión logística tiene la mejor capacidad para ordenar clientes según su probabilidad de churn.

Además, la regresión logística presenta una combinación más equilibrada entre precisión y cobertura. Con el umbral estándar de 0,50, alcanza una precisión de 67,0 % y una cobertura de 59,1 %. Random Forest logra mayor precisión, 73,4 %, pero reduce mucho la cobertura, 39,8 %. Esto significa que Random Forest es más conservador: acierta más entre los clientes que clasifica como churn, pero deja sin detectar una proporción mayor de clientes que efectivamente abandonan.

Para una estrategia de retención, la regresión logística es el mejor modelo inicial en este benchmark. Tiene el mayor AUC, mejor cobertura que Random Forest y una precisión prácticamente equivalente a la del primer modelo Random Forest evaluado. Además, ofrece mayor interpretabilidad, lo cual es útil para explicar resultados a equipos comerciales y directivos.

A partir del benchmark, el modelo recomendado para continuar el análisis es la regresión logística. Random Forest se conserva como modelo comparativo, pero no como modelo principal.

Evaluación de umbrales para el modelo recomendado

Dado que la regresión logística obtuvo el mejor desempeño general en el benchmark, se evalúan distintos umbrales de decisión para este modelo. El objetivo es definir un punto de corte adecuado para una estrategia de retención, equilibrando precisión y cobertura.

Desempeño de la regresión logística según umbral de decisión
umbral precision cobertura especificidad f1
0.10 40.4% 94.8% 49.5% 0.567
0.15 43.9% 93% 57% 0.597
0.20 46.8% 88.8% 63.4% 0.612
0.25 50.5% 83.2% 70.5% 0.628
0.30 53.9% 79.1% 75.5% 0.641
0.35 56.4% 73.8% 79.4% 0.639
0.40 59.2% 69.1% 82.8% 0.638
0.45 61.7% 62.5% 86% 0.621
0.50 67% 59.1% 89.5% 0.628
0.55 72.8% 53.9% 92.7% 0.619
0.60 75.4% 43.8% 94.8% 0.554
0.65 79.5% 29.8% 97.2% 0.434
0.70 85.7% 19.3% 98.8% 0.315
0.75 86.4% 6.8% 99.6% 0.126
0.80 100% 1.6% 100% 0.032
0.85 No calculable 0% 100% No calculable
0.90 No calculable 0% 100% No calculable

La evaluación de umbrales confirma que la regresión logística permite ajustar la estrategia según la capacidad y el costo de intervención. Con umbrales bajos, el modelo cubre una proporción muy alta de clientes que harán churn, pero incorpora más falsos positivos. Con umbrales altos, aumenta la precisión, pero disminuye de forma marcada la cobertura.

El mejor equilibrio según F1 se alcanza en el umbral 0,30, con una precisión de 53,9 %, una cobertura de 79,1 % y un F1 de 0,641. Este punto permite detectar cerca de ocho de cada diez clientes que harán churn, aunque implica intervenir un grupo más amplio.

Un umbral de 0,35 también es defendible, con precisión de 56,4 %, cobertura de 73,8 % y F1 de 0,639. La diferencia frente a 0,30 es pequeña, pero 0,35 reduce el volumen de clientes priorizados y aumenta ligeramente el acierto entre los casos intervenidos.

Para una estrategia inicial de retención, se recomienda usar el umbral 0,35 si la empresa necesita contener el tamaño de la campaña. Si la intervención es automatizada y de bajo costo, el umbral 0,30 ofrece una opción más amplia, con mayor cobertura de clientes en riesgo.

El umbral 0,35 ofrece una configuración operativa razonable para el modelo recomendado. En este punto, la regresión logística alcanza una precisión de 56,4 % y una cobertura de 73,8 %. Esto significa que el modelo identifica cerca de tres de cada cuatro clientes que harán churn y mantiene un nivel de acierto superior a la mitad entre los clientes priorizados.

El umbral 0,30 logra una cobertura mayor, 79,1 %, pero reduce la precisión a 53,9 % y amplía el grupo de intervención. Por esa razón, el umbral 0,35 se adopta como punto de corte inicial para una campaña de retención con mejor control del volumen operativo.

Clientes priorizados con regresión logística y umbral de 0,35
indicador valor
Clientes en base de prueba 2.108
Clientes priorizados 732
Porcentaje priorizado 34.7%
Clientes priorizados con churn real 413
Precisión de la priorización 56.4%
Cobertura de la priorización 73.8%

Con el umbral recomendado de 0,35, la regresión logística prioriza 732 clientes en la base de prueba, equivalentes al 34,7 % de los clientes evaluados. Dentro de ese grupo, 413 clientes efectivamente hicieron churn.

La precisión de la priorización es 56,4 %. Esto significa que, de cada 100 clientes señalados por el modelo para una acción de retención, cerca de 56 corresponden a casos reales de abandono. La cobertura es 73,8 %, lo que indica que el modelo logra detectar casi tres de cada cuatro clientes que hicieron churn.

En términos operativos, este umbral define una campaña amplia, pero manejable. La empresa no tendría que intervenir a toda la cartera, sino al tercio con mayor probabilidad estimada de abandono. Este punto de corte es adecuado para acciones de retención de bajo o mediano costo, como comunicaciones personalizadas, beneficios digitales, revisión preventiva del plan o incentivos de permanencia.

Scoring final de churn con umbral de 0,35
indicador valor
Clientes evaluados 7.032
Clientes priorizados 2.411
Porcentaje priorizado 34.3%
Probabilidad promedio de churn 26.7%

Al aplicar el modelo recomendado a toda la base depurada, se evaluaron 7.032 clientes. Con el umbral operativo de 0,35, el modelo prioriza 2.411 clientes, equivalentes al 34,3 % de la cartera analizada.

La probabilidad promedio de churn estimada por el modelo es 26,7 %, muy cercana a la tasa general observada de 26,6 %. Esta coherencia sugiere que el scoring mantiene una lectura agregada consistente con el comportamiento real de la base.

En términos de negocio, el resultado permite transformar el modelo en una herramienta de priorización. En lugar de intervenir a todos los clientes, la empresa puede concentrar sus acciones iniciales en el tercio de la cartera con mayor probabilidad estimada de abandono. Este grupo debería ser el punto de partida para campañas de retención, revisión de planes, beneficios diferenciales o acciones preventivas de servicio.

Clientes con mayor riesgo estimado

La salida operativa del modelo es una lista ordenada de clientes según su probabilidad estimada de churn. Esta tabla muestra los primeros casos priorizados y sirve como ejemplo de cómo el scoring puede alimentar una campaña de retención.

Primeros 20 clientes con mayor probabilidad estimada de churn
Cliente Probabilidad de churn Decisión Antigüedad Contrato Internet Método de pago Cargo mensual Cargo total
7024-OHCCK 83.6% Priorizar 2 Month-to-month Fiber optic Electronic check $93.8 $170.8
9497-QCMMS 83.5% Priorizar 1 Month-to-month Fiber optic Electronic check $93.6 $93.6
9300-AGZNL 83.3% Priorizar 1 Month-to-month Fiber optic Electronic check $94 $94
4424-TKOPW 83% Priorizar 2 Month-to-month Fiber optic Electronic check $93.8 $196.8
1374-DMZUI 82.9% Priorizar 4 Month-to-month Fiber optic Electronic check $94.3 $424.4
2720-WGKHP 82.9% Priorizar 2 Month-to-month Fiber optic Electronic check $94 $181.7
5150-ITWWB 82.4% Priorizar 3 Month-to-month Fiber optic Electronic check $94.8 $335.8
8149-RSOUN 82.4% Priorizar 1 Month-to-month Fiber optic Electronic check $93.8 $93.8
8098-LLAZX 82.2% Priorizar 4 Month-to-month Fiber optic Electronic check $95.4 $396.1
4910-GMJOT 82% Priorizar 1 Month-to-month Fiber optic Electronic check $94.6 $94.6
5178-LMXOP 81.5% Priorizar 1 Month-to-month Fiber optic Electronic check $95.1 $95.1
7851-WZEKY 81.3% Priorizar 2 Month-to-month Fiber optic Electronic check $95.2 $196.9
7216-EWTRS 81.1% Priorizar 1 Month-to-month Fiber optic Electronic check $100.8 $100.8
2545-EBUPK 80.9% Priorizar 2 Month-to-month Fiber optic Electronic check $84 $186.1
5567-WSELE 80.8% Priorizar 3 Month-to-month Fiber optic Electronic check $94.6 $279.6
0295-PPHDO 80.8% Priorizar 1 Month-to-month Fiber optic Electronic check $95.4 $95.4
3158-MOERK 80.8% Priorizar 2 Month-to-month Fiber optic Electronic check $96 $174.8
1069-XAIEM 80.8% Priorizar 1 Month-to-month Fiber optic Electronic check $85 $85
1415-YFWLT 80.7% Priorizar 1 Month-to-month Fiber optic Electronic check $89.3 $89.3
6521-YYTYI 80.6% Priorizar 1 Month-to-month Fiber optic Electronic check $93.3 $93.3

La tabla de clientes de mayor riesgo muestra que el scoring identifica un patrón comercial muy definido. Los primeros 20 clientes priorizados tienen probabilidades estimadas de churn entre 80,6 % y 83,6 %. Todos comparten cuatro rasgos principales: baja antigüedad, contrato mensual, servicio de fibra óptica y pago mediante Electronic check.

Este resultado es coherente con los hallazgos previos del análisis. Los clientes con mayor riesgo no aparecen de forma aleatoria, sino concentrados en una combinación específica de señales: relación reciente con la empresa, bajo compromiso contractual, servicio de internet de mayor exposición y método de pago asociado a mayor churn.

Desde una perspectiva operativa, esta tabla muestra cómo el modelo puede apoyar una campaña de retención. La empresa podría priorizar clientes con este perfil para acciones tempranas de contacto, revisión de experiencia de servicio, incentivo de permanencia o migración hacia modalidades contractuales y de pago más estables.

Matriz de confusión de la regresión logística con umbral 0,35
Predicción Valor real Clientes
Yes Yes 413
No Yes 147
Yes No 319
No No 1229

Con el umbral operativo de 0,35, la matriz de confusión muestra que el modelo identificó correctamente 413 clientes que hicieron churn. También clasificó correctamente como no churn a 1.229 clientes que permanecieron.

El modelo dejó sin detectar 147 clientes que efectivamente abandonaron el servicio. Estos casos representan falsos negativos y son importantes para la gestión de retención, porque corresponden a clientes que no habrían sido priorizados por la campaña. Al mismo tiempo, el modelo clasificó como riesgo a 319 clientes que finalmente no hicieron churn. Estos casos son falsos positivos y representan intervenciones que podrían no ser necesarias.

Desde una perspectiva de negocio, el resultado es razonable para una campaña preventiva. El modelo prioriza un grupo amplio de clientes en riesgo y logra capturar 413 de los 560 casos reales de churn en la base de prueba. Esto equivale a una cobertura de 73,8 %. La contrapartida es que una parte de los clientes intervenidos no abandonaría el servicio, lo cual debe evaluarse según el costo de la acción de retención.

Variables del modelo recomendado

Para interpretar la regresión logística se revisan los odds ratios de las variables incluidas en el modelo. Un odds ratio mayor que 1 indica aumento en la razón de probabilidades de churn frente a la categoría de referencia. Un odds ratio menor que 1 indica disminución. Esta lectura es asociativa y predictiva, no causal.

Variables principales del modelo de regresión logística para churn
Variable Coeficiente Odds ratio Lectura
InternetServiceFiber optic 1.561 4.77 Aumenta odds de churn
InternetServiceNo -1.505 0.22 Reduce odds de churn
ContractTwo year -1.464 0.23 Reduce odds de churn
ContractOne year -0.845 0.43 Reduce odds de churn
StreamingMoviesYes 0.578 1.78 Aumenta odds de churn
StreamingTVYes 0.519 1.68 Aumenta odds de churn
MultipleLinesYes 0.379 1.46 Aumenta odds de churn
PaperlessBillingYes 0.302 1.35 Aumenta odds de churn
PaymentMethodElectronic check 0.290 1.34 Aumenta odds de churn
OnlineSecurityYes -0.215 0.81 Reduce odds de churn
TechSupportYes -0.128 0.88 Reduce odds de churn
SeniorCitizen 0.120 1.13 Aumenta odds de churn
DeviceProtectionYes 0.118 1.13 Aumenta odds de churn
PaymentMethodMailed check -0.100 0.90 Reduce odds de churn
PartnerYes -0.091 0.91 Reduce odds de churn

La regresión logística permite interpretar las variables en términos de odds ratios, orientados a Churn = Yes. Un odds ratio mayor que 1 indica aumento en los odds de churn frente a la categoría de referencia. Un odds ratio menor que 1 indica reducción.

El servicio de fibra óptica aparece como la variable con mayor incremento relativo del riesgo: los clientes con Fiber optic tienen odds de churn 4,77 veces mayores que la categoría de referencia del servicio de internet. En contraste, no tener servicio de internet reduce los odds de churn, con un odds ratio de 0,22.

El tipo de contrato también muestra un patrón claro. Los contratos de dos años reducen los odds de churn, con un odds ratio de 0,23, y los contratos de un año también los reducen, con un odds ratio de 0,43. Esto confirma que la permanencia contractual es una señal relevante de estabilidad.

El método de pago Electronic check aumenta los odds de churn, con un odds ratio de 1,34. También aumentan los odds variables como facturación electrónica, streaming de películas, streaming de televisión y líneas múltiples. Estas asociaciones deben leerse dentro del modelo y no como efectos causales aislados, porque pueden reflejar combinaciones de precio, paquete contratado, perfil del cliente y forma de vinculación con la empresa.

Algunas variables reducen los odds de churn, como OnlineSecurity, TechSupport, PaymentMethodMailed check y PartnerYes. En términos de negocio, esto sugiere que ciertos servicios de apoyo, modalidades de pago y condiciones del hogar pueden contribuir a diferenciar clientes con menor riesgo.

La lectura principal es que el modelo combina señales de producto, contrato, forma de pago y características de vinculación. Estas variables ayudan a explicar por qué el modelo puede ordenar clientes según su probabilidad estimada de abandono.