El objetivo del análisis es identificar los clientes con mayor probabilidad de abandonar el servicio y reconocer los factores comerciales asociados al churn, con el fin de orientar acciones de retención más focalizadas.
El reporte busca responder tres preguntas de negocio: qué tan alto es el churn observado, en qué segmentos se concentra el mayor riesgo y qué clientes deberían priorizarse para una intervención comercial.
Uno de cada cuatro clientes abandonó el servicio.
El riesgo de abandono se concentra especialmente en clientes con baja antigüedad, contrato mensual, servicio de fibra óptica, método de pago Electronic check y cargos mensuales medios o altos.
Estos patrones permiten orientar las acciones comerciales hacia segmentos con mayor probabilidad de abandono.
La recomendación principal es usar el scoring de churn como herramienta de priorización comercial, empezando por los clientes con mayor probabilidad estimada de abandono y complementando el modelo con criterios de valor económico, costo de intervención y capacidad operativa de la campaña.
Antes de estimar los modelos se inspeccionó la calidad de los datos para identificar registros repetidos, valores perdidos, valores fuera de rango, valores extremos y posibles saltos no graduales en las variables numéricas incluidas en el análisis.
| Indicador | Valor |
|---|---|
| Registros eliminados por TotalCharges perdido | 11 |
| Porcentaje eliminado | 0.16% |
| Clientes conservados para el análisis | 7032 |
La variable TotalCharges presentó 11 valores perdidos,
equivalentes al 0,16 % de la base. Dado que la proporción es muy baja,
se eliminaron esos registros antes de continuar con el análisis. La base
depurada conserva 7.032 clientes.
Además de esta depuración, se revisó la estructura general de los datos, la presencia de valores perdidos, la posible existencia de valores fuera de rango y el comportamiento de las variables numéricas en términos de gradualidad. Esta revisión permite separar el control de calidad de la formulación de objetivos y deja explícito que la modelización se realizó sobre una base inspeccionada antes del entrenamiento de los modelos.
| Indicador | Valor |
|---|---|
| Clientes analizados | 7032 |
| Variables disponibles | 21 |
| Clientes con churn | 1869 |
| Tasa general de churn | 26.6% |
| Cargo mensual promedio | $64.8 |
| Antigüedad promedio | 32.4 meses |
La base depurada conserva 7.032 clientes y permite trabajar con una cartera suficientemente amplia para el análisis de churn. La tasa general de abandono es de 26,6 %, lo que indica que cerca de uno de cada cuatro clientes ha dejado el servicio. Este valor debe tomarse como línea base para comparar segmentos: los grupos con tasas superiores a este nivel serán los principales candidatos para acciones de retención.
El cargo mensual promedio es de $64,8 y la antigüedad promedio es de 32,4 meses. Esto sugiere una cartera con clientes de permanencia intermedia, aunque el promedio puede ocultar diferencias relevantes entre clientes nuevos y antiguos. Por esa razón, el siguiente paso debe ser revisar cómo cambia el churn según la antigüedad, el tipo de contrato y los servicios contratados.
La tasa general de churn permite establecer la línea base del análisis. A partir de este valor se compararán los segmentos de clientes para identificar grupos con riesgo superior al promedio.
El churn observado es de 26,6 %. En términos de negocio, esto significa que la empresa perdió 1.869 clientes dentro de la base analizada. La magnitud del abandono justifica pasar de una lectura descriptiva a una estrategia de priorización: identificar qué segmentos concentran el riesgo y qué clientes deberían recibir primero una acción de retención.
La tasa general de churn es el porcentaje total de clientes que
abandonaron el servicio en la base analizada. En este caso, 1.869 de los
7.032 clientes depurados registran abandono, lo que equivale a una tasa
general de churn de 26,6 %. Esta tasa funciona como línea base para
comparar segmentos: los grupos con valores superiores al 26,6 %
presentan un riesgo de abandono mayor al observado en la cartera
total.
El tipo de contrato permite observar si el abandono se concentra en clientes con menor compromiso contractual. Esta lectura es útil para definir estrategias diferenciadas de retención, fidelización y migración hacia planes de mayor permanencia.
El tipo de contrato muestra una diferencia clara en el riesgo de abandono. Los clientes con contratos mensuales presentan la mayor tasa de churn, por encima de la línea base general. En contraste, los contratos de uno y dos años muestran niveles de abandono menores, lo que sugiere que la permanencia contractual funciona como una señal fuerte de estabilidad del cliente.
Desde una perspectiva comercial, este hallazgo apunta a dos frentes: intervenir de forma temprana a los clientes con contrato mensual y diseñar incentivos para migrar hacia modalidades contractuales de mayor permanencia.
# Churn por antigüedad del cliente
La antigüedad permite identificar en qué momento de la relación comercial se concentra el abandono. Esta lectura ayuda a diferenciar acciones de bienvenida, acompañamiento temprano, fidelización y recuperación de clientes en riesgo.
La antigüedad del cliente muestra una relación clara con el churn. En los primeros 12 meses, la tasa de abandono alcanza 47,7 %, casi el doble de la tasa general de la base, que es 26,6 %. Entre los 13 y 24 meses el churn baja a 28,7 %, todavía ligeramente por encima del nivel general.
A partir de los 25 meses, el riesgo cae por debajo de la línea base. Los clientes con 25 a 48 meses presentan una tasa de churn de 20,4 %, y quienes tienen 49 meses o más registran 9,5 %. Esto sugiere que el abandono se concentra en la etapa temprana de la relación comercial. Desde una perspectiva de negocio, las acciones de retención deberían priorizar los primeros 24 meses, con especial atención al primer año.
El tipo de servicio de internet permite observar si el abandono se concentra en determinados productos. Esta lectura es útil para revisar la propuesta de valor, la experiencia de servicio y los segmentos donde puede ser necesario reforzar la retención.
El tipo de servicio de internet muestra una diferencia marcada en el churn. Los clientes con fibra óptica presentan una tasa de abandono de 41,9 %, muy por encima de la tasa general de la base, que es 26,6 %. En contraste, los clientes con DSL registran una tasa de 19,0 %, y quienes no tienen servicio de internet presentan una tasa de 7,4 %.
Este resultado no debe interpretarse de inmediato como un problema técnico de la fibra óptica. También puede reflejar diferencias en precio, expectativas del cliente, competencia comercial o perfil de quienes contratan este servicio. Desde una perspectiva de negocio, la fibra óptica aparece como un segmento prioritario para investigar experiencia de servicio, sensibilidad al precio y razones específicas de abandono.
# Churn por método de pago
El método de pago puede reflejar diferencias en fricción operativa, automatización del cobro y perfil del cliente. Esta lectura ayuda a identificar si ciertos medios de pago concentran mayor riesgo de abandono.
El método de pago muestra una diferencia sustantiva en el riesgo de
abandono. Los clientes que pagan mediante Electronic check
presentan una tasa de churn de 45,3 %, muy por encima de la tasa general
de la base, que es 26,6 %. En los demás métodos de pago, las tasas son
claramente menores: 19,2 % en Mailed check, 16,7 % en
transferencia bancaria automática y 15,3 % en tarjeta de crédito
automática.
Este patrón sugiere que el pago electrónico no automático concentra un grupo de clientes más vulnerable al abandono. Desde una perspectiva de negocio, conviene revisar si este método de pago está asociado a menor vinculación contractual, menor antigüedad, mayor sensibilidad al precio o menor adopción de pagos automáticos. Una acción práctica sería promover la migración hacia medios automáticos de pago, acompañada de beneficios de permanencia o reducción de fricción en el cobro.
El cargo mensual permite evaluar si el abandono se concentra en clientes con mayor valor de factura. Esta lectura es relevante porque el churn en clientes de mayor cargo mensual puede representar mayor pérdida potencial de ingresos.
El cargo mensual muestra un patrón relevante para la gestión comercial. La tasa de churn es baja en los clientes con cargo mensual bajo, 11,3 %, y aumenta en los grupos de mayor facturación. En el grupo de cargo medio alto, con un cargo mensual promedio de $80,3, el churn alcanza 37,5 %, muy por encima de la tasa general de 26,6 %. En el grupo de cargo alto, con un cargo mensual promedio de $100,9, la tasa se mantiene elevada, 32,9 %.
El hallazgo sugiere que el abandono no solo debe medirse por cantidad de clientes, sino también por valor económico potencial. Los clientes con cargos mensuales medios y altos combinan mayor riesgo de abandono y mayor impacto sobre ingresos recurrentes. Estos segmentos deberían ser prioritarios para acciones de retención, revisión de precios, beneficios asociados al plan y mejora de la experiencia de servicio.
| indicador | valor |
|---|---|
| Registros para modelización | 7032 |
| Variables predictoras | 19 |
| Variable objetivo | Churn |
| Variable | Tipo | Tasa mínima | Tasa máxima | Brecha | Grupo de mayor riesgo | Clientes en grupo | Churn del grupo |
|---|---|---|---|---|---|---|---|
| tenure | Numérica agrupada en cuartiles | 7.8% | 50.7% | 42.9 pp | Cuartil 1: valores bajos | 1758 | 50.7% |
| Contract | Categórica | 2.8% | 42.7% | 39.9 pp | Month-to-month | 3875 | 42.7% |
| InternetService | Categórica | 7.4% | 41.9% | 34.5 pp | Fiber optic | 3096 | 41.9% |
| OnlineSecurity | Categórica | 7.4% | 41.8% | 34.3 pp | No | 3497 | 41.8% |
| TechSupport | Categórica | 7.4% | 41.6% | 34.2 pp | No | 3472 | 41.6% |
| OnlineBackup | Categórica | 7.4% | 39.9% | 32.5 pp | No | 3087 | 39.9% |
| DeviceProtection | Categórica | 7.4% | 39.1% | 31.7 pp | No | 3094 | 39.1% |
| PaymentMethod | Categórica | 15.3% | 45.3% | 30 pp | Electronic check | 2365 | 45.3% |
| TotalCharges | Numérica agrupada en cuartiles | 14.5% | 43.5% | 29 pp | Cuartil 1: valores bajos | 1758 | 43.5% |
| StreamingMovies | Categórica | 7.4% | 33.7% | 26.3 pp | No | 2781 | 33.7% |
| MonthlyCharges | Numérica agrupada en cuartiles | 11.3% | 37.5% | 26.2 pp | Cuartil 3 | 1758 | 37.5% |
| StreamingTV | Categórica | 7.4% | 33.5% | 26.1 pp | No | 2809 | 33.5% |
| PaperlessBilling | Categórica | 16.4% | 33.6% | 17.2 pp | Yes | 4168 | 33.6% |
| Dependents | Categórica | 15.5% | 31.3% | 15.7 pp | No | 4933 | 31.3% |
| Partner | Categórica | 19.7% | 33% | 13.3 pp | No | 3639 | 33% |
| SeniorCitizen | Numérica agrupada en cuartiles | 22.6% | 35.6% | 13 pp | Cuartil 4: valores altos | 1758 | 35.6% |
| MultipleLines | Categórica | 25% | 28.6% | 3.6 pp | Yes | 2967 | 28.6% |
| PhoneService | Categórica | 25% | 26.7% | 1.7 pp | Yes | 6352 | 26.7% |
| gender | Categórica | 26.2% | 27% | 0.8 pp | Female | 3483 | 27% |
La exploración preliminar muestra que el churn no se distribuye de
manera homogénea en la cartera. Las mayores brechas aparecen en
variables que expresan permanencia, compromiso contractual y
configuración del servicio. La antigüedad del cliente es la señal con
mayor separación: en el cuartil de menor tenure, la tasa de
churn alcanza 50,7 %, mientras que en el grupo de menor riesgo baja a
7,8 %. Esto indica que el abandono temprano es uno de los focos
principales del problema.
El tipo de contrato también muestra una diferencia sustantiva. Los clientes con contrato mensual presentan una tasa de churn de 42,7 %, frente a una tasa mínima de 2,8 % en otros tipos de contrato. Esta brecha de 39,9 puntos porcentuales sugiere que la permanencia contractual es una señal fuerte para anticipar abandono.
También aparecen como señales relevantes el servicio de fibra óptica,
la ausencia de servicios complementarios como
OnlineSecurity, TechSupport,
OnlineBackup y DeviceProtection, y el método
de pago Electronic check. Estas variables no deben
interpretarse todavía como causas del churn, pero sí como indicios
útiles para el modelo predictivo y para la lectura de negocio.
En contraste, variables como gender,
PhoneService y MultipleLines muestran brechas
pequeñas, por lo que parecen aportar menor capacidad de segmentación
preliminar. Esta lectura ayuda a enfocar el modelo en señales
comercialmente relevantes y evita extender el reporte con descripciones
variable por variable.
La brecha de churn resume cuánto cambia la tasa de abandono dentro de cada variable. Una brecha alta indica que la variable separa mejor grupos de mayor y menor riesgo, por lo que puede aportar información útil al modelo predictivo.
La brecha de churn permite identificar qué variables separan mejor
grupos con distinto nivel de riesgo. Las mayores diferencias aparecen en
tenure, Contract, InternetService
y servicios complementarios como OnlineSecurity y
TechSupport.
Por ejemplo, en InternetService, la brecha corresponde a
la diferencia entre el grupo con mayor churn, Fiber optic,
y el grupo con menor churn. Esta lectura ayuda a reconocer señales
preliminares que el modelo predictivo puede usar para ordenar clientes
según su probabilidad de abandono.
La base se divide en dos conjuntos. El 70 % de los registros se usa para entrenar el modelo y el 30 % restante para evaluar su desempeño. Esta separación permite estimar mejor cómo podría comportarse el modelo ante clientes no observados durante el entrenamiento.
| conjunto | registros | tasa_churn |
|---|---|---|
| Entrenamiento | 4924 | 26.6% |
| Prueba | 2108 | 26.6% |
| modelo | AUC | Accuracy | Precision | Cobertura | Especificidad |
|---|---|---|---|---|---|
| Regresión logística | 0.856 | 81.4% | 67% | 59.1% | 89.5% |
| Random Forest | 0.850 | 80.2% | 73.4% | 39.8% | 94.8% |
| Árbol de decisión | 0.810 | 79.7% | 64.3% | 53% | 89.3% |
La comparación de modelos muestra que la regresión logística obtiene el mejor desempeño general en la base de prueba. Su AUC es 0,856, superior al de Random Forest, 0,850, y al del árbol de decisión, 0,810. Esto indica que la regresión logística tiene la mejor capacidad para ordenar clientes según su probabilidad de churn.
Además, la regresión logística presenta una combinación más equilibrada entre precisión y cobertura. Con el umbral estándar de 0,50, alcanza una precisión de 67,0 % y una cobertura de 59,1 %. Random Forest logra mayor precisión, 73,4 %, pero reduce mucho la cobertura, 39,8 %. Esto significa que Random Forest es más conservador: acierta más entre los clientes que clasifica como churn, pero deja sin detectar una proporción mayor de clientes que efectivamente abandonan.
Para una estrategia de retención, la regresión logística es el mejor modelo inicial en este benchmark. Tiene el mayor AUC, mejor cobertura que Random Forest y una precisión prácticamente equivalente a la del primer modelo Random Forest evaluado. Además, ofrece mayor interpretabilidad, lo cual es útil para explicar resultados a equipos comerciales y directivos.
A partir del benchmark, el modelo recomendado para continuar el análisis es la regresión logística. Random Forest se conserva como modelo comparativo, pero no como modelo principal.
Dado que la regresión logística obtuvo el mejor desempeño general en el benchmark, se evalúan distintos umbrales de decisión para este modelo. El objetivo es definir un punto de corte adecuado para una estrategia de retención, equilibrando precisión y cobertura.
| umbral | precision | cobertura | especificidad | f1 |
|---|---|---|---|---|
| 0.10 | 40.4% | 94.8% | 49.5% | 0.567 |
| 0.15 | 43.9% | 93% | 57% | 0.597 |
| 0.20 | 46.8% | 88.8% | 63.4% | 0.612 |
| 0.25 | 50.5% | 83.2% | 70.5% | 0.628 |
| 0.30 | 53.9% | 79.1% | 75.5% | 0.641 |
| 0.35 | 56.4% | 73.8% | 79.4% | 0.639 |
| 0.40 | 59.2% | 69.1% | 82.8% | 0.638 |
| 0.45 | 61.7% | 62.5% | 86% | 0.621 |
| 0.50 | 67% | 59.1% | 89.5% | 0.628 |
| 0.55 | 72.8% | 53.9% | 92.7% | 0.619 |
| 0.60 | 75.4% | 43.8% | 94.8% | 0.554 |
| 0.65 | 79.5% | 29.8% | 97.2% | 0.434 |
| 0.70 | 85.7% | 19.3% | 98.8% | 0.315 |
| 0.75 | 86.4% | 6.8% | 99.6% | 0.126 |
| 0.80 | 100% | 1.6% | 100% | 0.032 |
| 0.85 | No calculable | 0% | 100% | No calculable |
| 0.90 | No calculable | 0% | 100% | No calculable |
La evaluación de umbrales confirma que la regresión logística permite ajustar la estrategia según la capacidad y el costo de intervención. Con umbrales bajos, el modelo cubre una proporción muy alta de clientes que harán churn, pero incorpora más falsos positivos. Con umbrales altos, aumenta la precisión, pero disminuye de forma marcada la cobertura.
El mejor equilibrio según F1 se alcanza en el umbral 0,30, con una precisión de 53,9 %, una cobertura de 79,1 % y un F1 de 0,641. Este punto permite detectar cerca de ocho de cada diez clientes que harán churn, aunque implica intervenir un grupo más amplio.
Un umbral de 0,35 también es defendible, con precisión de 56,4 %, cobertura de 73,8 % y F1 de 0,639. La diferencia frente a 0,30 es pequeña, pero 0,35 reduce el volumen de clientes priorizados y aumenta ligeramente el acierto entre los casos intervenidos.
Para una estrategia inicial de retención, se recomienda usar el umbral 0,35 si la empresa necesita contener el tamaño de la campaña. Si la intervención es automatizada y de bajo costo, el umbral 0,30 ofrece una opción más amplia, con mayor cobertura de clientes en riesgo.
El umbral 0,35 ofrece una configuración operativa razonable para el
modelo recomendado. En este punto, la regresión logística alcanza una
precisión de 56,4 % y una cobertura de 73,8 %. Esto significa que el
modelo identifica cerca de tres de cada cuatro clientes que harán churn
y mantiene un nivel de acierto superior a la mitad entre los clientes
priorizados.
El umbral 0,30 logra una cobertura mayor, 79,1 %, pero reduce la precisión a 53,9 % y amplía el grupo de intervención. Por esa razón, el umbral 0,35 se adopta como punto de corte inicial para una campaña de retención con mejor control del volumen operativo.
| indicador | valor |
|---|---|
| Clientes en base de prueba | 2.108 |
| Clientes priorizados | 732 |
| Porcentaje priorizado | 34.7% |
| Clientes priorizados con churn real | 413 |
| Precisión de la priorización | 56.4% |
| Cobertura de la priorización | 73.8% |
Con el umbral recomendado de 0,35, la regresión logística prioriza 732 clientes en la base de prueba, equivalentes al 34,7 % de los clientes evaluados. Dentro de ese grupo, 413 clientes efectivamente hicieron churn.
La precisión de la priorización es 56,4 %. Esto significa que, de cada 100 clientes señalados por el modelo para una acción de retención, cerca de 56 corresponden a casos reales de abandono. La cobertura es 73,8 %, lo que indica que el modelo logra detectar casi tres de cada cuatro clientes que hicieron churn.
En términos operativos, este umbral define una campaña amplia, pero manejable. La empresa no tendría que intervenir a toda la cartera, sino al tercio con mayor probabilidad estimada de abandono. Este punto de corte es adecuado para acciones de retención de bajo o mediano costo, como comunicaciones personalizadas, beneficios digitales, revisión preventiva del plan o incentivos de permanencia.
| indicador | valor |
|---|---|
| Clientes evaluados | 7.032 |
| Clientes priorizados | 2.411 |
| Porcentaje priorizado | 34.3% |
| Probabilidad promedio de churn | 26.7% |
Al aplicar el modelo recomendado a toda la base depurada, se evaluaron 7.032 clientes. Con el umbral operativo de 0,35, el modelo prioriza 2.411 clientes, equivalentes al 34,3 % de la cartera analizada.
La probabilidad promedio de churn estimada por el modelo es 26,7 %, muy cercana a la tasa general observada de 26,6 %. Esta coherencia sugiere que el scoring mantiene una lectura agregada consistente con el comportamiento real de la base.
En términos de negocio, el resultado permite transformar el modelo en una herramienta de priorización. En lugar de intervenir a todos los clientes, la empresa puede concentrar sus acciones iniciales en el tercio de la cartera con mayor probabilidad estimada de abandono. Este grupo debería ser el punto de partida para campañas de retención, revisión de planes, beneficios diferenciales o acciones preventivas de servicio.
La salida operativa del modelo es una lista ordenada de clientes según su probabilidad estimada de churn. Esta tabla muestra los primeros casos priorizados y sirve como ejemplo de cómo el scoring puede alimentar una campaña de retención.
| Cliente | Probabilidad de churn | Decisión | Antigüedad | Contrato | Internet | Método de pago | Cargo mensual | Cargo total |
|---|---|---|---|---|---|---|---|---|
| 7024-OHCCK | 83.6% | Priorizar | 2 | Month-to-month | Fiber optic | Electronic check | $93.8 | $170.8 |
| 9497-QCMMS | 83.5% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $93.6 | $93.6 |
| 9300-AGZNL | 83.3% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $94 | $94 |
| 4424-TKOPW | 83% | Priorizar | 2 | Month-to-month | Fiber optic | Electronic check | $93.8 | $196.8 |
| 1374-DMZUI | 82.9% | Priorizar | 4 | Month-to-month | Fiber optic | Electronic check | $94.3 | $424.4 |
| 2720-WGKHP | 82.9% | Priorizar | 2 | Month-to-month | Fiber optic | Electronic check | $94 | $181.7 |
| 5150-ITWWB | 82.4% | Priorizar | 3 | Month-to-month | Fiber optic | Electronic check | $94.8 | $335.8 |
| 8149-RSOUN | 82.4% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $93.8 | $93.8 |
| 8098-LLAZX | 82.2% | Priorizar | 4 | Month-to-month | Fiber optic | Electronic check | $95.4 | $396.1 |
| 4910-GMJOT | 82% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $94.6 | $94.6 |
| 5178-LMXOP | 81.5% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $95.1 | $95.1 |
| 7851-WZEKY | 81.3% | Priorizar | 2 | Month-to-month | Fiber optic | Electronic check | $95.2 | $196.9 |
| 7216-EWTRS | 81.1% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $100.8 | $100.8 |
| 2545-EBUPK | 80.9% | Priorizar | 2 | Month-to-month | Fiber optic | Electronic check | $84 | $186.1 |
| 5567-WSELE | 80.8% | Priorizar | 3 | Month-to-month | Fiber optic | Electronic check | $94.6 | $279.6 |
| 0295-PPHDO | 80.8% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $95.4 | $95.4 |
| 3158-MOERK | 80.8% | Priorizar | 2 | Month-to-month | Fiber optic | Electronic check | $96 | $174.8 |
| 1069-XAIEM | 80.8% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $85 | $85 |
| 1415-YFWLT | 80.7% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $89.3 | $89.3 |
| 6521-YYTYI | 80.6% | Priorizar | 1 | Month-to-month | Fiber optic | Electronic check | $93.3 | $93.3 |
La tabla de clientes de mayor riesgo muestra que el scoring
identifica un patrón comercial muy definido. Los primeros 20 clientes
priorizados tienen probabilidades estimadas de churn entre 80,6 % y 83,6
%. Todos comparten cuatro rasgos principales: baja antigüedad, contrato
mensual, servicio de fibra óptica y pago mediante
Electronic check.
Este resultado es coherente con los hallazgos previos del análisis. Los clientes con mayor riesgo no aparecen de forma aleatoria, sino concentrados en una combinación específica de señales: relación reciente con la empresa, bajo compromiso contractual, servicio de internet de mayor exposición y método de pago asociado a mayor churn.
Desde una perspectiva operativa, esta tabla muestra cómo el modelo puede apoyar una campaña de retención. La empresa podría priorizar clientes con este perfil para acciones tempranas de contacto, revisión de experiencia de servicio, incentivo de permanencia o migración hacia modalidades contractuales y de pago más estables.
| Predicción | Valor real | Clientes |
|---|---|---|
| Yes | Yes | 413 |
| No | Yes | 147 |
| Yes | No | 319 |
| No | No | 1229 |
Con el umbral operativo de 0,35, la matriz de confusión muestra que el modelo identificó correctamente 413 clientes que hicieron churn. También clasificó correctamente como no churn a 1.229 clientes que permanecieron.
El modelo dejó sin detectar 147 clientes que efectivamente abandonaron el servicio. Estos casos representan falsos negativos y son importantes para la gestión de retención, porque corresponden a clientes que no habrían sido priorizados por la campaña. Al mismo tiempo, el modelo clasificó como riesgo a 319 clientes que finalmente no hicieron churn. Estos casos son falsos positivos y representan intervenciones que podrían no ser necesarias.
Desde una perspectiva de negocio, el resultado es razonable para una campaña preventiva. El modelo prioriza un grupo amplio de clientes en riesgo y logra capturar 413 de los 560 casos reales de churn en la base de prueba. Esto equivale a una cobertura de 73,8 %. La contrapartida es que una parte de los clientes intervenidos no abandonaría el servicio, lo cual debe evaluarse según el costo de la acción de retención.
Para interpretar la regresión logística se revisan los odds ratios de las variables incluidas en el modelo. Un odds ratio mayor que 1 indica aumento en la razón de probabilidades de churn frente a la categoría de referencia. Un odds ratio menor que 1 indica disminución. Esta lectura es asociativa y predictiva, no causal.
| Variable | Coeficiente | Odds ratio | Lectura |
|---|---|---|---|
| InternetServiceFiber optic | 1.561 | 4.77 | Aumenta odds de churn |
| InternetServiceNo | -1.505 | 0.22 | Reduce odds de churn |
| ContractTwo year | -1.464 | 0.23 | Reduce odds de churn |
| ContractOne year | -0.845 | 0.43 | Reduce odds de churn |
| StreamingMoviesYes | 0.578 | 1.78 | Aumenta odds de churn |
| StreamingTVYes | 0.519 | 1.68 | Aumenta odds de churn |
| MultipleLinesYes | 0.379 | 1.46 | Aumenta odds de churn |
| PaperlessBillingYes | 0.302 | 1.35 | Aumenta odds de churn |
| PaymentMethodElectronic check | 0.290 | 1.34 | Aumenta odds de churn |
| OnlineSecurityYes | -0.215 | 0.81 | Reduce odds de churn |
| TechSupportYes | -0.128 | 0.88 | Reduce odds de churn |
| SeniorCitizen | 0.120 | 1.13 | Aumenta odds de churn |
| DeviceProtectionYes | 0.118 | 1.13 | Aumenta odds de churn |
| PaymentMethodMailed check | -0.100 | 0.90 | Reduce odds de churn |
| PartnerYes | -0.091 | 0.91 | Reduce odds de churn |
La regresión logística permite interpretar las variables en términos
de odds ratios, orientados a Churn = Yes. Un odds ratio
mayor que 1 indica aumento en los odds de churn frente a la categoría de
referencia. Un odds ratio menor que 1 indica reducción.
El servicio de fibra óptica aparece como la variable con mayor
incremento relativo del riesgo: los clientes con
Fiber optic tienen odds de churn 4,77 veces mayores que la
categoría de referencia del servicio de internet. En contraste, no tener
servicio de internet reduce los odds de churn, con un odds ratio de
0,22.
El tipo de contrato también muestra un patrón claro. Los contratos de dos años reducen los odds de churn, con un odds ratio de 0,23, y los contratos de un año también los reducen, con un odds ratio de 0,43. Esto confirma que la permanencia contractual es una señal relevante de estabilidad.
El método de pago Electronic check aumenta los odds de
churn, con un odds ratio de 1,34. También aumentan los odds variables
como facturación electrónica, streaming de películas, streaming de
televisión y líneas múltiples. Estas asociaciones deben leerse dentro
del modelo y no como efectos causales aislados, porque pueden reflejar
combinaciones de precio, paquete contratado, perfil del cliente y forma
de vinculación con la empresa.
Algunas variables reducen los odds de churn, como
OnlineSecurity, TechSupport,
PaymentMethodMailed check y PartnerYes. En
términos de negocio, esto sugiere que ciertos servicios de apoyo,
modalidades de pago y condiciones del hogar pueden contribuir a
diferenciar clientes con menor riesgo.
La lectura principal es que el modelo combina señales de producto, contrato, forma de pago y características de vinculación. Estas variables ayudan a explicar por qué el modelo puede ordenar clientes según su probabilidad estimada de abandono.