1 ¿Por qué nos importa el Odds Ratio?

En modelos de clasificación, especialmente en regresión logística, muchas veces queremos responder preguntas como estas:

  • ¿Un cliente con mayor ingreso tiene más probabilidad de comprar?
  • ¿Un cliente casado tiene más odds de pagar puntualmente que uno soltero?
  • ¿Una campaña personalizada aumenta los odds de conversión?
  • ¿La antigüedad del cliente reduce el riesgo de fuga?

El Odds Ratio (OR) nos ayuda a traducir los resultados del modelo a lenguaje de negocio.

Idea clave: el Odds Ratio compara cuántas veces cambian los odds del evento cuando cambia una variable explicativa.

2 Antes de empezar: odds no es lo mismo que probabilidad

La probabilidad responde:

De cada 100 casos, ¿cuántos esperamos que ocurra el evento?

Los odds responden:

¿Cuántas veces ocurre el evento en comparación con que no ocurra?

Por ejemplo, si la probabilidad de compra es 75%:

probabilidad <- 0.75
odds <- probabilidad / (1 - probabilidad)
odds
## [1] 3

Interpretación:

Si la probabilidad de compra es 75%, los odds son 3. Es decir, por cada caso donde no ocurre la compra, hay 3 casos donde sí ocurre.

No confundir: un OR de 2 no significa necesariamente “el doble de probabilidad”. Significa “el doble de odds”. Suena parecido, pero estadísticamente no es lo mismo. Aquí es donde muchos modelos se van al multiverso.

3 Fórmula general del Odds Ratio

En una regresión logística, el modelo suele entregar coeficientes en escala logarítmica. Para interpretarlos mejor, los transformamos con la función exponencial:

beta <- 0.405
OR <- exp(beta)
OR
## [1] 1.499303

La lectura general es:

  • Si OR > 1: los odds del evento aumentan.
  • Si OR < 1: los odds del evento disminuyen.
  • Si OR = 1: no hay cambio en los odds.

4 Caso 1: Variable independiente cuantitativa

Una variable cuantitativa puede ser edad, años de experiencia, ingreso, número de compras, ticket promedio, visitas a la app, entre otras.

4.1 Escenario A: OR mayor que 1

Supongamos que analizamos el efecto de los años de experiencia sobre la probabilidad de que una persona esté en bajo riesgo crediticio.

Ejemplo

OR <- 1.5
incremento_porcentual <- (OR - 1) * 100
incremento_porcentual
## [1] 50

Interpretación tradicional:

Por cada año adicional de experiencia, los odds de estar en bajo riesgo aumentan en 50%.

También se puede decir:

Por cada año adicional de experiencia, los odds de estar en bajo riesgo son 1.5 veces los odds anteriores.

Traducción ejecutiva: más experiencia está asociada con mejores odds de bajo riesgo. No es poesía, es logística.

4.2 Lectura con el recíproco

A veces conviene interpretar el efecto inverso: ¿qué pasa si la variable disminuye una unidad?

OR <- 1.5
reciproco <- 1 / OR
disminucion_porcentual <- (1 - reciproco) * 100
reciproco
## [1] 0.6666667
disminucion_porcentual
## [1] 33.33333

Interpretación:

Por cada año menos de experiencia, los odds de estar en bajo riesgo son aproximadamente 0.67 veces los odds anteriores; es decir, disminuyen en aproximadamente 33.3%.

4.3 Escenario B: OR menor que 1

Ahora supongamos que el OR asociado a una variable cuantitativa es 0.8.

OR <- 0.8
disminucion_porcentual <- (1 - OR) * 100
disminucion_porcentual
## [1] 20

Interpretación tradicional:

Por cada unidad adicional en la variable independiente, los odds del evento disminuyen en 20%.

Ejemplo aplicado:

Por cada año adicional de antigüedad en mora, los odds de estar en bajo riesgo disminuyen en 20%.

4.4 Lectura con el recíproco

OR <- 0.8
reciproco <- 1 / OR
incremento_porcentual <- (reciproco - 1) * 100
reciproco
## [1] 1.25
incremento_porcentual
## [1] 25

Interpretación:

Por cada unidad menor en la variable independiente, los odds del evento aumentan en 25%.

5 Caso 2: Variable independiente cualitativa

Una variable cualitativa suele representar grupos o categorías. Por ejemplo:

  • Estado civil: 1 = casado, 0 = soltero.
  • Sexo: 1 = hombre, 0 = mujer.
  • Canal de compra: 1 = digital, 0 = físico.
  • Recibió campaña: 1 = sí, 0 = no.

Regla de oro: en variables cualitativas, siempre debes tener claro cuál es el grupo base. Sin grupo base, la interpretación queda coja. Y una interpretación coja en comité ejecutivo no camina.

5.1 Escenario A: OR mayor que 1

Supongamos una variable llamada casado, donde:

  • 1 = casado
  • 0 = soltero

Y el OR estimado es 2.0.

OR <- 2.0
incremento_porcentual <- (OR - 1) * 100
incremento_porcentual
## [1] 100

Interpretación tradicional:

Las personas casadas tienen 100% más odds de estar en bajo riesgo que las personas solteras.

También se puede decir:

Las personas casadas tienen 2 veces los odds de estar en bajo riesgo en comparación con las personas solteras.

5.2 Lectura con el recíproco

OR <- 2.0
reciproco <- 1 / OR
disminucion_porcentual <- (1 - reciproco) * 100
reciproco
## [1] 0.5
disminucion_porcentual
## [1] 50

Interpretación:

Las personas solteras tienen aproximadamente 50% menos odds de estar en bajo riesgo que las personas casadas.

6 Escenario B: OR menor que 1

Supongamos que el OR para casado es 0.6.

OR <- 0.6
disminucion_porcentual <- (1 - OR) * 100
disminucion_porcentual
## [1] 40

Interpretación tradicional:

Las personas casadas tienen 40% menos odds de estar en bajo riesgo que las personas solteras.

También se puede decir:

Las personas casadas tienen 0.6 veces los odds de estar en bajo riesgo respecto a las personas solteras.

6.1 Lectura con el recíproco

OR <- 0.6
reciproco <- 1 / OR
incremento_porcentual <- (reciproco - 1) * 100
reciproco
## [1] 1.666667
incremento_porcentual
## [1] 66.66667

Interpretación:

Las personas solteras tienen aproximadamente 66.7% más odds de estar en bajo riesgo que las personas casadas.

7 Resumen ejecutivo

Guía rápida para interpretar el Odds Ratio
Tipo_de_variable Situacion Interpretacion Lectura_con_reciproco
Cuantitativa OR > 1 Cada unidad adicional aumenta los odds del evento. Cada unidad menor disminuye los odds del evento.
Cuantitativa OR < 1 Cada unidad adicional disminuye los odds del evento. Cada unidad menor aumenta los odds del evento.
Cualitativa OR > 1 El grupo 1 tiene más odds del evento que el grupo 0. El grupo 0 tiene menos odds que el grupo 1.
Cualitativa OR < 1 El grupo 1 tiene menos odds del evento que el grupo 0. El grupo 0 tiene más odds que el grupo 1.

8 Mini-guía de interpretación rápida

Checklist mental:
  1. Identifica cuál es el evento modelado: respuesta = 1.
  2. Identifica si la variable es cuantitativa o cualitativa.
  3. Evalúa si el OR es mayor o menor que 1.
  4. Convierte el OR a porcentaje usando la regla correcta.
  5. Redacta la interpretación en lenguaje de negocio.

9 Reglas de conversión porcentual

9.1 Cuando OR > 1

Usamos:

(OR - 1) * 100

Ejemplo:

OR <- 1.8
(OR - 1) * 100
## [1] 80

Interpretación:

Los odds aumentan en 80%.

9.2 Cuando OR < 1

Usamos:

(1 - OR) * 100

Ejemplo:

OR <- 0.7
(1 - OR) * 100
## [1] 30

Interpretación:

Los odds disminuyen en 30%.

10 Ejemplo aplicado a negocio

Supongamos que una empresa retail quiere explicar la probabilidad de que un cliente responda a una campaña promocional.

La variable dependiente es:

  • responde_campaña = 1: el cliente compró luego de recibir la campaña.
  • responde_campaña = 0: el cliente no compró.

Variables explicativas:

  • visitas_app: número de visitas a la app durante el último mes.
  • cliente_premium: 1 = cliente premium, 0 = cliente regular.
  • edad: edad del cliente.
resultados <- data.frame(
  Variable = c("visitas_app", "cliente_premium", "edad"),
  OR = c(1.12, 1.85, 0.97)
)

resultados$Interpretacion_porcentual <- ifelse(
  resultados$OR > 1,
  paste0("Aumenta los odds en ", round((resultados$OR - 1) * 100, 1), "%"),
  paste0("Disminuye los odds en ", round((1 - resultados$OR) * 100, 1), "%")
)

kable(resultados, caption = "Ejemplo de interpretación de OR en una campaña retail")
Ejemplo de interpretación de OR en una campaña retail
Variable OR Interpretacion_porcentual
visitas_app 1.12 Aumenta los odds en 12%
cliente_premium 1.85 Aumenta los odds en 85%
edad 0.97 Disminuye los odds en 3%

Lectura de negocio:

  • Cada visita adicional a la app aumenta los odds de responder a la campaña en 12%.
  • Los clientes premium tienen 85% más odds de responder que los clientes regulares.
  • Cada año adicional de edad disminuye los odds de responder en 3%.

Lectura gerencial: la actividad digital y la pertenencia al segmento premium parecen asociarse positivamente con la respuesta a campaña. La edad muestra una relación negativa leve. El modelo está diciendo: “mírame a los digitales y premium primero”.

11 Ejercicio para clase

Una entidad financiera estima un modelo logístico para explicar si un cliente tiene bajo riesgo crediticio.

La variable dependiente es:

  • bajo_riesgo = 1: el cliente es de bajo riesgo.
  • bajo_riesgo = 0: el cliente no es de bajo riesgo.

Se obtienen los siguientes Odds Ratio:

Odds Ratio estimados
Variable Descripcion OR
ingreso_mensual Ingreso mensual del cliente, en miles de soles 1.35
tiene_tarjeta_credito 1 = tiene tarjeta de crédito, 0 = no tiene 2.10
edad Edad del cliente en años 0.98
mora_ultimos_12m Número de meses con mora en los últimos 12 meses 0.72

11.1 Preguntas

  1. Interpreta el OR de ingreso_mensual.
  2. Interpreta el OR de tiene_tarjeta_credito.
  3. Interpreta el OR de edad.
  4. Interpreta el OR de mora_ultimos_12m.
  5. ¿Qué variable parece tener el mayor efecto positivo sobre los odds de bajo riesgo?
  6. ¿Qué variable parece tener el mayor efecto negativo sobre los odds de bajo riesgo?
  7. Redacta una conclusión gerencial en máximo cinco líneas.

12 Solución referencial

ejercicio$Cambio_porcentual <- ifelse(
  ejercicio$OR > 1,
  round((ejercicio$OR - 1) * 100, 1),
  round((1 - ejercicio$OR) * 100, 1)
)

ejercicio$Direccion <- ifelse(ejercicio$OR > 1, "Aumenta", "Disminuye")

kable(ejercicio, caption = "Solución referencial: dirección y magnitud del efecto")
Solución referencial: dirección y magnitud del efecto
Variable Descripcion OR Cambio_porcentual Direccion
ingreso_mensual Ingreso mensual del cliente, en miles de soles 1.35 35 Aumenta
tiene_tarjeta_credito 1 = tiene tarjeta de crédito, 0 = no tiene 2.10 110 Aumenta
edad Edad del cliente en años 0.98 2 Disminuye
mora_ultimos_12m Número de meses con mora en los últimos 12 meses 0.72 28 Disminuye

Interpretaciones:

  • ingreso_mensual: por cada mil soles adicionales de ingreso mensual, los odds de bajo riesgo aumentan en 35%.
  • tiene_tarjeta_credito: los clientes con tarjeta de crédito tienen 110% más odds de ser de bajo riesgo que los clientes sin tarjeta.
  • edad: por cada año adicional de edad, los odds de bajo riesgo disminuyen en 2%.
  • mora_ultimos_12m: por cada mes adicional con mora, los odds de bajo riesgo disminuyen en 28%.

13 Cierre

El Odds Ratio es una herramienta poderosa porque permite convertir resultados estadísticos en mensajes accionables.

Frase para llevar: no basta con decir que una variable es significativa; hay que explicar cuánto mueve los odds, en qué dirección y qué decisión de negocio sugiere.