Análisis de Supervivencia

Introducción

El análisis de supervivencia es un método estadístico para el análisis de datos donde la variable de resultado de interés es el tiempo hasta que ocurre un evento, a menudo denominado tiempo de falla, tiempo de supervivencia o tiempo de evento, ver por ejemplo, Kleinbaum[1998]. El análisis de supervivencia se utiliza en diferentes campos, por ejemplo: medicina e ingeniería. En los estudios de droga se modela el tiempo hasta la muerte y en ingeniería el tiempo hasta el fracaso de algún sistema. Véase, por ejemplo, Lawless [1982].

Narain [1992] introdujo el análisis de supervivencia en la calificación crediticia; véase, por ejemplo, Sthepanova y Thomas [2002]. Fue desarrollado aún más por Thomas [1999]. El evento de interés es el incumplimiento. Narain [1992] aplicaron el modelo exponencial de vida acelerada a datos de préstamos personales. Encontró que este modelo estimó bien el número de fallas en cada intervalo de tiempo. Demostró que la concesión de crédito, las decisiones podrían mejorarse mediante el uso de métodos de análisis de supervivencia en comparación con la regresión múltiple. Finalmente, el autor argumentó que el análisis de supervivencia se puede utilizar en todas las operaciones crediticias en las cuales existen variables predictivas y el tiempo hasta el cual el evento es de interés.

Thoma [1999] hizo una comparación del rendimiento de los modelos exponencial, Weibull y Cox con regresión logística y descubrio que los métodos de análisis de supervivencia son competitivos y, a veces, superior al enfoque tradicional de regresión logística.

Esto indica que el análisis de supervivencia puede ser útil para una estimación precisa de la PD durante un período fijo de 12 meses. Horizonte para varios tipos de productos de crédito, lo cual es útil para la estimación de PD dentro del Acuerdo de Basilea II.

A continuación daremos los conceptos básicos del análisis de supervivencia, como la notación y los problemas comunes. Próximo la descripción de modelos de supervivencia más comunes y finalmente comparación de los modelos. Se realiza y se selecciona un modelo para la implementación de supervivencia.

Análisis de Supervivencia

Supongamos que \(T\) es el período de tiempo antes de un incumplimiento. La aleatoridad de \(T\) se puede describir en tres formas estándar ver Kalbfleisch & Prentice [1980] y Leemis [1995].

La función de distribución \(F(t)\) describe la probabilidad de que el tiempo hasta el evento \((T)\) sea menor o igual en comparación a un tiempo fijo \((t)\) y viene dado como:

\[ F(t) = P(T\leq t) \]

A partir de esto, la función de supervivencia, la probabilidad de que el tiempo hasta el evento \((T)\) sea mayor en comparación con un tiempo fijo \((t)\), se puede derivar como:

\[ S(t) = 1 - F(t) \]

La segunda forma es la función de densidad. Esta es la probabilidad de que el tiempo de falla ocurra en exactamente el tiempo \(t\) (de todos los tiempos posibles) y viene dado como:

\[ f(t) = \lim_{\triangle t\longrightarrow 0} \frac{Prob(t\leq t\leq T\leq t + t+\triangle t)}{\triangle t} \]

Y la última descripción la da la función de Hazard (peligro) \(h(t)\). Esta es la probabilidad de que si una instalación sobrevive hasta el momento \(t\), experimentará el evento en el siguiente instante y está dado por:

\[ h(t) = \lambda(t) = \lim_{\triangle \longrightarrow 0}\frac{t<T\leq t+\triangle t| T>t}{\triangle t} = \frac{f(t)}{1- F(t)} = \frac{f(t)}{s(t)} \]

La interpretación de la función de supervivencia es la más obvia. Es un gráfico con el eje izquierdo que representa la proporción de la población que aún vive y el eje x el tiempo. La función de riesgo, tambien llamada tasa de incidencia, riesgo instantáneo o fuerza de mortalidad, es la tasa de eventos en \(t\) entre aquellos en riesgo en el momento \(t\). La interpretación es sencilla, por ejemplo:

\[ h(t) = 1\% ~ en~ t=6~ meses \]

Este establece que después de 6 meses, caen las moras a una tasa del 1% mensual. O en otras palabras: a los 6 meses, si la línea todavía está en la cartera, la probabilidad de incumplimiento en el mes siguiente es 1%. Esto amenudo se representa como la tasa de riesgo acumulada en el eje “y” y el tiempo en el eje “x”.