UNIDAD 3

Distribuciones de probabilidad Poisson y Normal

Jaime Gaviria, profesor Dpto Ciencias básicas

Universidad de Antioquia, Facultad Nacional de Salud Pública

2024-10-23

Agenda de la clase

  1. Repaso clase anterior.

  2. Revisión lectura 1: Kirkwood, B. R., & Sterne, J. A. (2010). Essential medical statistics. John wiley & sons:Capítulo 22: 22.3 y 22.4 Tasas (rates) y distribución de Poisson.

  3. La distribución de probabilidad Poisson: definiciones y ejemplos.

  4. Descanso

  5. Revisión lectura 2: Distribución Normal: Kirkwood (2010): 5.1 a 5.7 o Dawson (2004) Capítulo 4, pags 76-80.

  6. La distribución Normal.

Tasas (rates) y su relación con los riesgos

Definición 1: tasa

La tasa de ocurrencia de un evento mide el número de nuevos eventos que ocurren por persona por unidad de tiempo. Matemáticamente está dado por la expresión

\[ \lambda=\frac{d}{T} \]

donde \(d\) representa el número de nuevos eventos que ocurren y \(T\) el total de persona por unidad de tiempo (Kirkwood and Sterne 2003).

Ejemplo 1: Estudio sobre cirugía arterial coronaria

Resumen del estudio: El Coronary Artery Surgery Study fue un estudio clásico de 1983; se trataba de un ensayo colaborativo prospectivo, aleatorizado y multicéntrico de tratamiento médico y quirúrgico en subconjuntos de pacientes con cardiopatía isquémica estable. Este estudio clásico estableció que la tasa de supervivencia a 10 años en este grupo de pacientes era igual de buena en los grupos tratados médica y quirúrgicamente (revascularización coronaria) (Alderman et al, 1990). En una segunda parte del estudio se compararon los efectos del tratamiento médico y quirúrgico sobre la calidad de vida.

  • Tras un seguimiento medio de 11 años, los 390 pacientes asignados al azar al grupo médico fueron hospitalizados un total de 1256 veces.

  • Los 390 pacientes asignados al azar al grupo quirúrgico fueron hospitalizados un total de 1487 veces.

Estime con los datos anteriores la tasa de la v.a número de hospitalizaciones.

Estimación de tasas para los dos grupos del estudio

Grupo 1: Médico

\[ \lambda_1=\frac{1256}{390}=3.22 \]

La tasa de incidencia del número de hospitalizaciones en el grupo médico es de 3.22 …

Grupo 2: Quirúrgico

\[ \lambda_2=\frac{1487}{390}=3.81 \]

La tasa de incidencia del número de hospitalizaciones en el grupo quirúrgico es 3.81…

Formulación matemática de la proporción de libres de enfermedad

Definición 2: proporción de libres de enfermedad en el tiempo t

\[ p=e^{-\lambda*t} \]

Definición 3: Riesgo hasta el momento t

\[ R_t=1-p \]

Definición 3: Tiempo promedio para contraer la enfermedad

\[ \frac{1}{\lambda} \]

Ejemplo 2: Comparación gráfica de proporción libres enfermedad

Definción formal de una tasa

Definición 4

\[ \lambda=\frac{R}{t} \]

donde \(R\) representa el riesgo de la enfermedad, asumiendo que el tiempo \(t\) es muy pequeño (ver tabla 22.2).

Conclusiones sobre la tasa y el riesgo

  1. La tasa de ocurrencia de un evento mide el número de nuevos eventos que ocurren por persona por unidad de tiempo.

  2. La proporción de pacientes libres de enfermedad en el tiempo \(t\) se expresa en función de una exponencial cuyo exponente es la tasa \(\lambda\).

  3. El cociente entre el riesgo y el tiempo se aproxima a la tasa λ a medida que la longitud del intervalo \(t\) es pequeña.

La distribución de probabilidad Poisson

Preguntas sobre la lectura

  1. ¿Cómo se relaciona la distribución Poisson con lo anterior?.

  2. ¿Cuáles son los supuestos para que una v.a tenga una distribución de Poisson?.

  3. Mencione dos tipos de situaciones típicas en las que es aplicable la distribución de Poisson.

  4. Mencione un caso concreto de una variable aleatoria discreta que NO pueda modelarse mediante la distribució de Poisson.

El modelo de Poisson

Definición: distribución de probabilidad de Poisson

El modelo está dado por la expresión:

\[ P(X = k) = \frac{e^{-\lambda} \times \lambda^k}{k!} \]

donde:

  • \(X\): v.a discreta del conteo de ocurrencias del evento de interés.

  • λ : tasa de ocurrencias promedio de la v.a \(X\).

  • k es el número de eventos (0, 1, 2, …).

Supuestos del modelo Poisson

  1. Aleatoriedad: Las ocurrencias del evento asociado a la v.a \(X\) son aleatorias.

  2. Independencia: Las ocurrencias del evento asociado a la v.a \(X\) son independientes entre sí.1

  3. Homogeneidad: La tasa promedio de ocurrencia es constante en el intervalo considerado.2

  4. No Ocurrencia Simultánea: se asume que no pueden ocurrir dos eventos exactamente al mismo tiempo.

Ejemplo 1 (Continuación)

  • v.a \(X\): Número de hospitalizaciones en cada grupo (Médico, Quirúrgico).

    Supuesto Cumplimiento
    Aletoriedad Sí, por la asignación aleatoria a los grupos.
    Independencia Sí, el enunciado afirma que se puede suponer la independencia de un paciente a otro.
    Homogeneidad Sí, la tasa es constante para cada grupo
    No Ocurrencia Simultánea Sí, por la definición de la v.a

Propiedades

Supuesto de equidispersión:

\[ E(Y)=\lambda \]

\[ Var(Y)=\lambda \]

Nota: Si hay sobredispersión (variabilidad mayor a la esperada), se pueden utilizar modelos alternativos como la regresión binomial negativa o modelos cero-inflados.

Ver más:

Funciones en R para el modelo Poisson

Ejemplo: Coronary Artery Surgery Study (Continuación: Guía de clase)

Problema introductorio 1

Grupo Pacientes Hospitalizaciones tasa
Médico 390 1256 \(\lambda_1=\frac{1256}{390}=3.22\)
Quirúrgico 390 1487 \(\lambda_2=\frac{1487}{390}=3.81\)

Segunda parte: La distribución Normal

El proceso comienza con la curca de campana, cuyo objetivo principal no es dónde apunta sino con que error (Bernstein, P (1988))

El recorrido de lo “normal”

Vídeos y enlaces

Video 2: Normal en la vida cotidiana

Historia de la Normal

Revisión lecturas

  1. Quienes descubrieron esta distribución?.

  2. Si bien los términos Normal y Gaussiana sinónimos, cuál de los dos es menos ambiguo?.

  3. Porqué es importante esta distribución en las Ciencias de la Salud y en particular en Epidemiología?.

  4. Cuál es el proceso para determinar que ciertos rangos de valores de una variable sean “normales”?.

Definición y características de la Normal

Definición 1: Distribución Normal

Una variable aleatoria X se distribuye Normal si su FDP está dada por:

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]

donde los parámetros:

  • \(\mu\): parámetro de localización y

  • \(\sigma\): parámetro de dispersión.

Curva Normal y Acumulada

Applet Normal

Propiedades de la Normal (ver guía de clase)

  1. Es unimodal y simétrica:

    1. Media = mediana = moda = \(\mu\).

    2. Simetría: \(P(X \geq x)=P(X \leq -x)\)

  2. En todas las distribuciones normales, el 68% de los valores caen dentro de 1 desviación estándar, y el 95% caen dentro de 2 (realmente, 1,96) desviaciones estándar.

La distribución Normal Estándar

Definición 2

Una v.a \(Z\) se distribuye Normal Estándar (SND por sus siglas en inglés, (Kirkwood and Sterne 2003)) si su FDP es

\[ f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \]

donde:

\(f(z)\) es la función de densidad de probabilidad de la normal estándar y \(z\) es la variable estandarizada, que se obtiene al transformar una variable normal mediante la fórmula

\[ z=\frac{x-\mu}{\sigma} \]

Es decir; una Normal Estándar es un caso particular de una Normal con parámetros \(\mu=0\) y \(\sigma=1\).

Funciones en R para la Normal

Fuente

Ejemplos

Percentiles y puntuaciones Z

Ejemplos 1 y 2 (Guía de clase)

Aplicaciones de las puntuaciones Z en Salud

Gráficas Crecimiento Niños OMS

Referencias

Kirkwood, Betty, and Jonathan Sterne. 2003. Essential Medical Statistics. Massachusetts: Blackwell.