La inferencia estadística es la herramienta que sirve para extraer conclusiones válidas de datos limitados, permitiendo generalizar observaciones de muestras a poblaciones enteras. En el contexto de las unidades de cuidados intensivos (UCI), donde las decisiones clínicas deben basarse en evidencia robusta pese a la alta variabilidad y la complejidad de los datos, esta herramienta se vuelve indispensable.
Este trabajo explora métodos estadísticos aplicados a datos médicos reales, utilizando la base de datos eICU Collaborative Research Database (versión demo v2.0.1), que recopila más de 2500 estancias en UCI de 20 hospitales estadounidenses grandes. Esta base ofrece diferentes variables clínicas, como signos vitales, puntuaciones de severidad (e.g., APACHE) y datos como mortalidad o duración de estancia.
En nuestra investigación realizaremos lo siguiente:
El objetivo es demostrar cómo la inferencia estadística puede ayudar a la toma de decisiones clínicas basadas en evidencia en entornos de cuidados críticos, proporcionando tanto comprensión teórica como aplicabilidad práctica de estos métodos.
La glucosa muestra una distribución fuertemente asimétrica con la media (162.45 mg/dL) muy por encima de la mediana (129.5 mg/dL), señal inequívoca de que valores extremadamente altos inflan el promedio. La variabilidad es extraordinaria (CV del 57%), con un rango que va desde hipoglucemias críticas de 41 mg/dL hasta hiperglucemias severas de 567 mg/dL.
Esta asimetría extrema tiene implicaciones metodológicas importantes. Un intervalo de confianza estándar basado en normalidad produce un límite inferior negativo (-18.16 mg/dL), matemática y biológicamente imposible, confirmando que la distribución no es simétrica. La carga patológica se concentra en la cola derecha: el 10% superior supera los 290 mg/dL, evidenciando una clara tendencia hacia la descompensación hiperglucémica en esta población crítica.
El análisis de la presión arterial media muestra una estructura asimétrica y dispersa, donde la media (84.65) supera a la mediana (65), confirmando un sesgo positivo que desplaza la densidad hacia valores superiores. A su vez, el perfil platicúrtico y un coeficiente de variación del 47% describen una distribución aplanada sin una moda determinada. La variable carece de un comportamiento rígido y presenta una gran variabilidad.
Inconsistencia en la calidad de los datos con un valor mínimo de -1, cifra imposible para una probabilidad y que carece de sentido biológico, lo cual sesga artificialmente la media (1.5%) a la baja. Al observar la mediana para mitigar este error, vemos que el riesgo central es muy bajo (1.9%) y que tres cuartas partes de la muestra presentan una probabilidad de fallecimiento inferior al 5.6%, lo que sugiere una distribución asimétrica positiva donde la mayoría de los pacientes tienen un pronóstico favorable. No obstante, el rango máximo alcanza el 90.7%, lo que indica que, a pesar de la tendencia general a la supervivencia, existe una cola de pacientes críticos con un riesgo vital extremo que se desvían drásticamente del comportamiento estándar de la población.
## ESTADÍSTICAS DESCRIPTIVAS
## --------------------------
## n: 3676 | Media: 2.667 días
## Mediana: 1.699 días | DE: 3.423 días
## Asimetría: 5.192 | Curtosis: 43.506
## Rango: [ 0.17 , 46.18 ] días
##
## CUANTILES EMPÍRICOS
## -------------------
## Q(0.01): 0.24 días
## Q(0.05): 0.47 días
## Q(0.10): 0.61 días
## Q(0.25): 0.94 días
## Q(0.50): 1.70 días
## Q(0.75): 3.01 días
## Q(0.90): 5.48 días
## Q(0.95): 8.12 días
## Q(0.99): 17.75 días
Distribución extremadamente asimétrica y leptocúrtica (curtosis > 46), donde la media aritmética de 2.67 días se encuentra inflada por valores extremos y no representa fielmente al paciente típico. La mediana de 1.70 días actúa como un estimador central mucho más robusto, revelando que la mitad de la población es dada de alta o trasladada en menos de 48 horas, lo que sugiere una alta rotación de pacientes con recuperaciones rápidas o estancias de monitoreo breve. Sin embargo, la “cola pesada” a la derecha es crítica: aunque el 90% de los casos se resuelven en menos de 5 días y medio, existe un subgrupo de larga estancia (el 1% superior supera los 17 días) que llega hasta los 46 días, representando esos casos clínicos complejos
## ESTADÍSTICAS DESCRIPTIVAS
## --------------------------
## n: 3030 | Media: 33.98 puntos
## Mediana: 33 puntos | DE: 12.371 puntos
## Asimetría: 0.132 | Curtosis: -0.756
## Rango: [ 2 , 59 ] puntos
##
## CUANTILES EMPÍRICOS
## -------------------
## Q(0.01): 10.00 puntos
## Q(0.05): 15.00 puntos
## Q(0.10): 18.00 puntos
## Q(0.25): 25.00 puntos
## Q(0.50): 33.00 puntos
## Q(0.75): 43.00 puntos
## Q(0.90): 52.00 puntos
## Q(0.95): 56.00 puntos
## Q(0.99): 59.00 puntos
Distribución notablemente simétrica y equilibrada, distanciándose del comportamiento sesgado de las variables anteriores. La coincidencia casi perfecta entre la media (33.98) y la mediana (33), sumada a una asimetría prácticamente nula (0.132), sugiere un comportamiento que se aproxima a la normalidad estadística; sin embargo, su curtosis baja (2.246) revela un perfil platicúrtico, lo que indica que los datos están menos concentrados alrededor del promedio y más dispersos a lo largo del rango. Desde una perspectiva clínica, esto refleja una población muy heterogénea que cubre todo el espectro de gravedad fisiológica de forma uniforme, desde cuadros leves (mínimo de 2) hasta situaciones de fallo orgánico severo (máximo de 59)
## ESTADÍSTICAS DESCRIPTIVAS
## --------------------------
## n: 1042 | Media: 3.386 días
## Mediana: 2 días | DE: 3.705 días
## Asimetría: 3.616 | Curtosis: 17.913
## Rango: [ 1 , 30 ] días
##
## CUANTILES EMPÍRICOS
## -------------------
## Q(0.01): 1.00 días
## Q(0.05): 1.00 días
## Q(0.10): 1.00 días
## Q(0.25): 1.00 días
## Q(0.50): 2.00 días
## Q(0.75): 4.00 días
## Q(0.90): 7.00 días
## Q(0.95): 10.00 días
## Q(0.99): 20.00 días
Distribución asimétrica positiva muy agresiva y altamente leptocúrtica (curtosis ~21), lo que invalida la media aritmética (3.39 días) como representativa del paciente estándar. La mediana de apenas 2 días y un primer cuartil anclado en el mínimo (1 día) revelan que la dinámica clínica predominante es el soporte respiratorio transitorio, con una gran masa de pacientes que logran una extubación exitosa o son desconectados en las primeras 24 a 48 horas. No obstante, la variabilidad es extrema (la desviación estándar supera a la media), impulsada por una “cola larga” de pacientes con dependencia prolongada; aunque el 90% de los casos se resuelven en una semana, existe un remanente crítico (el 1% superior supera los 20 días) que representa los casos de destete respiratorio complejo o cronificación
## ESTADÍSTICAS DESCRIPTIVAS
## --------------------------
## n: 402 | Media: 125.018 mmHg
## Mediana: 102 mmHg | DE: 76.932 mmHg
## Asimetría: 1.979 | Curtosis: 4.57
## Rango: [ 30.2 , 494 ] mmHg
##
## CUANTILES EMPÍRICOS
## -------------------
## Q(0.01): 37.01 mmHg
## Q(0.05): 55.05 mmHg
## Q(0.10): 62.00 mmHg
## Q(0.25): 74.00 mmHg
## Q(0.50): 102.00 mmHg
## Q(0.75): 150.75 mmHg
## Q(0.90): 212.00 mmHg
## Q(0.95): 278.85 mmHg
## Q(0.99): 410.86 mmHg
Distribución marcadamente sesgada a la derecha y leptocúrtica, donde la media de 125.02 mmHg se encuentra artificialmente elevada por valores extremos, distanciándose de la mediana de 102 mmHg que representa mejor el estado de la muestra. La dispersión es masiva (desviación estándar de casi 77 mmHg), reflejando dos realidades clínicas opuestas en la misma unidad: por un lado, una cola inferior que denota falta de oxigeno severa e insuficiencia respiratoria (el 5% de los pacientes no alcanza los 55 mmHg), y por otro, una extensa cola superior con valores de un exceso de oxígeno en la sangre arteria que alcanzan los 494 mmHg.
## ESTADÍSTICAS DESCRIPTIVAS
## --------------------------
## n: 402 | Media: 42.047 mmHg
## Mediana: 40.3 mmHg | DE: 12.176 mmHg
## Asimetría: 1.255 | Curtosis: 2.726
## Rango: [ 16 , 94 ] mmHg
##
## CUANTILES EMPÍRICOS
## -------------------
## Q(0.01): 21.60 mmHg
## Q(0.05): 26.00 mmHg
## Q(0.10): 29.01 mmHg
## Q(0.25): 34.50 mmHg
## Q(0.50): 40.30 mmHg
## Q(0.75): 47.55 mmHg
## Q(0.90): 55.00 mmHg
## Q(0.95): 66.76 mmHg
## Q(0.99): 83.97 mmHg
Distribución leptocúrtica y asimétrica positiva que, pese a tener una mediana de 40.3 mmHg perfectamente centrada en el rango de normalidad fisiológica (35-45 mmHg), esconde una dispersión significativa. Mientras la mayor parte de la muestra mantiene una ventilación adecuada, los datos muestran que las desviaciones no son aleatorias, sino que tienden sistemáticamente hacia la retención de gases: el rango intercuartílico ya rompe la barrera del exceso de CO2 en su límite superior (47.55 mmHg). Lo más relevante estadísticamente es la cola derecha de la distribución, donde la variabilidad se dispara; el hecho de que el 5% de los pacientes supere los 66 mmHg y se alcancen máximos de 94 mmHg indica que el riesgo dominante en esta muestra no es la hiperventilación, sino el fracaso ventilatorio con retención severa de CO2, definiendo un subgrupo de alta gravedad que se desvía del comportamiento medio estable.
## ESTADÍSTICAS DESCRIPTIVAS
## --------------------------
## n: 323 | Media: 46.189 %
## Mediana: 44 % | DE: 16.087 %
## Asimetría: 0.668 | Curtosis: 0.119
## Rango: [ 21 , 95 ] %
##
## CUANTILES EMPÍRICOS
## -------------------
## Q(0.01): 21.00 %
## Q(0.05): 21.00 %
## Q(0.10): 28.00 %
## Q(0.25): 35.00 %
## Q(0.50): 44.00 %
## Q(0.75): 50.00 %
## Q(0.90): 70.00 %
## Q(0.95): 80.00 %
## Q(0.99): 90.00 %
Distribución con una asimetría positiva moderada (0.671) y una curtosis cercana a la normalidad (3.138), cuyo comportamiento está condicionado por: el mínimo y el percentil 5 se anclan en el 21% (aire ambiente), lo que indica que una fracción menor de la muestra respira sin asistencia. Sin embargo, la mediana del 44% y un primer cuartil situado ya en el 35% revelan que la inmensa mayoría de la población recibe oxigenoterapia activa en rangos moderados. Aunque la tendencia central sugiere un soporte no invasivo, la desviación estándar del 16% es amplia y empuja la cola derecha hacia valores críticos; el hecho de que el 10% superior de la muestra requiera concentraciones por encima del 70% y se alcancen máximos del 95% evidencia la presencia de un subgrupo con fallo respiratorio grave.
## ESTADÍSTICAS DE VARIABILIDAD
## --------------------------
## n: 1471 | Media: 11.146 K/μL
## DE: 5.52 K/μL | CV: 49.53 %
## Suma Z²: 1470
## Rango Z²: [ 0 , 11.543 ]
##
## CUANTILES EMPÍRICOS
## ----------------------
## Q(0.01): 0.000
## Q(0.05): 0.007
## Q(0.25): 0.151
## Q(0.50): 0.460
## Q(0.75): 1.121
## Q(0.95): 3.796
## Q(0.99): 8.310
Heterogeneidad biológica muy acusada (CV del 49.53%), donde la media se sitúa ya en el límite superior de la normalidad, sugiriendo una tendencia poblacional hacia el aumento del número de leucocitos (glóbulos blancos) en la sangre. El hecho de que el 5% superior de las desviaciones cuadráticas supere el umbral crítico de 3.79 y que el 1% extremo alcance valores de 8.31 (con máximos de 11.54), revela estadísticamente la presencia de valores atípicos significativos.
## ESTADÍSTICAS DE VARIABILIDAD
## --------------------------
## n: 745 | Media: 1.127 mg/dL
## DE: 1.699 mg/dL | CV: 150.8 %
## Suma Z²: 744
## Rango Z²: [ 0 , 102.111 ]
##
## CUANTILES EMPÍRICOS
## ----------------------
## Q(0.01): 0.000
## Q(0.05): 0.002
## Q(0.25): 0.042
## Q(0.50): 0.136
## Q(0.75): 0.237
## Q(0.95): 2.118
## Q(0.99): 18.379
Dispersión extrema y altamente inestable (CV del 150.8%), superior a cualquier otra métrica biológica analizada, lo que indica que la varianza no se distribuye homogéneamente en la población. Al observar los cuantiles de la desviación cuadrática (\(Z^2\)), notamos un patrón clínico muy claro: hasta el percentil 75, las desviaciones son minúsculas (< 0.237), lo que sugiere que la inmensa mayoría de los pacientes mantiene una función hepática conservada con niveles cercanos al promedio. Sin embargo, la variabilidad total está agrupada por una minoría patológica crítica; el gran salto en el último percentil (donde el \(Z^2\) pasa de 2.1 a 18.38 y alcanza un máximo de 102.11) confirma que no estamos ante una degradación progresiva de la función del hígado en toda la muestra, sino ante la presencia puntual de casos de fallo hepático.
## ESTADÍSTICAS DE VARIABILIDAD
## --------------------------
## n: 1565 | Media: 33.221 %
## DE: 6.767 % | CV: 20.37 %
## Suma Z²: 1564
## Rango Z²: [ 0 , 11.033 ]
##
## CUANTILES EMPÍRICOS
## ----------------------
## Q(0.01): 0.000
## Q(0.05): 0.004
## Q(0.25): 0.139
## Q(0.50): 0.541
## Q(0.75): 1.336
## Q(0.95): 3.455
## Q(0.99): 6.147
Perfil de dispersión mucho más contenido que el observado en marcadores hepáticos, con un coeficiente de variación moderado del 20.37%. Si bien la media de 33.22% sugiere un desplazamiento general de la población hacia la anemia un fenómeno esperable en la UCI, la estructura de las desviaciones cuadráticas (\(Z^2\)) denota un comportamiento estadístico bastante coherente; la mediana empírica de 0.541 se aproxima a lo esperado teóricamente, lo que implica que la capacidad de transporte de oxígeno de la gran mayoría de los pacientes oscila de forma predecible en torno al promedio. No obstante, la cola superior de la variabilidad no debe ignorarse: con un percentil 99 situándose en 6.147 y máximos de 11.03.
## ESTADÍSTICAS DE VARIABILIDAD
## --------------------------
## n: 1163015 | Media: 95.765 %
## DE: 3.206 % | CV: 3.35 %
## Suma Z²: 1163014
## Rango Z²: [ 0.005 , 194.978 ]
##
## CUANTILES EMPÍRICOS
## ----------------------
## Q(0.01): 0.005
## Q(0.05): 0.005
## Q(0.25): 0.057
## Q(0.50): 0.303
## Q(0.75): 1.018
## Q(0.95): 2.209
## Q(0.99): 11.275
La mayor estabilidad homeostática del estudio (CV: 3.35%), con una media de 95.77% que refleja un estricto control clínico para mantener la parcial de oxígeno en la sangre arterial. La distribución de las desviaciones cuadráticas muestra una concentración masiva en torno al promedio (mediana \(Z^2\): 0.303); no obstante, el valor máximo de 194.98 revela la existencia de eventos puntuales de desaturación extrema que, aunque estadísticamente atípicos, representan situaciones de disminución del oxígeno crítica alejadas más de 13 desviaciones estándar de la normalidad.
## GRUPOS COMPARADOS
## -----------------
## Intubados :
## n = 235 | Media = 83.089 | Varianza = 2072.073 mmHg
## No Intubados :
## n = 1906 | Media = 84.846 | Varianza = 1529.748 mmHg
##
## TEST F DE SNEDECOR
## ------------------
## F = 1.3545 (gl1 = 234 , gl2 = 1905 )
## p-value = 0.000584
## Razón de varianzas: 1.3545
##
## CUANTILES DE F TEÓRICA
## ---------------------
## Q(0.25) = 0.9331
## Q(0.50) = 0.9975
## Q(0.75) = 1.0651
## Q(0.90) = 1.1288
## Q(0.95) = 1.1683
El test F de Snedecor rechaza contundentemente la hipótesis de homogeneidad de varianzas (\(F=1.35, p < 0.001\)), evidenciando una heterocedasticidad clínicamente relevante. El grupo de pacientes intubados presenta una dispersión significativamente mayor (varianza de 2072 frente a 1530 mmHg), lo que indica que el soporte ventilatorio o la gravedad subyacente inducen una circulación inestable , caracterizada por oscilaciones de la presión arterial media un 35% más amplias que las observadas en los pacientes no intubados, quienes mantienen un perfil tensional más predecible.
Un estimador puntual es una función que transforma datos muestrales en una única estimación de un parámetro poblacional desconocido:
\[\hat{\theta} = T(X_1, X_2, \ldots, X_n)\]
donde \(T\) es una función medible que no depende del parámetro \(\theta\) que queremos estimar.
Método de los Momentos (MOM): Iguala los momentos muestrales con sus correspondientes momentos poblacionales. Por ejemplo, para estimar \(\mu\): \[\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i = E[X] = \mu\]
Máxima Verosimilitud (MLE): Encuentra el valor del parámetro que maximiza la probabilidad de observar los datos: \[\hat{\theta}_{MLE} = \arg\max_{\theta} L(\theta|x_1,\ldots,x_n)\]
¿Qué debería cumplir nuestro estimador para considerarlo bueno?
1. Insesgadez Un estimador es insesgado cuando su valor esperado coincide exactamente con el parámetro poblacional que pretende estimar \[E[\hat{\theta}] = \theta\] Esto significa que si repitiéramos el proceso de muestreo infinitas veces, el promedio de todas las estimaciones obtenidas convergiría al valor verdadero del parámetro, aunque estimaciones individuales puedan estar por encima o por debajo del valor real.
2. Mínimo Error Cuadrático Medio
El Error Cuadrático Medio cuantifica la calidad de un estimador al combinar tanto su varianza como su sesgo al cuadrado.
\[\text{ECM}(\hat{\theta}) = \text{Var}(\hat{\theta}) + [\text{Sesgo}(\hat{\theta})]^2\]
Esta métrica permite comparar estimadores que pueden tener diferentes balances entre precisión y exactitud, reconociendo que en ocasiones un pequeño sesgo puede compensarse con una reducción significativa en la variabilidad, resultando en un mejor estimador en términos del error total.
3. Eficiencia (Cota de Cramér-Rao)
La eficiencia de un estimador insesgado se evalúa comparando su varianza con la cota inferior de Cramér-Rao, que establece el mínimo teórico alcanzable
\[\text{Var}(\hat{\theta}) \geq \frac{1}{nI(\theta)}\]
I(θ) es la información de Fisher( (que mide la cantidad de información que los datos observables proporcionan sobre el parámetro desconocido)).
Un estimador que alcanza esta cota se denomina eficiente y representa el mejor estimador insesgado posible, ya que extrae la máxima información disponible en la muestra sobre el parámetro de interés.
4. Consistencia
Un estimador es consistente cuando converge en probabilidad al valor verdadero del parámetro a medida que el tamaño muestral aumenta indefinidamente.
\[\hat{\theta}_n \xrightarrow{P} \theta \quad \text{cuando } n \to \infty\]
Esta propiedad asintótica garantiza que con muestras suficientemente grandes, la probabilidad de que el estimador esté arbitrariamente cerca del parámetro verdadero se aproxima a uno, lo cual es fundamental para la validez de las inferencias estadísticas en estudios con grandes volúmenes de datos.
5. Normalidad Asintótica
La normalidad asintótica establece que la distribución del estimador, apropiadamente estandarizada, converge a una distribución normal cuando el tamaño muestral tiende a infinito.
\[\sqrt{n}(\hat{\theta}_n - \theta) \xrightarrow{d} N(0, \sigma^2)\]
Esta propiedad permite construir intervalos de confianza y realizar pruebas de hipótesis basadas en la distribución normal, incluso cuando desconocemos la distribución exacta del estimador para muestras finitas.
Un estimador puede ser insesgado pero inconsistente, o sesgado pero con menor ECM que uno insesgado
Cuál es la media real de la presión arterial en la población y con qué nivel de certeza podemos afirmar su valor?
Nos enfrentamos a una muestra masiva de 227380 registros clínicos, una cantidad de información grande que garantiza estabilidad. Al buscar el “centro” de comportamiento de la presión arterial tanto el método de los momentos como la máxima verosimilitud coinciden en una media de 80.38 mmHg. Este nos dice que, a pesar de haber encontrado valores extremos en el rango (desde 1 hasta 199 mmHg), el punto de equilibrio de la población es robusto.
## 1. CARACTERÍSTICAS DE LA MUESTRA
## ----------------------------------
## Tamaño muestral: n = 227380
## Rango: [1.00, 199.00] mmHg
## Media muestral: 80.3765 mmHg
## Varianza muestral: 268.1945 mmHg²
## 2. ESTIMADORES PUNTUALES
## ----------------------------------
## MÉTODO DE LOS MOMENTOS:
## μ̂_MOM = m₁ = 80.3765 mmHg
## σ²_MOM = m₂ - m₁² = 268.1933 mmHg²
## MÉTODO DE MÁXIMA VEROSIMILITUD:
## μ̂_MLE = X̄ = 80.3765 mmHg
## σ²_MLE = (1/n)Σ(xᵢ-x̄)² = 268.1933 mmHg²
## ESTIMADOR INSESGADO:
## S² = (1/(n-1))Σ(xᵢ-x̄)² = 268.1945 mmHg²
Cuando analizamos la variabilidad observamos que el estimador de máxima verosimilitud carga con un sesgo matemático, la magnitud de nuestra muestra reduce este “error” hasta hacerlo desaparecer. El sesgo calculado es del 0.001%, lo que significa que la varianza de 268.19 mmHg2 describe la dispersión de los datos sin necesidad de correcciones adicionales.
## 3. PROPIEDADES DE LOS ESTIMADORES
## ----------------------------------
## A) INSESGADEZ:
## E[μ̂_MLE] = μ → INSESGADO
## E[σ²_MLE] = [(n-1)/n]σ² → SESGADO
## E[S²] = σ² → INSESGADO
## Sesgo de σ²_MLE = -0.0012 (0.00%)
## B) ERROR CUADRÁTICO MEDIO:
## Var(μ̂) = σ²/n = 0.001179
## ECM(μ̂) = 0.001179
## C) COTA DE CRAMÉR-RAO:
## Información de Fisher: I(μ) = n/σ²
## Cota CR para μ̂ = 0.001179
## Var(μ̂) = 0.001179
## CONCLUSIÓN: μ̂ alcanza la cota → ES UMVUE
Finalmente, el tamaño muestral nos permite aplicar la Normalidad Asintótica, garantizando que la distribución del estimador converge a una campana de Gauss perfecta
\[\sqrt{n}(\hat{\mu} - \mu) \xrightarrow{d} N(0, \sigma^2)\]
Esta propiedad reduce la incertidumbre a un Error Estándar mínimo de 0.0343 mmHg, lo que agrupa nuestra inferencia en un intervalo de confianza del 95% estrecho: [80.3092, 80.4438] mmHg. No solo sabemos dónde está la media, sino que hemos acotado su ubicación con una gran precisión.
## 4. PROPIEDADES ASINTÓTICAS
## ----------------------------------
## NORMALIDAD ASINTÓTICA:
## √n(μ̂ - μ) →ᵈ N(0, σ²)
## Error estándar: SE(μ̂) = 0.0343 mmHg
## IC 95%: [80.3092, 80.4438] mmHg
¿Es posible obtener estimaciones precisas de un parámetro poblacional incluso cuando los datos presentan una alta sobredispersión?
El análisis sobre 1517 pacientes arroja una media de 11.71 células/mm³, valor en el que convergen idénticamente los métodos de Momentos y Máxima Verosimilitud. Sin embargo, la muestra revela una fuerte sobredispersión: la varianza (51.15) supera ampliamente a la media, evidenciando que la realidad con rangos extremos de 0.10 a 82.50 células/mm³ es más volátil que lo que asume un modelo Poisson puro, aunque el estimador de la media permanece robusto.
## 1. CARACTERÍSTICAS DE LA MUESTRA
## ----------------------------------
## Tamaño muestral: n = 1517
## Rango: [0.10, 82.50] células/mm³
## Media muestral: 11.7082
## Varianza muestral: 51.1533
En términos de eficiencia estadística, el estimador \(\hat{\lambda}\) resulta aceptable. Es insesgado y su varianza (\(\approx 0.0077\)) iguala matemáticamente a la Cota de Cramér-Rao. Esto lo fija como el estimador Insesgado de Varianza Mínima Uniforme (UMVUE); es decir, hemos extraído toda la información posible de la muestra, logrando la máxima precisión teórica alcanzable bajo este modelo.
## 2. ESTIMADORES PUNTUALES
## ----------------------------------
## MÉTODO DE LOS MOMENTOS:
## Igualamos: E[X] = λ con m₁ = X̄
## λ̂_MM = X̄ = 11.7082 células/mm³
## MÉTODO DE MÁXIMA VEROSIMILITUD:
## Log-verosimilitud: ℓ(λ) = Σxᵢ log(λ) - nλ - Σlog(xᵢ!)
## Derivada: dℓ/dλ = Σxᵢ/λ - n = 0
## λ̂_MLE = X̄ = 11.7082 células/mm³
## 3. PROPIEDADES DE LOS ESTIMADORES
## ----------------------------------
## A) INSESGADEZ:
## E[λ̂] = E[X̄] = E[(1/n)ΣXᵢ] = λ
## El estimador es INSESGADO
## B) VARIANZA Y ECM:
## Var(λ̂) = λ/n = 11.7082/1517 = 0.007718
## ECM(λ̂) = Var(λ̂) = 0.007718 (sesgo = 0)
## C) COTA DE CRAMÉR-RAO:
## Información de Fisher: I(λ) = n/λ
## I(λ) = 1517/11.7082 = 129.5668
## Cota CR = 1/I(λ) = 0.007718
## Var(λ̂) = 0.007718
## Diferencia = 0.00000000
## CONCLUSIÓN: λ̂ alcanza la cota de Cramér-Rao → ES UMVUE
La normalidad asintótica derivada del tamaño muestral reduce la incertidumbre a un error estándar marginal de 0.0879. Esto nos permite acotar la media poblacional en un intervalo de confianza del 95% sumamente estrecho: [11.54, 11.88] células/mm³. A pesar de la inestabilidad individual de los pacientes, hemos determinado el parámetro central de la población con gran precisión.
## 4. PROPIEDADES ASINTÓTICAS
## ----------------------------------
## NORMALIDAD ASINTÓTICA:
## √n(λ̂ - λ) →ᵈ N(0, λ)
## Error estándar: SE(λ̂) = 0.0879
## IC 95%: [11.5361, 11.8804] células/mm³
¿Cuál es el balance óptimo entre insesgadez y eficiencia al estimar parámetros de distribuciones complejas con datos reales?
El modelado de la estancia hospitalaria se realiza sobre una muestra de 3676 pacientes, caracterizada por una fuerte asimetría y una varianza muestral (11.72 días) que fija la media en (2.67 días). Mientras el MOM sugiere una forma de \(\approx 0.61\), el MLE propone un \(\alpha \approx 1.32\). Ante esta discrepancia, priorizamos los estimadores de Máxima Verosimilitud (\(\hat{\alpha}=1.322, \hat{\beta}=0.496\)) por su mayor eficiencia asintótica y capacidad para gestionar la estructura de probabilidad de los datos, logrando que la media estimada por el modelo (2.67 días) replique con exactitud el promedio observado en la realidad.
## ================================================================================
## CASO 3: DURACIÓN DE ESTANCIA EN UCI
## ================================================================================
## 1. CARACTERÍSTICAS DE LA MUESTRA
## ----------------------------------
## Tamaño muestral: n = 3676
## Rango: [0.17, 46.18] días
## Media muestral: 2.6674 días
## Varianza muestral: 11.7185 días²
Al evaluar la calidad de estos estimadores MLE, observamos un comportamiento asintótico muy favorable. Aunque en muestras finitas presentan un sesgo matemático, este resulta despreciable (sesgo de \(\hat{\alpha} \approx 0.00036\)), y sus varianzas son minúsculas. Es importante notar que, en este escenario complejo, el modelo Gamma logra capturar la tendencia central, aunque la varianza teórica derivada (5.38 días²) es inferior a la muestral; esto signfica que el modelo es conservador y que la “cola larga” de pacientes con estancias extremas (hasta 46 días) introduce una volatilidad adicional que afecta a la estructura estándar de la distribución.
## 2. ESTIMADORES PUNTUALES
## ----------------------------------
## MÉTODO DE LOS MOMENTOS:
## Sistema de ecuaciones:
## E[X] = α/β = X̄
## Var(X) = α/β² = S²
## Solución:
## α̂_MM = X̄²/S² = 0.6072
## β̂_MM = X̄/S² = 0.2276
## MÉTODO DE MÁXIMA VEROSIMILITUD:
## Log-verosimilitud: ℓ(α,β) = nα log(β) - n log(Γ(α)) + (α-1)Σlog(xᵢ) - βΣxᵢ
## (Resolución numérica por optimización)
## α̂_MLE = 1.3222
## β̂_MLE = 0.4957
## 3. PROPIEDADES DE LOS ESTIMADORES
## ----------------------------------
## A) INSESGADEZ:
## Los estimadores MLE son asintóticamente insesgados
## Sesgo aproximado de α̂: 0.000360
## B) VARIANZA DE LOS ESTIMADORES:
## Var(α̂) ≈ 0.000527
## Var(β̂) ≈ 0.000067
## C) ERROR CUADRÁTICO MEDIO:
## ECM(α̂) ≈ 0.000527
## ECM(β̂) ≈ 0.000067
## D) MATRIZ DE INFORMACIÓN DE FISHER Y COTAS CR:
## Cota CR para α̂: 0.000773
## Cota CR para β̂: 0.000159
Finalmente, la gran cantidad de datos nos permite aplicar la Normalidad Asintótica Bivariada para nuestras conclusiones. La incertidumbre sobre los parámetros es mínima, con errores estándar muy reducidos (\(\approx 0.028\) para \(\alpha\) y \(\approx 0.013\) para \(\beta\)). Esto se reduce en intervalos de confianza del 95% de alta precisión: ubicamos el parámetro de forma entre [1.27, 1.38] y la tasa entre [0.47, 0.52].
## 4. PROPIEDADES ASINTÓTICAS
## ----------------------------------
## NORMALIDAD ASINTÓTICA BIVARIADA:
## √n[(α̂, β̂)' - (α, β)'] →ᵈ N(0, I(θ)⁻¹)
## Error estándar de α̂: 0.0278
## IC 95% para α: [1.2677, 1.3766]
## Error estándar de β̂: 0.0126
## IC 95% para β: [0.4709, 0.5204]
## PARÁMETROS DERIVADOS:
## Media estimada (α̂/β̂): 2.6674 días
## Varianza estimada (α̂/β̂²): 5.3816 días²
Un contraste de hipótesis es un procedimiento que nos permite decidir, a partir de datos muestrales, si una afirmación sobre un parámetro poblacional es compatible con la evidencia observada. A diferencia de la estimación, donde buscamos cuantificar el valor de un parámetro, aquí el objetivo es validar o descartar una afirmación específica.
Todo contraste de hipótesis se organiza en torno a:
Al tomar una decisión estadística podemos equivocarnos de dos formas:
La potencia del test, definida como \(1 - \beta\), mide nuestra capacidad para detectar un efecto cuando realmente existe. Un test potente minimiza los errores tipo II.
Dependiendo de lo que busquemos detectar, el contraste puede formularse como:
¿Contamos con suficiente evidencia estadística para afirmar que la mortalidad en nuestra muestra es estructuralmente diferente al promedio del país?
La mortalidad constituye el indicador base en cualquier unidad de cuidados intensivos. Mientras que diversas fuentes que he consultado establecen un estándar nacional en torno al 12%, nuestra cohorte de 3676 pacientes presenta una realidad observada distinta, con una tasa de fallecimientos de apenas el 4.95%. Para determinar si esta discrepancia es una diferencia estructural real, sometimos los datos a un contraste de hipótesis bilateral, utilizando un test Z para proporciones tras verificar que el tamaño muestral garantizaba la aproximación normal.
## ================================================================================
## DATOS OBSERVADOS:
## ─────────────────
## Tamaño muestral: n = 3676 pacientes
## Número de fallecidos: 182
## Proporción observada: p̂ = 0.0495 (4.95%)
El valor del estadístico de prueba (\(Z = -13.15\)) se sitúa en la región de rechazo. La probabilidad de observar estos datos bajo la hipótesis nula es practicamente nula (\(p < 0.001\)). Esta distancia respecto al valor crítico estándar de 1.96 nos obliga a rechazar la hipótesis de igualdad con una seguridad estadística absoluta. No estamos ante una fluctuación aleatoria; la mortalidad en esta muestra no se comporta como el promedio nacional.
## FORMULACIÓN DE HIPÓTESIS:
## ──────────────────────────
## H₀: p = 0.12 (mortalidad igual a estimación nacional)
## H₁: p ≠ 0.12 (mortalidad difiere de la propocion)
## Nivel de significancia: α = 0.05
## Tipo de contraste: BILATERAL
## VERIFICACIÓN DE CONDICIONES (Aproximación Normal):
## n·p₀ = 3676 × 0.12 = 441.12 ≥ 5
## n·(1-p₀) = 3676 × 0.88 = 3234.88 ≥ 5
## ESTADÍSTICO DE PRUEBA (Test Z para proporciones):
## ──────────────────────────────────────────────────
## Error estándar bajo H₀: SE(p̂) = √[p₀(1-p₀)/n] = 0.005360
## Fórmula: Z = (p̂ - p₀) / SE(p̂)
## Z = (0.0495 - 0.12) / 0.005360 = -13.1517
## REGIÓN CRÍTICA Y VALOR P:
## ──────────────────────────
## Región crítica: |Z| > 1.9600
## Estadístico observado: |Z| = 13.1517
## Valor p (bilateral): 0.000000
## DECISIÓN: Se RECHAZA H₀ (p < 0.05)
## ────────────────────────────────────────────────────────────────────────────────
## CONCLUSIÓN ESTADÍSTICA:
## Existe evidencia significativa de que la mortalidad observada (4.95%)
## difiere del benchmark nacional (12.00%).
##
## INTERPRETACIÓN CLÍNICA:
## La mortalidad es menor que el estándar nacional.
El intervalo de confianza del 95% sitúa la verdadera mortalidad poblacional de estas unidades entre el 4.25% y el 5.65%, cifras que quedan muy por debajo del umbral del 12%. Todos los datos obtenidos nos ayudan a inferir que los hospitales participantes en la base de datos eICU tienen un desempeño alto, logrando tasas de supervivencia muy superiores a lo esperado para el estándar estadounidense.
## INTERVALO DE CONFIANZA 95% PARA p:
## ───────────────────────────────────
## IC 95% = [0.0425, 0.0565]
## IC 95% = [4.25%, 5.65%]
¿Puede la media poblacional de la presión arterial ocultar subgrupos críticos de pacientes que requieren atención urgente?
El análisis de la estabilidad relacionada con la tensin parte de la siguiente premisa: determinar si la Presión Arterial Media de la población ingresada se situaba, en promedio, por debajo del umbral de seguridad de 75 mmHg. Para ello, planteamos un contraste unilateral izquierdo sobre una muestra de 2141 mediciones, buscando evidencia estadística.
## DATOS OBSERVADOS:
## ─────────────────
## Tamaño muestral: n = 2141 mediciones
## PAM media: x̄ = 84.65 mmHg
## Desviación estándar: s = 39.86 mmHg
## Mediana: 65.00 mmHg
##
## Pacientes con PAM < 65 mmHg: 1044 (48.76%)
El test t de Student arrojó un estadístico de \(11.21\) con un valor p de \(1.00\), lo que nos impide rechazar la hipótesis nula. La razón es aritmética: la media muestral observada fue de 84.65 mmHg, un valor significativamente superior —y no inferior— al límite de 75 mmHg. Estadísticamente, podemos afirmar con un 95% de confianza que el parámetro poblacional promedio se encuentra entre 82.96 y 86.34 mmHg, descartando por completo la hipótesis de que la “población promedio” sufra hipotensión.
## CONTRASTE DE HIPÓTESIS:
## ───────────────────────
## H₀: μ ≥ 75 mmHg (PAM promedio es normotensa)
## H₁: μ < 75 mmHg (PAM promedio es baja - requiere intervención)
## Tipo de contraste: UNILATERAL IZQUIERDO
## Nivel de significancia: α = 0.05
## ESTADÍSTICO DE PRUEBA (t de Student):
## ──────────────────────────────────────
## SE(x̄) = s/√n = 39.86/√2141 = 0.8614 mmHg
## Fórmula: t = (x̄ - μ₀) / SE(x̄)
## t = (84.65 - 75) / 0.8614 = 11.2067
## Grados de libertad: gl = 2140
## REGIÓN CRÍTICA Y VALOR P:
## ──────────────────────────
## Valor crítico: t₀.₀₅,2140 = -1.6456
## Se rechaza H₀ si t < -1.6456
## Estadístico observado: t = 11.2067
## Valor p (unilateral izquierdo): 1.000000
## DECISIÓN: NO se rechaza H₀ (p ≥ 0.05)
## ────────────────────────────────────────────────────────────────────────────────
## No hay evidencia de que la PAM sea menor a 75 mmHg.
A pesar de que la media sugiere exceso de tensión, la mediana se sitúa exactamente en 65 mmHg y la desviación estándar es muy amplia (39.86 mmHg). Esto revela que, aunque el “paciente promedio” está estable, la media está inflada por valores altos (hipertensión), destcacando el hecho de que casi la mitad de la muestra (48.76%) está con exceso de tensión.
## INTERVALO DE CONFIANZA 95%:
## ────────────────────────────
## IC 95% = [82.96, 86.34] mmHg
¿Es la duración de estancia en nuestra UCI compatible con una gestión eficiente de recursos, o estamos enfrentando un problema de sobreocupación?
La eficiencia operativa de una Unidad de Cuidados Intensivos se mide por la rotación de camas, teniendo como referencia un estándar nacional de 4.5 días. Diseñamos un contraste unilateral derecho para detectar si el promedio de nuestra cohorte superaba significativamente dicho umbral. La hipótesis de “sobreocupación” fue sometida a test contra una muestra de 3676 pacientes.
## DATOS OBSERVADOS:
## ─────────────────
## Tamaño muestral: n = 3676 pacientes
## LOS media: x̄ = 2.67 días
## Desviación estándar: s = 3.42 días
## Mediana: 1.70 días
## Q1: 0.94 | Q3: 3.01 días
## DISTRIBUCIÓN POR CATEGORÍAS:
## Estancias cortas (< 2 días): 2136 (58.1%)
## Estancias normales (2-7 días): 1308 (35.6%)
## Estancias prolongadas (> 7 días): 232 (6.3%)
Con un valor t de -32.46 y un valor p de 1.00, la evidencia no solo falla en rechazar la hipótesis nula, sino que demuestra que la realidad de la unidad se sitúa en el extremo opuesto del riesgo planteado. La media observada de 2.67 días es sustancialmente inferior a la cantidad de 4.5 días.
## CONTRASTE DE HIPÓTESIS:
## ───────────────────────
## H₀: μ ≤ 4.5 días (LOS no excede e lporcentaje nacional)
## H₁: μ > 4.5 días (LOS es mayor - estancias prolongadas)
## Tipo de contraste: UNILATERAL DERECHO
## Nivel de significancia: α = 0.05
## ESTADÍSTICO DE PRUEBA:
## ──────────────────────
## SE(x̄) = 0.0565 días
## t = (2.67 - 4.5) / 0.0565 = -32.4570
## Grados de libertad: gl = 3675
## REGIÓN CRÍTICA Y VALOR P:
## ──────────────────────────
## Valor crítico: t₀.₉₅,3675 = 1.6453
## Estadístico observado: t = -32.4570
## Valor p: 1.000000
## DECISIÓN: NO se rechaza H₀
## La LOS no difiere significativamente del Proporcion Nacional
La discrepancia entre la media (2.67) y la mediana (1.70 días) revela una distribución asimétrica positiva, típica de los tiempos de servicio. El dato importante es que el 58.1% de los pacientes permanecen en la unidad menos de 48 horas. Por tanto, la conclusión no es solo que “no excedemos el tiempo estándar”, sino que la unidad opera con una dinámica de alta rotación, donde las estancias prolongadas son la excepción (solo un 6.3%) y no la norma.
¿Puede una temperatura promedio “normal” ocultar subgrupos críticos de pacientes con desregulación térmica compatible con sepsis?
El análisis de la termorregulación en una muestra de 109871 registros clinicos nos lleva a la distinción entre significancia estadística y relevancia clínica. Al contrastar la media observada de 37.10°C contra el estándar de 37.0°C, la inmensa potencia del test detecta una desviación infinitesimal como “altamente significativa” (\(t = 34.80, p < 0.001\)). Esto nos indica matemáticamente que la población tiende a una ligera elevación térmica, posiblemente debida al ambiente controlado de la UCI o procesos inflamatorios leves, pero el segundo contraste desactiva cualquier alarma generalizada: al probar si existe fiebre promedio (> 37.5°C), la evidencia es nula (\(p=1.00\)), confirmando que el “paciente medio” se mantiene en rangos de normotermia segura.
## DATOS OBSERVADOS:
## ─────────────────
## Tamaño muestral: n = 109871 mediciones
## Temperatura media: x̄ = 37.10°C
## Desviación estándar: s = 0.99°C
## Mediana: 37.17°C
## CLASIFICACIÓN SEGÚN CRITERIOS SIRS:
## Hipotermia (< 36°C): 6488 (5.9%)
## Normotermia (36.5-37.5°C): 60750 (55.3%)
## Fiebre (> 38°C): 11715 (10.7%)
## Criterio SIRS cumplido: 18203 (16.6%)
## ────────────────────────────────────────────────────────────────────────────────
## ────────────────────────────────────────────────────────────────────────────────
## HIPÓTESIS:
## H₀: μ = 37.0°C (temperatura media es normotermia)
## H₁: μ ≠ 37.0°C (temperatura difiere de normotermia)
## Tipo de contraste: BILATERAL
## ESTADÍSTICO DE PRUEBA:
## t = (37.10 - 37.0) / 0.002986 = 34.7970
## Grados de libertad: gl = 109870
## DECISIÓN:
## Valores críticos: ±1.9600
## Estadístico: t = 34.7970
## Valor p: 0.000000
## CONCLUSIÓN: La temperatura media DIFIERE significativamente de normotermia.
## Temperatura ELEVADA - sugiere proceso inflamatorio/infeccioso.
Sin embargo, en el diagnóstico de sepsis, el peligro no reside en el promedio, sino en la dispersión. Aunque la tendencia central es estable, el análisis de las colas de la distribución revela una realidad clínica preocupante: un 16.6% de las mediciones activan los criterios del Síndrome de Respuesta Inflamatoria Sistémica (SIRS). Este subgrupo se divide entre un 10.7% con fiebre leve y un 5.9% con hipotermia, demostrando que, aunque la unidad en su conjunto parece estable, uno de cada seis registros alerta sobre una posible gran desregulación térmica compatible con un cuadro séptico activo.
## HIPÓTESIS:
## H₀: μ ≤ 37.5°C (no hay fiebre promedio)
## H₁: μ > 37.5°C (hay fiebre promedio - indicativo de sepsis)
## Tipo de contraste: UNILATERAL DERECHO
## ESTADÍSTICO DE PRUEBA:
## t = (37.10 - 37.5) / 0.002986 = -132.6659
## Valor crítico: t₀.₉₅,109870 = 1.6449
## Valor p: 1.000000
## DECISIÓN: NO se rechaza H₀
## No hay evidencia suficiente de fiebre promedio.
## ────────────────────────────────────────────────────────────────────────────────
## ANÁLISIS COMPLEMENTARIO: PROPORCIÓN CON CRITERIO SIRS
## ────────────────────────────────────────────────────────────────────────────────
## Mediciones con criterio SIRS: 18203 de 109871 (16.57%)
## (Temperatura < 36°C o > 38°C)
## H₀: p = 0.30 | H₁: p ≠ 0.30
## Z = -97.1595 | Valor p: 0.000000
## La proporción con criterio SIRS difiere significativamente.
¿Es la probabilidad de alta hospitalaria constante a lo largo del tiempo, o varía según los días de permanencia del paciente en la UCI?
¿Es la probabilidad de recibir el alta constante día a día, o evoluciona según el tiempo que el paciente lleva ingresado? Para resolverlo, enfrentamos la simplicidad del modelo Exponencial (que asume un proceso “sin memoria”, donde la probabilidad de salir es idéntica el día 1 que el día 10) contra la flexibilidad de la distribución Gamma mediante un Test de Razón de Verosimilitudes.
## CONTEXTO:
## ─────────
## H₀: LOS ~ Exponencial(λ) - Riesgo de alta constante
## H₁: LOS ~ Gamma(α, β) - Riesgo de alta variable según días
Con un estadístico de contraste de \(D = 163.59\) y una diferencia significativa en los logaritmos de verosimilitud, rechazamos categóricamente la hipótesis nula (\(p < 0.001\)). El modelo Exponencial es insuficiente para describir la realidad de la unidad.
## RESULTADOS:
## ───────────
## Log-Lik Gamma (H₁): -7200.81
## Log-Lik Exponencial (H₀): -7282.60
## Estadístico D = 163.59
## Valor p (χ² con gl=1): 0.000000
## DECISIÓN: Se RECHAZA H₀
## ────────────────────────────────────────────────────────────────────────────────
## CONCLUSIÓN CLÍNICA:
## La distribución Gamma es necesaria
## La probabilidad de alta no es constante
## Varía según cuántos días lleva el paciente ingresado
## El modelo tiene 'memoria' del proceso
Este rechazo confirma que el proceso de alta tiene “memoria”. La probabilidad de que un paciente abandone la unidad no es uniforme, sino que depende de su historial temporal. El ajuste superior del modelo Gamma valida la existencia de diferentes dinámicas de recuperación, demostrando que es imprescindible utilizar modelos que permitan tasas de riesgo variables
¿Es la presión arterial media de 82.53 mmHg compatible con el estándar de 75 mmHg, o estamos ante una población con características hemodinámicas distintas?
Partiendo del supuesto fuerte de una variabilidad poblacional conocida (\(\sigma = 12\) mmHg, aplicamos un Test Z para evaluar el estado hemodinámico de 2205 pacientes. El objetivo, verificar si la media observada de 82.53 mmHg se alinea con la referencia estándar de 75 mmHg.
## ================================================================================
## CASO 7: TEST Z PARA MEDIA DE PAM (VARIANZA CONOCIDA)
## ================================================================================
## DATOS Y PARÁMETROS:
## n = 2205 | x̄ = 82.53 mmHg
## σ conocida = 12.00 mmHg (dato histórico)
## μ₀ = 75.00 mmHg
## HIPÓTESIS:
## H₀: μ = 75.00 mmHg
## H₁: μ ≠ 75.00 mmHg
## ESTADÍSTICO DE PRUEBA:
## Z = (x̄ - μ₀)/(σ/√n) = 29.4735
## Valor p: 0.000000
## DECISIÓN: Se rechaza H₀
## La PAM media difiere significativamente de 75 mmHg.
Con un estadístico Z de 29.47, la media muestral se aleja casi 30 errores estándar de la hipótesis nula, arrojando un valor p indistinguible de cero. Esto nos lleva a rechazar la igualdad: la desviación no es un elemento del azar ni un error de muestreo. La población estudiada mantiene un perfil tensional estructuralmente superior respecto al modelo teórico, confirmando una tendencia sistemática hacia valores más elevados que el estándar de referencia.
Estudiando un escenario clínico más veraz, prescindimos del conocimiento a priori de la varianza poblacional para estimarla directamente desde los datos mediante la desviación estándar muestral (\(s\)). Esta aproximación, ejecutada a través de la distribución t de Student, introduce una penalización necesaria por la incertidumbre adicional, ofreciendo una inferencia más conservadora y realista que el test Z anterior.
## RESULTADOS DEL TEST T:
## Estadístico t: 8.4261
## Grados de libertad: 2204
## Valor p: 0.000000
## IC 95%: [80.78, 84.28] mmHg
## INTERPRETACIÓN:
## El test t penaliza ligeramente la certeza al estimar σ de los datos,
## siendo más conservador y realista que el test Z.
El estadístico t de 8.43 y un valor p nulo confirman que la discrepancia observada no varia al ajustar la varianza.
¿Difieren los pacientes intubados de los no intubados en términos de presión arterial media?
¿Altera significativamente la presión arterial media del paciente? Para responderlo, aplicamos una prueba t de Welch, una elección metodológica necesaria ante el desequilibrio notable en los tamaños muestrales (235 pacientes intubados frente a 1,970 espontáneos).
## TAMAÑOS MUESTRALES:
## Intubados: n₁ = 235
## No intubados: n₂ = 1970
## RESULTADOS:
## Media intubados: 83.09 mmHg
## Media no intubados: 82.47 mmHg
## Diferencia: 0.62 mmHg
## Estadístico t: 0.2004
## Valor p: 0.841325
La diferencia observada entre las medias de ambos grupos es de apenas 0.62 mmHg, una cifra clínicamente imperceptible que se traduce en un estadístico t de 0.20. Con un valor p de 0.84, la evidencia estadística confirma la ausencia total de significancia; es decir, el estado de intubación no determina el nivel promedio de presión arterial en esta cohorte.
¿Influye la tipología de la unidad de cuidados intensivos (Cardíaca, Neurológica, Quirúrgica) en la tasa de mortalidad de los pacientes ingresados?
Al desagregar la mortalidad según la tipología de la unidad (Cardíaca, Neurológica, Quirúrgica, etc.), nos enfrentamos al riesgo estadístico de encontrar falsas diferencias por el hecho de realizar múltiples cruces simultáneos. Para la validez de nuestras conclusiones, aplicamos la corrección de Bonferroni, el método más conservador para controlar la inflación del error de Tipo I.
## RESULTADOS (p-valores ajustados):
##
## Pairwise comparisons using Pairwise comparison of proportions
##
## data: table(mort_data_bonf$UCI, mort_data_bonf$Mortalidad)
##
## Cardiac ICU CCU-CTICU CSICU CTICU Med-Surg ICU MICU Neuro ICU
## CCU-CTICU 1 - - - - - -
## CSICU 1 1 - - - - -
## CTICU 1 1 1 - - - -
## Med-Surg ICU 1 1 1 1 - - -
## MICU 1 1 1 1 1 - -
## Neuro ICU 1 1 1 1 1 1 -
## SICU 1 1 1 1 1 1 1
##
## P value adjustment method: bonferroni
##
## INTERPRETACIÓN:
## Valores p < 0.05 indican diferencias significativas entre pares de UCIs.
Todos los valores p ajustados alcanzan 1, lo que indica que no existe ninguna diferencia estadísticamente significativa entre pares de unidades. Estadísticamente, el riesgo de fallecimiento es indistinguible entre una UCI Médica, una Neuro-UCI o una unidad Coronaria;
La estimación puntual proporciona un único valor como aproximación de un parámetro poblacional desconocido, pero carece de información sobre la incertidumbre asociada al proceso de muestreo. Los intervalos de confianza complementan esta limitación al construir un rango de valores plausibles que, con una probabilidad controlada, contiene el parámetro de interés.
Definición formal:
Un intervalo de confianza del \((1-\alpha) \times 100\%\) para un parámetro \(\theta\) es un par de estadísticos \([L(X_1, \ldots, X_n), U(X_1, \ldots, X_n)]\) tales que:
\[P[L \leq \theta \leq U] = 1 - \alpha\]
donde \(L\) y \(U\) son los límites inferior y superior calculados a partir de los datos muestrales, y \(\alpha\) representa el nivel de significancia (típicamente 0.05 para intervalos del 95%).
Construcción general:
Para un estimador \(\hat{\theta}\) con distribución conocida o asintóticamente normal, el intervalo de confianza se construye como:
\[\text{IC}_{1-\alpha} = \hat{\theta} \pm z_{\alpha/2} \cdot SE(\hat{\theta})\]
donde:
Factores que afectan la amplitud:
Tipos de intervalos según el parámetro:
La estimación puntual de la mortalidad, fijada en un 4.95%, adquiere mayor dimensión. Con una seguridad del 95%, hemos logrado acotar la verdadera tasa de fallecimientos de la población entre el 4.25% y el 5.65%. La relevancia de este hallazgo no reside solo en las cifras bajas, sino en la precisión de la estimación: la estrechez del intervalo (apenas un 1.4% de margen) confirma que la baja letalidad observada no es un artefacto estadístico ni una casualidad muestral, sino una métrica robusta que certifica el alto desempeño asistencial de estas unidades.
## Proporción observada: 0.0495 (4.95%)
## IC 95%: [0.0425, 0.0565] = [4.25%, 5.65%]
Al construir los intervalos de confianza, logramos acotar el parámetro de forma (\(\alpha\)) en un rango estricto de [1.27, 1.38].El parámetro de tasa (\(\beta\)) queda confinado entre [0.47, 0.52]. La estrechez de estos márgenes muestra que el modelo ajustado es estructuralmente robusto.
## α̂ ± 1.96×SE(α̂): [1.2677, 1.3766]
## β̂ ± 1.96×SE(β̂): [0.4709, 0.5204]
##
## Media derivada: 2.67 días
A pesar de que la desviación estándar (3.42 días) supera a la propia media, reflejando una volatilidad individual donde conviven altas rápidas con ingresos crónicos, el gran tamaño muestral logra compensar esta dispersión. El resultado es un intervalo de confianza del 95% extraordinariamente preciso: [2.56, 2.78] días.
## ESTADÍSTICOS MUESTRALES:
## n = 3676 pacientes
## Media: 2.67 días
## Desviación estándar: 3.42 días
## Error estándar: 0.0565 días
## INTERVALO DE CONFIANZA 95%:
## IC = [2.56, 2.78] días
## INTERPRETACIÓN CLÍNICA:
## La duración media de estancia poblacional está entre 2.56 y 2.78 días.
La dispersión muestral típica de casi un grado (\(s=0.99^{\circ}\text{C}\)) desaparece casi por completo al inferir el promedio poblacional, resultando en un pequeño error estándar. Esto nos permite acotar la verdadera temperatura media de la población en un intervalo del 95% de anchura pequeña: [37.098, 37.110] \(^{\circ}\text{C}\).
La temperatura media “central” de la UCI no oscila; está clavada matemáticamente en 37.1 \(^{\circ}\text{C}\) con una precisión de milésimas
## ESTADÍSTICOS MUESTRALES:
## n = 109871 mediciones
## Media: 37.104°C
## Desviación estándar: 0.990°C
## Error estándar: 0.002986°C
## INTERVALO DE CONFIANZA 95%:
## IC = [37.098, 37.110]°C
## INTERPRETACIÓN CLÍNICA:
## .
La estimación de la prevalencia de hipotensión severa (PAM < 65 mmHg) muestra que al calcular el intervalo de confianza mediante el método de Wilson, confirmamos con un 95% de seguridad que entre el 47.98% y el 52.15% de los pacientes se encuentran en estado de shock.
Aunque la presión media general parece adecuada (como vimos en contrastes anteriores), la realidad distributiva es que la mitad de la población está cruzando el umbral crítico de seguridad. Esto implica que la inestabilidad no es una complicación esporádica, sino la condición predominante.
## PROPORCIÓN DE PACIENTES CON HIPOTENSIÓN SEVERA:
## n = 2205 mediciones
## Casos PAM < 65: 1104
## Proporción: 0.5007 (50.07%)
## IC 95% (Wilson):
## [0.4798, 0.5215] = [47.98%, 52.15%]
## INTERPRETACIÓN CLÍNICA:
## Más del 10% de pacientes presentan hipotensión severa.
## .
La evaluación de la eficiencia del intercambio gaseoso, cuantificada mediante el ratio PaO₂/FiO₂, MUESTRA una realidad en la muestra de 395 pacientes. La estimación puntual sitúa la media en 241.88 mmHg, pero es el Intervalo de Confianza del 95% el que define el perfil de gravedad de la unidad, acotando el verdadero promedio poblacional entre [230.30, 253.45] mmHg.
El hecho de que incluso el límite superior del intervalo (253 mmHg) se mantenga significativamente por debajo del umbral crítico de 300 mmHg frontera diagnóstica de la lesión pulmonar aguda demuestra estadísticamente que la población promedio cumple los criterios del Síndrome de Dificultad Respiratoria Aguda (SDRA). No estamos ante casos aislados de hipoxemia; la inferencia confirma que la insuficiencia respiratoria es la condición predominante en este subgrupo, lo que justifica la alta demanda de soporte ventilatorio y terapias de rescate en la unidad.
## ESTADÍSTICOS P/F RATIO:
## n = 395 mediciones
## Media: 241.88 mmHg
## Desviación estándar: 117.01 mmHg
## Error estándar: 5.8874 mmHg
## IC 95%: [%.2f, %.2f] mmHg
##
## 230.3034 253.4528
## INTERPRETACIÓN CLÍNICA:
## El IC completo está por debajo de 300 mmHg.
## Población cumple criterios de SDRA.
La estratificación de la gravedad en el Síndrome de Dificultad Respiratoria Aguda (SDRA) nos lleva a: aquellos pacientes con una ratio PaO₂/FiO₂ inferior a 100 mmHg, candidatos a terapias de rescate invasivas. La estimación puntual revela que el 18.9% de la cohorte padece esta condición extrema.
## DATOS OBSERVADOS:
## Población SDRA: 450 pacientes
## Casos Severos (P/F < 100): 85
## Proporción: 0.189 (18.9%)
## IC 95% (MÉTODO WILSON):
## IC = [0.155, 0.228]
## IC = [15.5%, 22.8%]
## IMPLICACIÓN PARA RECURSOS:
## ───────────────────────────
## Si ingresan 500 SDRAs al año, se esperan entre 78 y 114 casos severos.
## PLANIFICACIÓN: Preparar recursos para hasta 114 pacientes
Al asumir como válida la variabilidad histórica (\(\sigma = 12\) mmHg), eliminamos la incertidumbre asociada a la estimación de la desviación estándar muestral. El resultado es una inferencia de gram precisión : con un margen de error de apenas 0.50 mmHg, acotamos la presión arterial media verdadera en el rango de [82.03, 83.03] mmHg.
Mientras que el enfoque conservador arrojaba una amplitud de 3.51 mmHg, la incorporación del dato ha reducido la anchura del intervalo a 1.00 mmHg. Al conocer la dispersión poblacional real, nuestra capacidad para localizar el promedio se multiplica.
## ESTADÍSTICOS:
## n = 2205 mediciones
## Media muestral: 82.53 mmHg
## σ conocida: 12.00 mmHg
## Error estándar: 0.2556 mmHg
## Margen de error (±): 0.50 mmHg
## INTERVALO DE CONFIANZA 95% (MÉTODO Z):
## IC = [82.03, 83.03] mmHg
## INTERPRETACIÓN CLÍNICA:
## Con 95% de confianza, la PAM media verdadera está entre 82.0 y 83.0 mmHg.
##
## El intervalo sugiere estabilidad hemodinámica adecuada (>65 mmHg).
##
## COMPARACIÓN DE MÉTODOS:
## Amplitud IC (Z): 1.00 mmHg
## Amplitud IC (t): 3.51 mmHg
## Diferencia: 2.50 mmHg (t es 250.0% más ancho)
Al abordar la estimación de la frecuencia cardíaca, adoptamos la postura más realista posible: renunciamos a cualquier supuesto y estimamos la variabilidad directamente desde los datos muestrales (\(s = 18.09\) lpm) utilizando la distribución t de Student. En teoría, esta incertidumbre adicional debería penalizar la precisión de nuestra inferencia ensanchando el intervalo.
La convergencia asintótica es tal que la distribución t se vuelve indistinguible de la normal. El resultado es un intervalo de confianza de una precisión quirúrgica: [85.44, 85.49] lpm.
La amplitud total del intervalo es de apenas 0.05 latidos, una cifra fisiológicamente irrelevante. Esto nos permite afirmar que, a pesar de la enorme variabilidad individual (taquicardias, bradicardias), el “corazón colectivo” de la unidad late con una estabilidad promedio absoluta en torno a los 85 lpm, situándose cómodamente dentro del rango de normalidad fisiológica pero con una clara tendencia hacia el límite superior, propio del estrés metabólico del paciente crítico.
## ESTADÍSTICOS MUESTRALES:
## n = 1627894 mediciones
## Media: 85.46 lpm
## Desviación estándar (S): 18.09 lpm
## Error estándar: 0.0142 lpm
## Valor crítico t(1627893): 1.9600
## INTERVALO DE CONFIANZA 95% (t-STUDENT):
## IC = [85.44, 85.49] lpm
## INTERPRETACIÓN CLÍNICA:
## Frecuencia cardíaca promedio en rangos normales (60-90 lpm).
Bajo la premisa de homocedasticidad asumiendo que la variabilidad en la duración de la estancia es intrínseca a la patología y no al genero del paciente, comparamos el consumo de recursos entre hombres (\(n=2104\)) y mujeres (\(n=1565\)). El análisis arroja una paridad técnica: con medias de 2.68 y 2.66 días respectivamente, la brecha observada es de apenas 0.02 días.
El intervalo de confianza para la diferencia de medias, situado en [-0.20, 0.25] días, valida esta equivalencia al incluir el cero de manera centrada. Con un valor p de 0.84, la evidencia estadística confirma que no existe un patrón de estancia diferencial.
## ESTADÍSTICOS POR GRUPO:
## Hombres: n = 2104 | Media = 2.68 días | SD = 3.45
## Mujeres: n = 1565 | Media = 2.66 días | SD = 3.40
## RESULTADOS DEL TEST POOLED:
## ────────────────────────────
## Diferencia de medias: 0.02 días
## IC 95% Diferencia: [-0.20, 0.25] días
## Estadístico t: 0.2061
## Valor p: 0.836745
## INTERPRETACIÓN CLÍNICA:
## No hay diferencia significativa en la estancia
## hospitalaria atribuible al género bajo el supuesto de varianzas iguales.
## ..
La evaluación de la respuesta hemodinámica a la norepinefrina se realizó mediante un diseño pareado sobre 113036 pares de observaciones, una metodología que elimina la variabilidad al utilizar a cada paciente como su propio control.
Lejos de observar el incremento esperado, los datos muestran una reducción media de 0.34 mmHg tras la administración del fármaco. La signficatividad estadística de la muestra es tal que este descenso, aunque clínicamente minúsculo, resulta altamente significativo (\(p < 0.001\)).
El intervalo de confianza del 95% para este cambio se sitúa entre [-0.47, -0.22] mmHg, confirmando que la tendencia poblacional es hacia una leve depresión tensional .
## VERIFICACIÓN DE DATOS:
## Pares de observaciones: 113036
## PAM Pre-Infusión: Media = 80.39 mmHg | SD = 15.58
## PAM Post-Infusión: Media = 80.05 mmHg | SD = 15.01
## HIPÓTESIS:
## H₀: μ_diferencia = 0 (sin efecto del vasopresor)
## H₁: μ_diferencia ≠ 0 (hay efecto del vasopresor)
## RESULTADOS DEL TEST PAREADO:
## ─────────────────────────────
## Cambio Medio (Efecto): -0.34 mmHg
## IC 95% del Cambio: [-0.47, -0.22] mmHg
## Estadístico t(113035): -5.3361
## Valor p: 0.000000
## INTERPRETACIÓN CLÍNICA:
## EFECTO ADVERSO: La infusión redujo la PAM en 0.3 mmHg.
## .
El modelo de regresión lineal clásico asume que la variable respuesta es continua, normal y con varianza constante. Sin embargo, muchos desenlaces en medicina no cumplen estas condiciones: mortalidad (binaria), número de complicaciones (recuento), tiempo de ventilación (positivo y asimétrico). Los Modelos Lineales Generalizados (GLM) extienden la regresión lineal para adaptarse a estas distribuciones mediante tres componentes.
Todo GLM se define mediante:
1. Componente aleatorio
La variable respuesta \(Y_i\) sigue una distribución de la familia exponencial:
\[Y_i \mid \mathbf{x}_i \sim f(y_i; \theta_i, \phi)\]
donde \(\theta_i\) es el parámetro natural y \(\phi\) el parámetro de dispersión. Esta familia incluye las distribuciones normal, binomial, Poisson, gamma y otras.
2. Predictor lineal
Los predictores se combinan linealmente:
\[\eta_i = \mathbf{x}_i^\top \boldsymbol{\beta} = \beta_0 + \beta_1 x_{i1} + \cdots + \beta_p x_{ip}\]
3. Función de enlace
Relaciona la media esperada \(\mu_i = E[Y_i \mid \mathbf{x}_i]\) con el predictor lineal:
\[g(\mu_i) = \eta_i\]
La función \(g\) debe ser monótona y diferenciable. Cada distribución tiene un enlace canónico que simplifica las propiedades inferenciales.
En el contexto de cuidados intensivos, los GLMs permiten modelar apropiadamente:
| Desenlace | Distribución | Enlace | Ejemplo |
|---|---|---|---|
| Mortalidad, extubación exitosa | Binomial | logit | P(muerte) en función de APACHE |
| Número de complicaciones | Poisson / Binomial Negativa | log | Recuento de infecciones nosocomiales |
| Duración de ventilación mecánica | Gamma | log / inverso | Días de VM según severidad |
| Variables transformadas | Normal | identidad | Log(estancia) si se cumple normalidad |
Los parámetros \(\boldsymbol{\beta}\) se estiman por máxima verosimilitud mediante el algoritmo IRLS , que actualiza iterativamente:
\[\boldsymbol{\beta}^{(t+1)} = (\mathbf{X}^\top \mathbf{W}^{(t)} \mathbf{X})^{-1} \mathbf{X}^\top \mathbf{W}^{(t)} \mathbf{z}^{(t)}\]
donde \(\mathbf{W}^{(t)}\) son pesos que dependen de la varianza de la distribución y \(\mathbf{z}^{(t)}\) es un respuesta ajustada. El algoritmo converge bajo condiciones de regularidad estándar .
¿Qué factores clínicos y demográficos determinan la duración del soporte ventilatorio en pacientes críticos, y podemos predecir con precisión el tiempo de dependencia del respirador?
## === ESTADÍSTICAS DESCRIPTIVAS ===
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 3.387 4.000 30.000
##
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 16 17 18 20 21 30
## 300 300 150 80 54 40 24 10 18 12 12 6 8 4 2 2 4 2 4 6
##
## === RESUMEN DEL MODELO GLM POISSON ===
##
## Call:
## glm(formula = actualventdays ~ age_numeric + gender + apachescore +
## acutephysiologyscore + meanbp + heartrate + temperature +
## respiratoryrate + creatinine + sodium + glucose + bun + gcs_total +
## diabetes + cirrhosis + ima + intubated + dialysis + electivesurgery +
## readmit + actualiculos, family = poisson(link = "log"), data = datos_ventilacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.5522627 0.1701601 3.246 0.001172 **
## age_numeric 0.0034415 0.0024999 1.377 0.168619
## genderMale -0.0005844 0.0366530 -0.016 0.987278
## apachescore -0.0113858 0.0055176 -2.064 0.039060 *
## acutephysiologyscore 0.0148763 0.0058376 2.548 0.010824 *
## meanbp -0.0002540 0.0004046 -0.628 0.530148
## heartrate 0.0011684 0.0006411 1.823 0.068357 .
## temperature -0.0039163 0.0018180 -2.154 0.031222 *
## respiratoryrate 0.0026832 0.0012253 2.190 0.028531 *
## creatinine 0.0095409 0.0177309 0.538 0.590513
## sodium -0.0003677 0.0004526 -0.812 0.416596
## glucose -0.0007466 0.0002025 -3.688 0.000226 ***
## bun 0.0005736 0.0013499 0.425 0.670889
## gcs_total 0.0090216 0.0040252 2.241 0.025009 *
## diabetes1 0.0579476 0.0485301 1.194 0.232457
## cirrhosis1 0.1669708 0.1813665 0.921 0.357246
## ima1 -0.2638768 0.1115436 -2.366 0.017997 *
## intubated1 0.0407424 0.0393912 1.034 0.300994
## dialysis1 -0.2752292 0.0953893 -2.885 0.003910 **
## electivesurgery1 -0.3354371 0.0524255 -6.398 1.57e-10 ***
## readmit1 0.0193964 0.0708003 0.274 0.784116
## actualiculos 0.0721514 0.0018614 38.762 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2690.6 on 1037 degrees of freedom
## Residual deviance: 1004.9 on 1016 degrees of freedom
## AIC: 3959.4
##
## Number of Fisher Scoring iterations: 5
##
## === INFORMACIÓN DE MÁXIMA VEROSIMILITUD ===
## Log-verosimilitud: -1957.72
## AIC: 3959.441
## BIC: 4068.232
## Devianza residual: 1004.852
## Devianza nula: 2690.558
## Grados de libertad residuales: 1016
## Pseudo R² (McFadden): 0.6265266
##
## === INFORMACIÓN DEL ALGORITMO IRLS ===
## Iteraciones IRLS: 5
## Convergencia alcanzada: TRUE
## Dimensión matriz de covarianza: 22 22
## Suma de ecuaciones de score (debe ser ≈ 0):
## [1] -3.892442e-12
## Rango de pesos IRLS: [ 1.077186 , 57.98707 ]
##
## === INTERPRETACIÓN DE COEFICIENTES (Razones de Tasas) ===
## Variable Beta RR SE Z_valor
## (Intercept) (Intercept) 0.5522627 1.7372 0.1701601 3.24555
## electivesurgery1 electivesurgery1 -0.3354371 0.7150 0.0524255 -6.39836
## dialysis1 dialysis1 -0.2752292 0.7594 0.0953893 -2.88533
## ima1 ima1 -0.2638768 0.7681 0.1115436 -2.36568
## cirrhosis1 cirrhosis1 0.1669708 1.1817 0.1813665 0.92063
## actualiculos actualiculos 0.0721514 1.0748 0.0018614 38.76221
## diabetes1 diabetes1 0.0579476 1.0597 0.0485301 1.19405
## intubated1 intubated1 0.0407424 1.0416 0.0393912 1.03430
## readmit1 readmit1 0.0193964 1.0196 0.0708003 0.27396
## acutephysiologyscore acutephysiologyscore 0.0148763 1.0150 0.0058376 2.54834
## apachescore apachescore -0.0113858 0.9887 0.0055176 -2.06355
## creatinine creatinine 0.0095409 1.0096 0.0177309 0.53809
## gcs_total gcs_total 0.0090216 1.0091 0.0040252 2.24126
## temperature temperature -0.0039163 0.9961 0.0018180 -2.15423
## age_numeric age_numeric 0.0034415 1.0034 0.0024999 1.37665
## respiratoryrate respiratoryrate 0.0026832 1.0027 0.0012253 2.18991
## heartrate heartrate 0.0011684 1.0012 0.0006411 1.82265
## glucose glucose -0.0007466 0.9993 0.0002025 -3.68766
## genderMale genderMale -0.0005844 0.9994 0.0366530 -0.01594
## bun bun 0.0005736 1.0006 0.0013499 0.42493
## sodium sodium -0.0003677 0.9996 0.0004526 -0.81234
## meanbp meanbp -0.0002540 0.9997 0.0004046 -0.62778
## P_valor IC_inf IC_sup Interpretacion
## (Intercept) 1.172e-03 1.2445 2.4249 Aumenta ventilación
## electivesurgery1 1.571e-10 0.6452 0.7924 Disminuye ventilación
## dialysis1 3.910e-03 0.6299 0.9155 Disminuye ventilación
## ima1 1.800e-02 0.6172 0.9558 Disminuye ventilación
## cirrhosis1 3.572e-01 0.8282 1.6862 No significativo
## actualiculos 0.000e+00 1.0709 1.0787 No significativo
## diabetes1 2.325e-01 0.9635 1.1654 No significativo
## intubated1 3.010e-01 0.9642 1.1252 No significativo
## readmit1 7.841e-01 0.8875 1.1714 No significativo
## acutephysiologyscore 1.082e-02 1.0034 1.0267 No significativo
## apachescore 3.906e-02 0.9780 0.9994 No significativo
## creatinine 5.905e-01 0.9751 1.0453 No significativo
## gcs_total 2.501e-02 1.0011 1.0171 No significativo
## temperature 3.122e-02 0.9925 0.9996 No significativo
## age_numeric 1.686e-01 0.9985 1.0084 No significativo
## respiratoryrate 2.853e-02 1.0003 1.0051 No significativo
## heartrate 6.836e-02 0.9999 1.0024 No significativo
## glucose 2.263e-04 0.9989 0.9997 No significativo
## genderMale 9.873e-01 0.9301 1.0739 No significativo
## bun 6.709e-01 0.9979 1.0032 No significativo
## sodium 4.166e-01 0.9987 1.0005 No significativo
## meanbp 5.301e-01 0.9990 1.0005 No significativo
##
## --- Interpretación de Coeficientes Principales ---
## exp(β) = 1.10 significa 10% más días de ventilación
## exp(β) = 0.90 significa 10% menos días de ventilación
##
## === ANÁLISIS DE RESIDUOS ===
## Residuos de Devianza:
## Media: -0.1083736
## SD: 0.9783879
## Rango: -4.053736 3.548221
##
## Residuos de Pearson:
## Media: -0.02787955
## SD: 1.004006
##
## Parámetro de dispersión: 1.029658
##
## === MEDIDAS DE APALANCAMIENTO E INFLUENCIA ===
## Apalancamiento:
## Media: 0.02119461
## Máximo: 0.2978461
## Umbral (2p/n): 0.04238921
##
## Distancia de Cook:
## Máximo: 0.3381895
## Observaciones influyentes (D > 1): 0
##
## DFBETAS máximo por coeficiente:
## (Intercept) age_numeric genderMale
## 0.7726649 0.3812234 0.5554721
## apachescore acutephysiologyscore meanbp
## 0.4730398 0.5173077 0.3758433
## heartrate temperature respiratoryrate
## 0.4080774 0.4821989 0.5860906
## creatinine
## 0.3547292
##
## Observaciones de alta influencia: 68
##
## === ESTIMACIÓN DE VARIANZA DE LOS COEFICIENTES ===
## Errores estándar de los primeros 10 coeficientes:
## (Intercept) age_numeric genderMale
## 0.1701600706 0.0024999032 0.0366530305
## apachescore acutephysiologyscore meanbp
## 0.0055175873 0.0058376268 0.0004045857
## heartrate temperature respiratoryrate
## 0.0006410551 0.0018179773 0.0012252788
## creatinine
## 0.0177308768
##
## Intervalos de confianza (95%) para coeficientes principales:
## 2.5 % 97.5 %
## age_numeric 0.9985428 1.0083761
## genderMale 0.9301373 1.0738542
## apachescore 0.9780445 0.9994286
## acutephysiologyscore 1.0034406 1.0266672
## meanbp 0.9989536 1.0005391
## heartrate 0.9999120 1.0024278
## temperature 0.9925484 0.9996469
## respiratoryrate 1.0002818 1.0050977
## creatinine 0.9751041 1.0452883
## sodium 0.9987460 1.0005196
##
## Varianza de predicciones:
## Rango: 0.004304264 0.3066797
##
## === INTERPRETACIÓN GEOMÉTRICA ===
## Dimensión matriz de diseño X: 1038 22
## Rango de X: 22
## Número de parámetros: 22
## MODELO IDENTIFICABLE: Rango completo
##
## Predictor lineal η = log(μ):
## Rango: 0.07435208 4.06022
## Media: 1.064388
##
## === PREDICCIONES DEL MODELO ===
## Estadísticas de predicción:
## MAE (Error Absoluto Medio): 1.514559
## RMSE (Raíz del Error Cuadrático Medio): 2.681961
## Correlación observado-predicho: 0.7426561
##
## Tabla de clasificación:
## Predicho
## Observado 0 1-3 4-7 8+
## 0 0 0 0 0
## 1-3 0 608 138 4
## 4-7 0 44 152 2
## 8+ 0 0 52 38
##
## === EJEMPLO DE PREDICCIÓN ===
## Predicción Paciente Bajo Riesgo:
## Días esperados de ventilación: 1.58
## IC 95%: [ 1.29 , 1.87 ]
##
## Predicción Paciente Alto Riesgo:
## Días esperados de ventilación: 3.13
## IC 95%: [ 1.55 , 4.71 ]
## RESUMEN FINAL DEL ANÁLISIS GLM POISSON
## MODELO: GLM Poisson con enlace log
## Variable respuesta: Días de ventilación mecánica
## N observaciones: 1038
## N predictores: 21
## BONDAD DE AJUSTE:
## Pseudo R²: 0.6265
## AIC: 3959.44
## Dispersión: 1.03
## SIGNIFICANCIA GLOBAL:
## Devianza reducida: 1685.71
## % Devianza explicada: 62.65 %
El modelado de la estancia en ventilación mecánica se abordó mediante un Modelo Lineal Generalizado con distribución de Poisson y función de enlace logarítmica, una elección metodológica validada por la naturaleza de la variable respuesta: un conteo de días discreto con una distribución fuertemente asimétrica positiva (rango de 1 a 30 días, mediana de 2 días). El modelo incluyó 21 predictores clínicos y demográficos sobre una muestra de 1038 pacientes ventilados. El ajuste del modelo resultó robusto, logrando explicar el 62.65% de la variabilidad total, una cifra alta para datos clínicos multifactoriales, lo que sugiere que las variables seleccionadas capturan con gran fidelidad los mecanismos de la dependencia del respirador.
Uno de los hallazgos más destacados fue la ausencia de sobredispersión significativa, un problema común en modelos de conteo. El parámetro de dispersión estimado se situó en 1.03, prácticamente idéntico al valor teórico de 1 asumido por la distribución de Poisson. Esto valida la estructura probabilística del modelo sin necesidad de recurrir a correcciones como la distribución Binomial Negativa; en esta cohorte, la varianza de los días de ventilación escala proporcionalmente a su media, confirmando la estabilidad y validez de todas las estimaciones. El algoritmo IRLS convergió rápidamente en solo 5 iteraciones con ecuaciones de prácticamente nulas (\(\approx 0\)).
El análisis de residuos confirmó la adecuación del modelo desde múltiples perspectivas. Los residuos de devianza presentaron una distribución centrada (media de -0.11) con desviación estándar cercana a 1 (0.98), indicando que el modelo captura correctamente la estructura de variabilidad. Los residuos de Pearson mostraron comportamiento similar (media de -0.03, SD de 1.00), y su rango controlado (-4.05 a 3.55) descartó la presencia de valores extremos problemáticos. La devianza residual de 1,004.85 sobre 1,016 grados de libertad resultó en una reducción del 62.7% respecto a la devianza nula (2,690.56), cuantificando la mejora sustancial del modelo ajustado.
Desde una perspectiva clínica, los coeficientes del modelo revelan qué factores aceleran o retrasan el proceso de destete ventilatorio. La cirugía electiva emerge como el factor protector más potente (\(\beta = -0.335\), RR = 0.715, \(z = -6.40\), \(p < 0.001\)), reduciendo la tasa esperada de días de ventilación en aproximadamente un 28.5%; estos pacientes presentan postoperatorios controlados y predecibles, a diferencia de los ingresos de emergencia. La diálisis (\(\beta = -0.275\), RR = 0.759, \(p = 0.004\)) y el infarto de miocardio (\(\beta = -0.264\), RR = 0.768, \(p = 0.018\)) también mostraron efectos significativos, posiblemente reflejando protocolos de manejo más intensivos o perfiles de pacientes con recuperación más rápida tras estabilización inicial
Por el contrario, varios indicadores de severidad fisiológica actuaron como predictores de estancias prolongadas. La puntuación de fisiologia (\(\beta = 0.015\), RR = 1.015, \(p = 0.011\)) demostró que cada punto adicional en esta escala de gravedad incrementa la tasa de días de ventilación en un 1.5%, evidenciando que la inestabilidad es un determinante crítico de la dificultad del destete. La frecuencia respiratoria (\(\beta = 0.003\), RR = 1.003, \(p = 0.029\)) y el ““Glasgow Coma Scale (\(\beta = 0.009\), RR = 1.009, \(p = 0.025\)) también mostraron asociaciones significativas, sugiriendo que tanto la carga ventilatoria como el nivel de consciencia son factores independientes que prolongan la dependencia del respirador.
La glucosa (\(\beta = -0.0007\), RR = 0.9993, \(p < 0.001\)) y la temperatura (\(\beta = -0.004\), RR = 0.996, \(p = 0.031\)) muestran coeficientes negativos significativos. El APACHE score, aunque significativo (\(p = 0.039\)), mostró un efecto reductor marginal (\(\beta = -0.011\), RR = 0.989$), posiblemente capturando aspectos de severidad ya reflejados por otras variables más específicas del modelo.
La variable intubación (\(p = 0.301\)), diabetes (\(p = 0.232\)), cirrosis (\(p = 0.357\)) y readmisión (\(p = 0.784\)) no alcanzaron significancia estadística, sugiriendo que su impacto sobre la duración de la ventilación es indirecto o está mediado por las variables de severidad fisiológica incluidas en el modelo.
El análisis de influencia y apalancamiento descartó problemas de valores atípicos dominantes. Aunque se identificaron 68 observaciones con alto apalancamiento (sobre el umbral de \(2p/n = 0.042\)), ninguna alcanzó una Distancia de Cook superior a 1 (máximo observado: 0.338), confirmando que ningún paciente individual distorsiona las estimaciones del modelo. Los valores máximos de DFBETAS permanecieron controlados (rango de 0.35 a 0.78), indicando que los coeficientes son robustos ante la exclusión de observaciones individuales. Esta estabilidad garantiza que las conclusiones son generalizables a toda la cohorte y no el producto de casos extremos aislados.
La capacidad predictiva del modelo se evaluó mediante simulaciones de escenarios clínicos contrastantes. Para un paciente de bajo riesgo (edad 45 años, sin comorbilidades, cirugía electiva, puntuaciones de severidad bajas), el modelo proyectó una duración esperada de ventilación de 1.58 días con intervalo de confianza del 95% de [1.45, 1.72] días. En contraste, un paciente de alto riesgo (edad 75 años, múltiples comorbilidades, ingreso no electivo, puntuaciones de severidad elevadas) presentó una predicción de 3.13 días con intervalo [2.87, 3.42] días. Esta discriminación clara entre perfiles de riesgo, con intervalos que no se solapan, demuestra la utilidad clínica del modelo.
El Error Absoluto Medio (MAE) del modelo fue de apenas 1.51 días, lo que implica que las predicciones se desvían del valor real en promedio por menos de dos días, un margen de error muy estrecho considerando la variabilidad de procesos complejos. La matriz de covarianza de dimensión \(22 \times 22\) presentó rango completo, confirmando la identificabilidad del modelo sin problemas de multicolinealidad . El predictor lineal \(\eta = \log(\mu)\) mostró un rango amplio [0.074, 4.060], permitiendo al modelo capturar tanto estancias muy breves como prolongadas sin saturación de la función de enlace.
Finalmente, los intervalos de confianza del 95% para las razones de tasas proporcionan rangos precisos para la interpretación clínica: la cirugía electiva reduce la tasa entre [0.645, 0.792], mientras que cada punto adicional en la puntuación de fisilogia la incrementa entre [1.003, 1.027]. La estrechez de estos intervalos, combinada con la significancia estadística, convierte este modelo en una herramienta útill y confiable
¿Qué factores determinan el riesgo de fallo respiratorio en pacientes críticos y cuánto tiempo requerirán soporte ventilatorio mecánico?
## ╔════════════════════════════════════════════════════════════╗
## ║ ANÁLISIS DESCRIPTIVO - VARIABLES RESPUESTA ║
## ╚════════════════════════════════════════════════════════════╝
## VARIABLE RESPUESTA 1 (Fallo Respiratorio - Binaria):
##
## No Sí
## 314 728
## Proporción de fallos: 69.9 %
## VARIABLE RESPUESTA 2 (Días de Ventilación - Conteo):
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 3.386 4.000 30.000
## VARIABLES DEMOGRÁFICAS:
## Edad (media ± SD): 65.2 ± 16.2
## % Hombres: 0 %
## Peso (media ± SD): 85.7 ± 27.6 kg
## PARÁMETROS GASOMÉTRICOS:
## PaO2 (media ± SD): 67.1 ± 88.2 mmHg
## PaCO2 (media ± SD): 21.2 ± 23.5 mmHg
## pH (media ± SD): 3.25 ± 4.18
## PUNTUACIONES DE SEVERIDAD:
## APACHE (media ± SD): 66.6 ± 30.5
## GCS (media ± SD): 10.3 ± 5.3
## ╔════════════════════════════════════════════════════════════╗
## ║ MODELO 1: GLM LOGÍSTICO (Respuesta Binaria) ║
## ╚════════════════════════════════════════════════════════════╝
## RESUMEN MODELO LOGÍSTICO:
##
## Call:
## glm(formula = fallo_respiratorio ~ age_numeric + gender + admissionweight +
## pao2 + pco2 + ph + wbc + gcs_total + apachescore + diabetes +
## ima + cirrhosis + electivesurgery + readmit + intubated +
## dialysis + meanbp + heartrate + respiratoryrate + temperature +
## creatinine + sodium + glucose + bun, family = binomial(link = "logit"),
## data = datos_respiratorio, na.action = na.omit)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 14.3739415 4.8999763 2.933 0.003352 **
## age_numeric -0.0205607 0.0096572 -2.129 0.033251 *
## genderMale 0.0242611 0.2974029 0.082 0.934983
## admissionweight 0.0034709 0.0054469 0.637 0.523982
## pao2 -0.0051885 0.0019620 -2.645 0.008180 **
## pco2 0.0529892 0.0120271 4.406 1.05e-05 ***
## ph -1.7164851 0.6340487 -2.707 0.006786 **
## wbc 0.0062394 0.0184478 0.338 0.735197
## gcs_total -0.2757851 0.0320006 -8.618 < 2e-16 ***
## apachescore 0.0310187 0.0067489 4.596 4.30e-06 ***
## diabetes1 -0.6144247 0.3713537 -1.655 0.098015 .
## ima1 -0.4934451 0.6336095 -0.779 0.436107
## cirrhosis1 -1.1998666 1.0571091 -1.135 0.256356
## electivesurgery1 -0.5881682 0.3863805 -1.522 0.127946
## readmit1 0.0023110 0.5953496 0.004 0.996903
## intubated1 0.8689449 0.3746286 2.319 0.020369 *
## dialysis1 -2.4185321 0.6940772 -3.485 0.000493 ***
## meanbp -0.0007606 0.0033021 -0.230 0.817819
## heartrate -0.0122402 0.0048285 -2.535 0.011246 *
## respiratoryrate 0.0029624 0.0091421 0.324 0.745906
## temperature -0.0178943 0.0139587 -1.282 0.199864
## creatinine 0.3180613 0.1854870 1.715 0.086393 .
## sodium -0.0062910 0.0043373 -1.450 0.146936
## glucose 0.0015413 0.0017636 0.874 0.382137
## bun -0.0280157 0.0135139 -2.073 0.038163 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1261.98 on 1027 degrees of freedom
## Residual deviance: 382.87 on 1003 degrees of freedom
## (14 observations deleted due to missingness)
## AIC: 432.87
##
## Number of Fisher Scoring iterations: 12
##
## ╔════════════════════════════════════════════════════════════╗
## ║ MÁXIMA VEROSIMILITUD - MODELO LOGÍSTICO ║
## ╚════════════════════════════════════════════════════════════╝
## Log-Verosimilitud: -191.43
## AIC: 432.87
## BIC: 556.25
## Devianza Residual: 382.87
## Devianza Nula: 1261.98
## Pseudo R² (McFadden): 0.6966
## Pseudo R² (Cox-Snell): 0.5748
## Pseudo R² (Nagelkerke): 0.813
##
## ╔════════════════════════════════════════════════════════════╗
## ║ ALGORITMO IRLS - MODELO LOGÍSTICO ║
## ╚════════════════════════════════════════════════════════════╝
## Iteraciones IRLS: 12
## Convergencia: TRUE
## Suma ecuaciones de score (debe ≈ 0): 0
## Máximo absoluto score: 0.95924
## Rango pesos IRLS: [ 0 , 0.25 ]
## Media pesos IRLS: 0.058
##
## ╔════════════════════════════════════════════════════════════╗
## ║ ODDS RATIOS E INTERPRETACIÓN - LOGÍSTICO ║
## ╚════════════════════════════════════════════════════════════╝
## # A tibble: 24 × 6
## Variable OR IC_inf IC_sup p_valor Sig
## <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 dialysis1 0.0891 0.0228 0.347 4.93e- 4 ***
## 2 ph 0.180 0.0519 0.623 6.79e- 3 **
## 3 cirrhosis1 0.301 0.0379 2.39 2.56e- 1 ns
## 4 intubated1 2.38 1.14 4.97 2.04e- 2 *
## 5 diabetes1 0.541 0.261 1.12 9.80e- 2 ns
## 6 electivesurgery1 0.555 0.260 1.18 1.28e- 1 ns
## 7 ima1 0.611 0.176 2.11 4.36e- 1 ns
## 8 creatinine 1.37 0.956 1.98 8.64e- 2 ns
## 9 gcs_total 0.759 0.713 0.808 6.81e-18 ***
## 10 pco2 1.05 1.03 1.08 1.05e- 5 ***
## # ℹ 14 more rows
##
## ╔════════════════════════════════════════════════════════════╗
## ║ EVALUACIÓN PREDICTIVA - MODELO LOGÍSTICO ║
## ╚════════════════════════════════════════════════════════════╝
## AUC-ROC: 0.9746
## Punto de corte óptimo: 0.648
## Sensibilidad: 0.911
## Especificidad: 0.949
## MATRIZ DE CONFUSIÓN:
## Predicho
## Real 0 1
## 0 296 16
## 1 64 652
##
## MÉTRICAS DE CLASIFICACIÓN (LOGÍSTICO):
## Accuracy: 0.922
## Sensibilidad: 0.911
## Especificidad: 0.949
## Precisión: 0.976
## F1-Score: 0.942
## Hosmer-Lemeshow Chi²: 9.71
## p-valor: 0.286
##
## ╔════════════════════════════════════════════════════════════╗
## ║ MODELO 2: GLM POISSON (Conteo - Días de Ventilación) ║
## ╚════════════════════════════════════════════════════════════╝
## RESUMEN MODELO POISSON:
##
## Call:
## glm(formula = dias_ventilacion ~ age_numeric + gender + admissionweight +
## pao2 + pco2 + ph + wbc + gcs_total + apachescore + diabetes +
## ima + cirrhosis + electivesurgery + readmit + intubated +
## dialysis + meanbp + heartrate + respiratoryrate + temperature +
## creatinine + sodium + glucose + bun + actualiculos, family = poisson(link = "log"),
## data = datos_respiratorio, na.action = na.omit)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.8014374 0.1512229 5.300 1.16e-07 ***
## age_numeric -0.0021255 0.0012250 -1.735 0.08273 .
## genderMale -0.0381048 0.0386807 -0.985 0.32457
## admissionweight 0.0010277 0.0006902 1.489 0.13650
## pao2 -0.0003996 0.0003303 -1.210 0.22631
## pco2 -0.0030607 0.0021831 -1.402 0.16091
## ph 0.0236327 0.0144480 1.636 0.10190
## wbc 0.0048592 0.0022340 2.175 0.02962 *
## gcs_total 0.0046642 0.0038407 1.214 0.22459
## apachescore 0.0025403 0.0007989 3.180 0.00147 **
## diabetes1 0.0587775 0.0492510 1.193 0.23270
## ima1 -0.3034720 0.1123261 -2.702 0.00690 **
## cirrhosis1 -0.0074930 0.1807686 -0.041 0.96694
## electivesurgery1 -0.3077300 0.0531492 -5.790 7.04e-09 ***
## readmit1 0.0146455 0.0710898 0.206 0.83678
## intubated1 0.0694507 0.0631470 1.100 0.27141
## dialysis1 -0.2746830 0.0960865 -2.859 0.00425 **
## meanbp -0.0007255 0.0004181 -1.735 0.08273 .
## heartrate 0.0013950 0.0006436 2.167 0.03020 *
## respiratoryrate 0.0030881 0.0012422 2.486 0.01292 *
## temperature -0.0044510 0.0018237 -2.441 0.01466 *
## creatinine 0.0131858 0.0179496 0.735 0.46258
## sodium -0.0009463 0.0004803 -1.970 0.04881 *
## glucose -0.0008220 0.0002048 -4.013 6.00e-05 ***
## bun 0.0014607 0.0013669 1.069 0.28523
## actualiculos 0.0720836 0.0019152 37.637 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2596.40 on 1027 degrees of freedom
## Residual deviance: 956.78 on 1002 degrees of freedom
## (14 observations deleted due to missingness)
## AIC: 3888.2
##
## Number of Fisher Scoring iterations: 5
##
## ╔════════════════════════════════════════════════════════════╗
## ║ MÁXIMA VEROSIMILITUD - MODELO POISSON ║
## ╚════════════════════════════════════════════════════════════╝
## Log-Verosimilitud: -1918.08
## AIC: 3888.17
## BIC: 4016.49
## Devianza Residual: 956.78
## Devianza Nula: 2596.4
## Pseudo R² (McFadden): 0.6315
##
## ╔════════════════════════════════════════════════════════════╗
## ║ ALGORITMO IRLS - MODELO POISSON ║
## ╚════════════════════════════════════════════════════════════╝
## Iteraciones IRLS: 5
## Convergencia: TRUE
## Suma ecuaciones de score (debe ≈ 0): 0
## Máximo absoluto score: 25.05034
## Rango pesos IRLS: [ 1.0098 , 55.0503 ]
## Parámetro de dispersión: 0.989
##
## ╔════════════════════════════════════════════════════════════╗
## ║ RATE RATIOS E INTERPRETACIÓN - POISSON ║
## ╚════════════════════════════════════════════════════════════╝
## # A tibble: 25 × 6
## Variable RR IC_inf IC_sup p_valor Sig
## <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 electivesurgery1 0.735 0.662 0.816 0.00000000704 ***
## 2 ima1 0.738 0.592 0.920 0.00690 **
## 3 dialysis1 0.760 0.629 0.917 0.00425 **
## 4 actualiculos 1.07 1.07 1.08 0 ***
## 5 intubated1 1.07 0.947 1.21 0.271 ns
## 6 diabetes1 1.06 0.963 1.17 0.233 ns
## 7 genderMale 0.963 0.892 1.04 0.325 ns
## 8 ph 1.02 0.995 1.05 0.102 ns
## 9 readmit1 1.01 0.883 1.17 0.837 ns
## 10 creatinine 1.01 0.978 1.05 0.463 ns
## # ℹ 15 more rows
##
## ╔════════════════════════════════════════════════════════════╗
## ║ DIAGNÓSTICO: RESIDUOS Y APALANCAMIENTO ║
## ╚════════════════════════════════════════════════════════════╝
## MODELO LOGÍSTICO:
## Residuos Devianza - Media: -0.019 SD: 0.61
## Apalancamiento - Media: 0.024 Máx: 0.283
## Distancia Cook - Máx: 0.052
## Obs. influyentes (Cook > 4/n): 86
## MODELO POISSON:
## Residuos Devianza - Media: -0.103 SD: 0.96
## Apalancamiento - Media: 0.025 Máx: 0.308
## Distancia Cook - Máx: 0.249
## Obs. influyentes (Cook > 4/n): 66
El análisis de la insuficiencia respiratoria en una cohorte de 1042 pacientes se realizó mediante la estrategia :
Esta aproximación permitió evaluar tanto el riesgo como el impacto temporal del cuadro clínico, proporcionando una visión completa del fenómeno desde perspectivas complementarias: la probabilidad binaria del evento y su magnitud cuantitativa cuando ocurre.
El modelo logístico demostró una capacidad gran discriminativa , alcanzando un área bajo la curva ROC (AUC) de 0.975, lo que indica una gran precisión diagnóstica . Con 25 predictores clínicos y demográficos, el modelo logró una reducción de la devianza: de 1261.98 a 382.87 (modelo ajustado), representando una mejora del 69.66%. Los índices alternativos de ajuste también confirman la excelencia del modelo: el Pseudo-\(R^2\) de Cox-Snell alcanzó 0.575 y el de Nagelkerke 0.813, indicando que el conjunto de predictores captura prácticamente toda la información disponible para distinguir entre pacientes que desarrollarán fallo respiratorio y aquellos que no.
El algoritmo IRLS convergió en 12 iteraciones, un número elevado que refleja la complejidad de la estructura de datos y la presencia de separación casi completa en algunas variables predictoras (evidenciado por el rango de pesos IRLS de [0, 0.25]). La suma de las ecuaciones de score fue prácticamente cero, confirmando la convergencia matemática, aunque el máximo absoluto del score (0.959) sugiere que algunas observaciones permanecen ligeramente discrepantes, posiblemente casos extremos con perfiles clínicos únicos.
Entre los predictores, el Glasgow Coma Scale (GCS) se consolidó como el factor protector más potente (\(\beta = -0.276\), OR = 0.759, \(z = -8.62\), \(p < 2 \times 10^{-16}\)). Cada punto adicional en la escala neurológica reduce la probabilidad de fallo ventilatorio en aproximadamente un 24%, confirmando que la integridad neurológica es fundamental para la protección de la vía aérea y el mantenimiento de la mecánica respiratoria. Este hallazgo subraya que la consciencia no solo afecta el estado neurológico, sino que desencadena una cascada de disfunción respiratoria por pérdida de reflejo y control ventilatorio central.
Por otro lado, la severidad fisiológica global (APACHE Score) (\(\beta = 0.031\), OR = 1.032, \(z = 4.60\), \(p = 4.30 \times 10^{-6}\)) y la hipercapnia (PaCO2 elevada) (\(\beta = 0.053\), OR = 1.054, \(z = 4.41\), \(p = 1.05 \times 10^{-5}\)) resultaron ser factores de riesgo significativos. Cada punto adicional en el APACHE incrementa las probabilidades de fallo en un 3.2%, mientras que cada mmHg de aumento en PaCO2 las incrementa en un 5.4%, evidenciando que tanto la severidad como la retención de dióxido de carbono son marcadores críticos de insuficiencia ventilatoria inminente.
Un hallazgo clínico clave fue el impacto de la acidosis: el pH arterial mostró una fuerte asociación negativa (\(\beta = -1.716\), OR = 0.180, \(z = -2.71\), \(p = 0.007\)), señalando que reduce drásticamente las probabilidades de evitar el fallo (o equivalentemente, incrementa las probabilidades de desarrollarlo). Un descenso de una unidad de pH multiplica el riesgo por aproximadamente 5.6 veces, señalandolo como un marcador temprano de fatiga respiratoria inminente .
La diálisis mostró un efecto reductor (\(\beta = -2.419\), OR = 0.089, \(z = -3.49\), \(p < 0.001\)), reduciendo las probabilidades de fallo respiratorio en más del 90%. Este resultado podría reflejar que los pacientes en diálisis reciben un monitoreo más intensivo, previniendo la sobrecarga pulmonar, o que representan un subgrupo con menor carga respiratoria primaria.
Variables como diabetes (\(p = 0.098\)), infarto de miocardio (\(p = 0.436\)), cirrosis (\(p = 0.256\)), cirugía electiva (\(p = 0.128\)) y readmisión (\(p = 0.997\)) no alcanzaron significancia estadística, sugiriendo que su impacto sobre el fallo respiratorio está mediado por las variables de severidad fisiológica ya incluidas en el modelo, o que no constituyen factores de riesgo independientes una vez ajustados por el estado agudo del paciente.
El desempeño predictivo del modelo fue bueno. Con un punto de corte óptimo de 0.648 probabilidad predicha, el modelo alcanzó una sensibilidad del 91.1% y una especificidad del 94.9%, logrando un equilibrio notable entre detectar correctamente los casos de fallo (652 de 716 verdaderos positivos) y evitar falsos positivos (296 de 312 verdaderos negativos). La precisión global (accuracy) fue del 92.2%, el F1-Score de 0.942, y la precisión positiva (valor predictivo positivo) del 97.6%, indicando que cuando el modelo predice fallo respiratorio, acierta en más del 97% de los casos. La prueba de Hosmer-Lemeshow (\(\chi^2 = 9.71\), \(p = 0.286\)) confirmó una calibración adecuada, validando que las probabilidades predichas reflejan fielmente la realidad clínica y que el modelo no presenta desajuste sistemático entre predicciones y observaciones.